1. 程式人生 > >pandas 中對axis=0,axis=1的理解,對應pandas中drop的用法

pandas 中對axis=0,axis=1的理解,對應pandas中drop的用法

Stackoverflow.com是程式設計師的好去處,本公眾號將以pandas為主題,開始一個系列,爭取做到每週一篇,翻譯並幫助pandas學習者一起理解一些有代表性的案例。今天的主題就是Pandas與Numpy中一個非常重要的引數:axis.(軸)

Stackoverflow問題如下:

python中的axis究竟是如何定義的呢?他們究竟代表是DataFrame的行還是列?考慮以下程式碼:

  1. >>>df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], \
  2. columns=["col1", "col2", "col3"
    , "col4"])
  3. >>>df
  4. col1 col2 col3 col4
  5. 0 1 1 1 1
  6. 1 2 2 2 2
  7. 2 3 3 3 3

如果我們呼叫df.mean(axis=1),我們將得到按行計算的均值

  1. >>> df.mean(axis=1)
  2. 0 1
  3. 1 2
  4. 2 3

然而,如果我們呼叫 df.drop((name, axis=1),我們實際上刪掉了一列,而不是一行:

  1. >>> df.drop("col4", axis=1
    )
  2. col1 col2 col3
  3. 0 1 1 1
  4. 1 2 2 2
  5. 2 3 3 3

Can someone help me understand what is meant by an "axis" in pandas/numpy/scipy? 有人能幫我理解一下,在pandas、numpy、scipy三都當中axis引數的真實含義嗎?

投票最高的答案揭示了問題的本質:

其實問題理解axis有問題,df.mean其實是在每一行上取所有列的均值,而不是保留每一列的均值。也許簡單的來記就是axis=0代表往跨行(down),而axis=1代表跨列(across)

,作為方法動作的副詞(譯者注)

換句話說:

  • 使用0值表示沿著每一列或行標籤\索引值向下執行方法
  • 使用1值表示沿著每一行或者列標籤模向執行對應的方法

下圖代表在DataFrame當中axis為0和1時分別代表的含義:

axis引數作用方向圖示

另外,記住,Pandas保持了Numpy對關鍵字axis的用法,用法在Numpy庫的詞彙表當中有過解釋:

軸用來為超過一維的陣列定義的屬性,二維資料擁有兩個軸:第0軸沿著行的垂直往下,第1軸沿著列的方向水平延伸。

所以問題當中第一個列子 df.mean(axis=1)代表沿著列水平方向計算均值,而第二個列子df.drop(name, axis=1) 代表將name對應的列標籤(們)沿著水平的方向依次刪掉。