pandas 中對axis=0,axis=1的理解,對應pandas中drop的用法
Stackoverflow.com是程式設計師的好去處,本公眾號將以pandas為主題,開始一個系列,爭取做到每週一篇,翻譯並幫助pandas學習者一起理解一些有代表性的案例。今天的主題就是Pandas與Numpy中一個非常重要的引數:axis.(軸)
Stackoverflow問題如下:
python中的axis究竟是如何定義的呢?他們究竟代表是DataFrame的行還是列?考慮以下程式碼:
- >>>df = pd.DataFrame([[1, 1, 1, 1], [2, 2, 2, 2], [3, 3, 3, 3]], \
- columns=["col1", "col2", "col3"
, "col4"]) - >>>df
- col1 col2 col3 col4
- 0 1 1 1 1
- 1 2 2 2 2
- 2 3 3 3 3
如果我們呼叫df.mean(axis=1),我們將得到按行計算的均值
- >>> df.mean(axis=1)
- 0 1
- 1 2
- 2 3
然而,如果我們呼叫 df.drop((name, axis=1),我們實際上刪掉了一列,而不是一行:
- >>> df.drop("col4", axis=1
) - col1 col2 col3
- 0 1 1 1
- 1 2 2 2
- 2 3 3 3
Can someone help me understand what is meant by an "axis" in pandas/numpy/scipy? 有人能幫我理解一下,在pandas、numpy、scipy三都當中axis引數的真實含義嗎?
投票最高的答案揭示了問題的本質:
其實問題理解axis有問題,df.mean其實是在每一行上取所有列的均值,而不是保留每一列的均值。也許簡單的來記就是axis=0代表往跨行(down),而axis=1代表跨列(across)
換句話說:
- 使用0值表示沿著每一列或行標籤\索引值向下執行方法
- 使用1值表示沿著每一行或者列標籤模向執行對應的方法
下圖代表在DataFrame當中axis為0和1時分別代表的含義:
axis引數作用方向圖示另外,記住,Pandas保持了Numpy對關鍵字axis的用法,用法在Numpy庫的詞彙表當中有過解釋:
軸用來為超過一維的陣列定義的屬性,二維資料擁有兩個軸:第0軸沿著行的垂直往下,第1軸沿著列的方向水平延伸。
所以問題當中第一個列子 df.mean(axis=1)代表沿著列水平方向計算均值,而第二個列子df.drop(name, axis=1) 代表將name對應的列標籤(們)沿著水平的方向依次刪掉。