1. 程式人生 > >Pandas DataFrame常用操作

Pandas DataFrame常用操作

  • DataFrame.median() 取中位數
  • DataFrame.loc[行標籤,列標籤] 選取資料,第一個值為行標籤,第二值為列標籤
  • DataFrame.iloc[行位置,列位置]
  • pandas.read_csv()
  • DataFrame.to_csv()
  • DataFrame.head()
  • DataFrame.tail()
  • DataFrame.info()
  • DataFrame.describe() 對各列的進行描述,如總數,平均值,標準差,最大最小值等。
  • pandas.cut()
  • pandas.qcut() 基於分位數的離散化函式。基於秩或基於樣本分位數將變數離散化為等大小桶。
  • pandas.Index.delete() 返回一個新的,刪除掉指定位置的index
  • DataFrame.groupby()
  • mean()
  • sort_values() 排序操作
  • drop()
  • DataFrame.mode() 眾數,返回頻數最高的那(幾)個
  • DataFrame.dropna() 丟棄nan相應的行(看引數)
  • DataFrame.fillna() 用指定值填充nan值
  • DataFrame.std() 返回樣本的標準差
  • pandas.isnull() 檢測缺失值
  • DataFrame.isnull() 返回同樣長度的object,值為boolean,類似還有notnull()
  • DataFrame.sum() 返回所請求axis對應值的總和
  • pandas.date_range() 返回一個時間索引
  • DataFrame.apply() 沿相應軸應用函式
  • Series.value_counts() 返回不同資料的計數值
  • DataFrame.aggregate()
  • DataFrame.max() 返回最大值
  • DataFrame.reset_index() 重新設定index,引數drop = True時會丟棄原來的索引,設定新的從0開始的索引。常與groupby()一起用

  • numpy.zeros()

  • numpy.unique() 返回數組裡唯一的值組成的陣列

seaborn

  • color_palette() 建立調色盤

axis

使用0值表示沿著每一列或行標籤\索引值向下執行方法 
使用1值表示沿著每一行或者列標籤模向執行對應的方法

Python round() 函式 返回浮點數x的四捨五入值 
round( x [, n] ) 
x – 浮點數。 
n – 精確度。

type();

confidence score