1. 程式人生 > >pandas的基本用法,持續更新

pandas的基本用法,持續更新

import pandas as pd     

dataframe=pd.read(path)

1,n_rows =dataframe.head(n)     #獲取前n行資料,返回的依舊是個

2,DataFrame column_names = dataframe.columns     #獲取所有的列名

3,dimensions = dataframe.shape     #獲取資料的shape

4,   line=dataframe.loc[i][j]     #讀取第i行,第j列資料

        series=dataframe.loc[n]     #讀取第n列

        line=dataframe.loc[i:j]         #  read   i  colum th  to   j colum th

5,     len(data_frame) # 是data_frame的行數 

        len(data_frame.loc[0]) #是data_frame的列數

6,      df.head() #預設前10行資料

         df.tail() #預設後10 行資料

7,     df.fillna(value=0)      #   用數字0填充空值

8,      df['city'].drop_duplicates(keep='last')   #刪除先出現的重複值

         df['city'].replace('sh', 'shanghai')

9,      dataframe.sort_values(by=['age'])     #按照特定列的值排序

10,