1. 程式人生 > >python中pandas的使用方法

python中pandas的使用方法

import numpy as np
import pandas as pd
datas = pd.date_range('20140729', periods=6)
# 先建立一個時間索引,所謂的索引(index)就是每一行資料的id,可以標識每一行的唯一值
print datas
# 為了快速入門,我們看一下如何建立一個6X4的資料:randn函式用於建立隨機數,引數表示行數和列數,dates是上一步建立的索引列
df = pd.DataFrame(np.random.randn(6, 4), index=datas, columns=list('ABCD'))
print df
# 我們還可以使用字典來建立資料框,例如建立一個列名為A的資料框,索引是自動建立的整數
df2 = pd.DataFrame({'A': np.random.randn(6), })
print df2
# 這又是一個字典建立DataFrame的例子
df2 = pd.DataFrame({'A': pd.Timestamp('20140729'), 'B': pd.Series(1), })
print df2
# 假如字典內的資料長度不同,以最長的資料為準,比如B列有4行:
df2 = pd.DataFrame({'A': pd.Timestamp('20140729'), 'B': pd.Series(1, index=list(range(4))), })
print df2
# 可以使用dtypes來檢視各行的資料格式
print df2.dtypes
# 接著看一下如何檢視資料框中的資料,看一下所有的資料
print df
# 使用head檢視前幾行資料(預設是前5行),不過你可以指定前幾行
print df.head()
# 檢視前三行資料
print df.head(3)
# 使用tail檢視後2行資料
print df.tail(2)
# 檢視資料框的索引
print df.index
# 檢視列名用columns
print df.columns
# 檢視資料值,用values
print df.values
# 檢視描述性統計,用describe
print df.describe()
# 使用type看一下輸出的描述性統計是什麼樣的資料型別——DataFrame資料
print type(df.describe())
# 使用T來轉置資料,也就是行列轉換
print df.T
# 對資料進行排序,用到了sort,引數可以指定根據哪一列資料進行排序。
print df.sort(columns='C')