1. 程式人生 > >python資料探勘資料分析pandas的介紹及簡單例子

python資料探勘資料分析pandas的介紹及簡單例子

pandas是python下最有力的資料探勘和資料分析的工具之一,支援類似於SQL的資料庫的增、刪、查、改,並且帶有豐富的資料處理函式,支援時間序列的分析功能,支援靈活處理缺失資料。pandas基本的資料結構是Series和DataFrame,series就是序列,類似於一維陣列,dataframe相當於一張二維的表格,類似於二維陣列,它的每一列都相當於一個series,為了定位series中的元素,pandas提供了index物件,每個series都會帶有一個對應的index,用來標記不同的元素,index的內容不一定是數字,也可以是字母、中文等,類似於SQL的主鍵,類似的,dataframe相當於帶有多個同樣的index的series的組合(本質上是series的容器),每個series都帶有唯一的表頭,用來標識不同的series。

import pandas as pd
s = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
d = pd.DataFrame([[1, 2, 3], [4, 5, 6]], columns=['a', 'b', 'c'])
d2 = pd.DataFrame(s)
d.head()
d.describe()
print(d)
print(d2)

#pd.read_excel('data.xls')
#pd.read_csv('data.csv', encoding='utf-8')