1. 程式人生 > >使用pandas模組從資料庫讀取資料(轉)

使用pandas模組從資料庫讀取資料(轉)

轉自:http://www.tuicool.com/articles/ZVzEz2N

Python中用Pandas進行資料分析,最常用的就是Dataframe資料結構,之前寫過一篇文章介紹Pandas的基本用法,後來有些朋友問Pandas怎麼從資料庫中讀取資料,怎麼從檔案中讀取資料之類的問題,因此單獨開篇文章介紹Pandas如何讀取資料到Dataframe。

1. Pandas讀取Mysql資料要讀取Mysql中的資料,首先要安裝Mysqldb包。假設我資料庫安裝在本地,使用者名稱位myusername,密碼為mypassword,要讀取mydb資料庫中的資料,那麼對應的程式碼如下:

import pandas as pd
import MySQLdb
mysql_cn= MySQLdb.connect(host='localhost', port=3306,user='myusername', passwd='mypassword', db='mydb')
df = pd.read_sql('select * from test;', con=mysql_cn)    
mysql_cn.close()

上面的程式碼讀取了test表中所有的資料到df中,而df的資料結構為Dataframe。

2. Pandas讀取csv檔案資料Pandas讀取csv檔案中的資料要簡單的多,不用額外安裝程式包,假設我們要讀取test.csv中的資料, 對應的程式碼如下:

df = pd.read_csv(loggerfile, header=None, sep=',')

header=None表示沒有頭部,sep=’,’表示欄位之間的分隔符為逗號。