python筆記6:資料處理之匯入資料
#資料一般儲存在檔案(csv、txt、excel)和資料庫中
#1. 匯入csv檔案(第一行是列名)
from pandas import read_csv
#檔案的編碼格式也應該是 utf-8 才行,否則報錯
df = read_csv(
'D:/python/workspace/pythonStudy/jysj.csv',
encoding = 'utf-8'
)
#2. 匯入文字檔案(比csv檔案自由,沒有規定第一行必須是列名)
from pandas import read_table
#沒匯入有列名的txt檔案(預設會把第一行資料當作列名,為了避免,我們應該指定列名):
df = read_table(
'D:/python/workspace/pythonStudy/jysjWithoutColumnName.txt',
names=['交易型別','出賣人名稱','出賣人證件型別','出賣人證件號碼','買受人名稱','買受人證件型別','買受人證件號碼','房屋坐落','層次','房屋用途','房屋結構','建築面積',"建築年代","交易額","交易時間"],
sep=',' #表示txt中的資料是以逗號隔開的(不加這一句會造成把所有的資料當成一列匯入進來)
)
#匯入有列名的txt檔案
df = read_table(
'D:/python/workspace/pythonStudy/jysjWithColumnName.txt',
names=['交易型別','出賣人名稱','出賣人證件型別','出賣人證件號碼','買受人名稱','買受人證件型別','買受人證件號碼','房屋坐落','層次','房屋用途','房屋結構','建築面積',"建築年代","交易額","交易時間"],
sep=','
)
#3. 匯入excel檔案
#語法:read_excel(fileName,sheetName,names)
from pandas import read_excel
df = read_excel(
'D:/python/workspace/pythonStudy/jysj.xls',
sheetname='吉木薩爾縣近三年房屋交易資訊'
)
#4. 解決檔名包含中文的問題:
#加上engine引數即可:
df = read_excel(
'D:/python/workspace/pythonStudy/中文檔名.xls',
sheetname='吉木薩爾縣近三年房屋交易資訊',
#engine='python'
)