1. 程式人生 > >python筆記6:資料處理之匯入資料

python筆記6:資料處理之匯入資料

# -*- coding: utf-8 -*-
#資料一般儲存在檔案(csv、txt、excel)和資料庫中

#1. 匯入csv檔案(第一行是列名)

from pandas import read_csv

#檔案的編碼格式也應該是 utf-8 才行,否則報錯
df = read_csv(
              'D:/python/workspace/pythonStudy/jysj.csv',
              encoding = 'utf-8'
              )

#2. 匯入文字檔案(比csv檔案自由,沒有規定第一行必須是列名)

from pandas import read_table

#沒匯入有列名的txt檔案(預設會把第一行資料當作列名,為了避免,我們應該指定列名):
df = read_table(
                'D:/python/workspace/pythonStudy/jysjWithoutColumnName.txt',
                names=['交易型別','出賣人名稱','出賣人證件型別','出賣人證件號碼','買受人名稱','買受人證件型別','買受人證件號碼','房屋坐落','層次','房屋用途','房屋結構','建築面積',"建築年代","交易額","交易時間"],
                sep=',' #表示txt中的資料是以逗號隔開的(不加這一句會造成把所有的資料當成一列匯入進來)
                )

#匯入有列名的txt檔案
df = read_table(
                'D:/python/workspace/pythonStudy/jysjWithColumnName.txt',
                names=['交易型別','出賣人名稱','出賣人證件型別','出賣人證件號碼','買受人名稱','買受人證件型別','買受人證件號碼','房屋坐落','層次','房屋用途','房屋結構','建築面積',"建築年代","交易額","交易時間"],
                sep=','
                )


#3. 匯入excel檔案
#語法:read_excel(fileName,sheetName,names)

from pandas import read_excel
df = read_excel(
                'D:/python/workspace/pythonStudy/jysj.xls',
                sheetname='吉木薩爾縣近三年房屋交易資訊'
                )

#4. 解決檔名包含中文的問題:
#加上engine引數即可:
df = read_excel(
                'D:/python/workspace/pythonStudy/中文檔名.xls',
                sheetname='吉木薩爾縣近三年房屋交易資訊',
                #engine='python'
                )


相關推薦

python筆記6:資料處理匯入資料

# -*- coding: utf-8 -*- #資料一般儲存在檔案(csv、txt、excel)和資料庫中 #1. 匯入csv檔案(第一行是列名) from pandas import read_csv #檔案的編碼格式也應該是 utf-8 才行,否則報錯 df = re

Python資料處理(十 四)Pandas 匯入匯出

pandas可以讀取與存取的資料格式有很多種,像csv、excel、json、html與pickle等…, 詳細請看官方說明檔案 一、讀取csv 下面的例子假設當前路徑中有xxx.csv檔案: >>> import pandas as pd >>

Python資料處理(三)Numpy建立array

一、關鍵字 array:建立陣列 dtype:指定資料型別 zeros:建立資料全為0 ones:建立資料全為1 empty:建立資料接近0 arrange:按指定範圍建立資料 linspace:建立線段

Python資料處理(二)Numpy屬性

簡單介紹一下numpy中常見的三個屬性: ndim:    維度 shape:  行數和列數 size:     元素個數 使用numpy首先要匯入模組,為了方便

Python資料處理(一)為什麼要學習 Numpy & Pandas?

今天我們介紹兩個科學運算當中最為重要的兩個模組,一個是numpy,一個是 pandas。任何關於資料分析的模組都少不了它們兩個。 一、主要用途: 資料分析 機器學習 深度學習 二、為什麼使用 numpy & pandas

Python資料處理(四)numpy基礎運算1

一、一維矩陣的基礎運算 下例中 a和b是兩個屬性為array也就是矩陣的變數,而且二者都是1行4列的矩陣, 其中b矩陣中的元素分別是從0到3。 如果我們想要求兩個矩陣之間的減法,你可以嘗試著輸入:a-b,得到的結果是對應元素相減的結果也就是[10 19 28 37],同理元素的相加相

Python資料處理(七)Numpy array 合併

一、np.vstack() 對array的合併,我們可以想到按行、按列等多種方式進行合併。 vertical stack本身屬於一種上下合併,即對括號中的兩個整體進行對應操作。 >>> import numpy as np >>> A=np.a

Python資料處理(十 一)Pandas 選擇資料

首先先建立一個6X4的矩陣 >>> import pandas as pd >>> import numpy as np >>> dates=pd.date_range('20181121',periods=6) >>

Python資料處理(十)Pandas 基本介紹

一、Numpy 和 Pandas 有什麼不同 如果用 python 的列表和字典來作比較, 那麼可以說 Numpy 是列表形式的,沒有數值標籤,而 Pandas 就是字典形式。Pandas是基於Numpy構建的,讓Numpy為中心的應用變得更加簡單。 要使用pandas,首先需要

Python資料處理(九)Numpy copy & deep copy

一、= 的賦值方式會有關聯性 首先匯入numpy並建立變數a,b,c,d >>> import numpy as np >>> a=np.arange(4) >>> print(a) [0 1 2 3] >>>

Python資料處理(八)Numpy array分割

一、建立資料 匯入模組並建立3行4列的Array >>> import numpy as np >>> A=np.arange(12).reshape((3,4)) >>> print(A) [[ 0 1 2 3] [

Python資料處理(六)numpy索引

一、一維索引 在元素列表或者陣列中,我們可以用如同a[2]一樣的索引方法,同樣的,在Numpy中也有相對應的表示方法。 >>> import numpy as np >>> A=np.arange(3,15) >>> prin

Python資料處理(五)numpy基礎運算2

通過上一節的學習,我們可以瞭解到一部分矩陣中元素的計算和查詢操作。然而在日常使用中,對應元素的索引也是非常重要的。依然,讓我們先從一個指令碼開始 : >>> import numpy as np >>> A=np.arange(2,14).resh

Python資料處理(十 五)Pandas 合併concat

一、要點 pandas處理多組資料的時候往往會要用到資料的合併處理,使用 concat是一種基本的合併方式.而且concat中有很多引數可以調整,合併成你想要的資料形式. 二、axis(合併方向) axis=0是預設值,因此未設定任何引數時,函式預設axis=0。 >

Python資料處理(十 八)10分鐘搞定matplotlib

Matplotlib 簡介 1.1 為什麼用 Matplotlib 1.2 Matplotlib 安裝 基本使用 2.1 基本用法 2.2 figure 影象 2.3 設定座標軸1 2.4 設定座標軸2 2.5 Legend 圖例 2.6 Annota

Python資料處理(十 七)Pandas plot畫圖

這次我們講如何將資料視覺化. 首先import我們需要用到的模組,除了 pandas,我們也需要使用 numpy 生成一些資料,這節裡使用的 matplotlib 僅僅是用來 show 圖片的, 即 plt.show()。 import pandas as pd import num

Python資料處理(十 六)Pandas 合併merce

要點 pandas中的merge和concat類似,但主要是用於兩組有key column的資料,統一索引的資料. 通常也被用在Database的處理當中. 依據一組key合併 import pandas as pd #定義資料集並打印出 left = pd.DataFrame({

Python資料處理(十 三)Pandas 處理丟失資料

建立含 NaN 的矩陣 有時候我們匯入或處理資料, 會產生一些空的或者是NaN資料,如何刪除或者是填補這些 NaN 資料就是我們今天所要提到的內容. 建立了一個6X4的矩陣資料並且把兩個位置置為空. >>> dates=pd.date_range('20181

Python資料處理(十 二)Pandas 設定值

一、建立資料 我們可以根據自己的需求, 用 pandas 進行更改資料裡面的值, 或者加上一些空的,或者有數值的列. 首先建立了一個 6X4 的矩陣資料。 >>> import pandas as pd >>> import numpy a

(轉)大資料處理道(十分鐘學會Python

轉自:http://blog.csdn.net/u010700335/article/details/42025391,如侵刪 (0)目錄 快速學Python 和 易犯錯誤(文字處理) Python文字處理和Java/C比對 十分鐘學會Python的基本型別 快速學會Python(