1. 程式人生 > >使用R進行資料提取

使用R進行資料提取

資料提取是資料分析日常工作中遇到最多的需求,本篇文章介紹如何通過R按特定的維度或條件對資料進行提取,完成資料提取需求。

讀取並建立資料表

首先第一步是讀取資料,並建立名稱為loandata的資料表。後面我們將從這個表中進行資料提取。

12#讀取並建立資料表loandata=data.frame(read.csv('loan_data.csv',header = 1))

將資料表中的使用者ID列設定為索引列,下面是具體的程式碼和結果。

1234#設定使用者ID為索引rownames(loandata)=loandata$member_id#檢視資料表head(loandata)

%e8%ae%be%e7%bd%ae%e7%b4%a2%e5%bc%95%e5%88%97

提取行資訊

按行提取資訊簡單的方法是輸入開始和結束的行號,下面的程式碼提取了第一行和第二行的資訊。

12#提取資料表前兩行資訊loandata[1:2,]

%e6%9f%a5%e7%9c%8b%e5%89%8d%e4%b8%a4%e8%a1%8c%e6%95%b0%e6%8d%ae

也可以直接輸入索引行的名稱來提取特定行的資訊,下面的程式碼提取了使用者ID為1296599的貸款資訊。

12#提取特定使用者ID資訊loandata['1296599',]

%e6%9f%a5%e7%9c%8b%e7%89%b9%e5%ae%9a%e7%b4%a2%e5%bc%95%e5%80%bc%e6%95%b0%e6%8d%ae

同樣的方式可以同時準確的提取多個特定使用者ID的貸款資訊。

12#提取多個特定使用者ID資訊loandata

%e6%9f%a5%e7%9c%8b%e5%a4%9a%e7%b4%a2%e5%bc%95%e5%80%bc%e6%95%b0%e6%8d%ae

提取列資訊

按列提取資訊的方式與行類似,輸入開始的列號和結束的列號。下面的程式碼中提取了第一列和第二列的資訊。

12#提取前兩列資訊loandata[1:2]

%e6%9f%a5%e7%9c%8b%e5%89%8d%e4%b8%a4%e5%88%97%e6%95%b0%e6%8d%ae

也可以直接輸入列名稱提取特定列的資訊,例如下面的程式碼提取了資料表中term列的資訊。

12#提取term列資訊loandata[
'term']

%e6%9f%a5%e7%9c%8b%e7%89%b9%e5%ae%9a%e5%88%97%e6%95%b0%e6%8d%ae

同樣的方法,可以同時提取多個列的資訊,下面的程式碼中提取了term和grade列的資訊。

12#提取term列和grade列資訊head(loandata)

%e6%9f%a5%e7%9c%8b%e5%a4%9a%e5%88%97%e6%95%b0%e6%8d%ae

提取特定行列資訊

把提取行資訊的方法與提取列資訊的方法彙總,可以提取特定行列的資訊。下面的程式碼中提取了第三行,第5列和第6列的資訊。

12#提取第3行5,6列資訊loandata[3:3,5:6]

%e6%9f%a5%e7%9c%8b%e7%89%b9%e5%ae%9a%e8%a1%8c%e5%88%97%e7%9a%84%e6%95%b0%e6%8d%ae

也可以直接輸入索引行中使用者ID和列名稱,進行資訊提取。

12#提取特定使用者ID的貸款金額loandata['1296599','loan_amnt']

%e6%9f%a5%e7%9c%8b%e7%89%b9%e5%ae%9a%e8%a1%8c%e5%88%97%e7%9a%84%e6%95%b0%e6%8d%ae1

提取最大值的行資訊

除了提取行和列的資訊外,還可以按條件進行提取,例如提取資料表中貸款金額最大值的行。下面的程式碼中使用which.max函式用來確定貸款金額最大值的行號。

12#提取貸款金額最大值的資訊loandata[which.max(loandata$loan_amnt),]

%e6%8f%90%e5%8f%96%e6%9c%80%e5%a4%a7%e5%80%bc%e4%bf%a1%e6%81%af%e8%a1%8c

提取最小值的行資訊

同樣的方法也可以用which.min函式來提取貸款金額最小值所在行的資訊。

12#提取貸款金額最小值的資訊loandata[which.min(loandata$loan_amnt),]

%e6%8f%90%e5%8f%96%e6%9c%80%e5%b0%8f%e4%bf%a1%e6%81%af%e8%a1%8c
—【所有文章及圖片版權歸 藍鯨(王彥平)所有。歡迎轉載,但請註明轉自“藍鯨網站分析部落格”。】—