1. 程式人生 > >乾貨:用R語言進行資料提取的方法!

乾貨:用R語言進行資料提取的方法!

 資料提取是資料分析當中重要的一環,也是需要資料分析師耐心細心地做好。我們大聖眾包(www.dashengzb.cn小編今天就和大家分享藍鯨的文章,如何通過R語言對資料進行提取分析,達到所需。

  讀取並建立資料表

  首先第一步是讀取資料,並建立名稱為loandata的資料表。後面我們將從這個表中進行資料提取。

  將資料表中的使用者ID列設定為索引列,下面是具體的程式碼和結果。

  提取行資訊

  按行提取資訊簡單的方法是輸入開始和結束的行號,下面的程式碼提取了第一行和第二行的資訊。

  也可以直接輸入索引行的名稱來提取特定行的資訊,下面的程式碼提取了使用者ID為1296599的貸款資訊。

  同樣的方式可以同時準確的提取多個特定使用者ID的貸款資訊。

  提取列資訊

  按列提取資訊的方式與行類似,輸入開始的列號和結束的列號。下面的程式碼中提取了第一列和第二列的資訊。

  也可以直接輸入列名稱提取特定列的資訊,例如下面的程式碼提取了資料表中term列的資訊。

  同樣的方法,可以同時提取多個列的資訊,下面的程式碼中提取了term和grade列的資訊。

  提取特定行列資訊

  把提取行資訊的方法與提取列資訊的方法彙總,可以提取特定行列的資訊。下面的程式碼中提取了第三行,第5列和第6列的資訊。

  也可以直接輸入索引行中使用者ID和列名稱,進行資訊提取。

  提取最大值的行資訊

  除了提取行和列的資訊外,還可以按條件進行提取,例如提取資料表中貸款金額最大值的行。下面的程式碼中使用which.max函式用來確定貸款金額最大值的行號。

  提取最小值的行資訊

  同樣的方法也可以用which.min函式來提取貸款金額最小值所在行的資訊。