1. 程式人生 > >R語言數據分析過程

R語言數據分析過程

ngs sum ade 利用 actor csv 分割 classes mar

R語言數據分析前期:預處理過程,供自己查閱,歡迎大家指正。

利用R語言導入數據

taobao<-read.csv("taobao.csv",stringsAsFactors = F)

我最常用到就是read.csv,其中stringsAsFactors=F很重要,不可缺少,否則會大大降低讀入效率。

除此外還有read.table,他們分割符不同。

read.table(file(讀入的數據名,不在默認路徑下的要添加工作路徑,註意使用雙引號),

  header = FALSE(是否將第一行作為每一列的標題),

  sep = ""(分割符是什麽,table默認“空”,csv默認“,”),
  row.names(行名稱), col.names(列名稱),

   as.is = !stringsAsFactors,

  na.strings = "NA", colClasses = NA, nrows = -1,

  skip = 0, check.names = TRUE, fill = !blank.lines.skip,
  strip.white = FALSE, blank.lines.skip = TRUE,
  comment.char = "#",
  allowEscapes = FALSE, flush = FALSE,
  stringsAsFactors = default.stringsAsFactors(),
  fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)


導入之後對數據以窗口形式進行查看:

View(taobao)

技術分享圖片

對導入的表格進行一個基本的統計:

summary(taobao)

技術分享圖片

R語言數據分析過程