R語言數據分析過程
R語言數據分析前期:預處理過程,供自己查閱,歡迎大家指正。
利用R語言導入數據:
taobao<-read.csv("taobao.csv",stringsAsFactors = F)
我最常用到就是read.csv,其中stringsAsFactors=F很重要,不可缺少,否則會大大降低讀入效率。
除此外還有read.table,他們分割符不同。
read.table(file(讀入的數據名,不在默認路徑下的要添加工作路徑,註意使用雙引號),
header = FALSE(是否將第一行作為每一列的標題),
sep = ""(分割符是什麽,table默認“空”,csv默認“,”),
row.names(行名稱), col.names(列名稱),
as.is = !stringsAsFactors,
na.strings = "NA", colClasses = NA, nrows = -1,
skip = 0, check.names = TRUE, fill = !blank.lines.skip,
strip.white = FALSE, blank.lines.skip = TRUE,
comment.char = "#",
allowEscapes = FALSE, flush = FALSE,
stringsAsFactors = default.stringsAsFactors(),
fileEncoding = "", encoding = "unknown", text, skipNul = FALSE)
導入之後對數據以窗口形式進行查看:
View(taobao)
對導入的表格進行一個基本的統計:
summary(taobao)
R語言數據分析過程