[讀書筆記] R語言實戰 (四) 基本數據管理
阿新 • • 發佈:2017-11-22
mean 圖片 數值 函數 nbsp 一個 img order 分享
1. 創建新的變量
mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8)) #方法一 mydata$sumx<-mydata$x1+mydata$x2 mydata$meanx<-(mydata$x1+mydata$x2)/2 #方法二 attach(mydata) mydata$sumx <- x1+x2 mydata$meanx <- (x1+x2)/2 detach(mydata) #第三種方式 mydata<-transform(mydata,sumx=x1+x2,meanx=(x1+x2)/2)
2. 變量的重編碼
連續->類別
錯誤->正確值
分數->級別劃分
3. 變量的重命名
reshape()包中的rename()函數
rename(dataframe, c(oldname=‘newname‘,oldname = ‘newname‘)
4. 缺失值
缺失值:NA(Not Availabe不可用表示)
不可能出現的值:NAN(Not a number, 非數值)
is.na() 檢查是否是缺失值
na.rm= TRUE 在計算之前移除缺失值
na.omit()刪除所有不完整的規則
5. 日期值:日期值以字符串形式輸入到R,然後轉化為以數值形式存儲的日期變量
as.Date(x, "input_format")
#日期默認輸入格式為yyyy-mm--dd mydates <- as.Date(c(‘2007-06-22‘,‘2004-02-13‘)) #新的輸入格式 strDates <-c(‘01/05/1965‘,‘08/16/1975‘) dates <- as.Date(strDates,"%m/%d/%Y") #日期轉化為字符型變量 strDates <- as.character(dates)
6. 數據類型轉化
7. 數據排序
order() 對數據進行排序, 默認順序是升序,在排序變量前面添加一個減號就可以得到降序的排序結果
8. 數據集的合並
1). 列合並:向數據框中添加變量 merge(dataframeA, dataframeB, by = ‘ID‘)
2). 行合並:向數據框中添加觀測 rbind()
3). subset()函數
newdata <- subset(dateframe, conditions, select = c(col1,col2))
4) 抽樣函數 sample()
[讀書筆記] R語言實戰 (四) 基本數據管理