1. 程式人生 > >[讀書筆記] R語言實戰 (四) 基本數據管理

[讀書筆記] R語言實戰 (四) 基本數據管理

mean 圖片 數值 函數 nbsp 一個 img order 分享

1. 創建新的變量

mydata<-data.frame(x1=c(2,2,6,4),x2=c(3,4,2,8))
#方法一
mydata$sumx<-mydata$x1+mydata$x2
mydata$meanx<-(mydata$x1+mydata$x2)/2
#方法二
attach(mydata)
mydata$sumx <- x1+x2
mydata$meanx <- (x1+x2)/2
detach(mydata)
#第三種方式
mydata<-transform(mydata,sumx=x1+x2,meanx=(x1+x2)/2)

2. 變量的重編碼

連續->類別

錯誤->正確值

分數->級別劃分

3. 變量的重命名

reshape()包中的rename()函數

rename(dataframe, c(oldname=‘newname‘,oldname = ‘newname‘)

4. 缺失值

缺失值:NA(Not Availabe不可用表示)

不可能出現的值:NAN(Not a number, 非數值)

is.na() 檢查是否是缺失值

na.rm= TRUE 在計算之前移除缺失值

na.omit()刪除所有不完整的規則

5. 日期值:日期值以字符串形式輸入到R,然後轉化為以數值形式存儲的日期變量

as.Date(x, "input_format")

技術分享圖片

#日期默認輸入格式為yyyy-mm--dd
mydates <- as.Date(c(‘2007-06-22‘,‘2004-02-13‘))
#新的輸入格式
strDates <-c(‘01/05/1965‘,‘08/16/1975‘)
dates <- as.Date(strDates,"%m/%d/%Y")
#日期轉化為字符型變量
strDates <- as.character(dates)

6. 數據類型轉化

技術分享圖片

7. 數據排序

order() 對數據進行排序, 默認順序是升序,在排序變量前面添加一個減號就可以得到降序的排序結果

8. 數據集的合並

1). 列合並:向數據框中添加變量 merge(dataframeA, dataframeB, by = ‘ID‘)

2). 行合並:向數據框中添加觀測 rbind()

3). subset()函數

newdata <- subset(dateframe, conditions, select = c(col1,col2))

4) 抽樣函數 sample()

[讀書筆記] R語言實戰 (四) 基本數據管理