1. 程式人生 > >R語言資料讀取以及資料儲存

R語言資料讀取以及資料儲存

一、R語言讀取文字檔案:

1、檔案目錄操作:

getwd() : 返回當前工作目錄

setwd("d:/data")  更改工作目錄

2、常用的讀取指令read

read.table() : 讀取文字檔案

read.csv(): 讀取csv檔案

如果出現缺失值,read.table()會報錯,read.csv()讀取時會自動在缺失的位置填補NA

3、靈活的讀取指令scan() :

4、讀取固定寬度格式的檔案:read.fwf()

文字文件中最後一行的回車符很重要,這是一個類似於停止符的標識,否則讀入時會顯示“最後一行不完整”的警告,但是不影響資料讀入的效果。

5、讀取Excel資料:

(1)第一種方法

首先開啟Excel,選中需要的資料後複製,

然後再R中輸入以下的指令:data.excel =read.delim("clipboard") #clipboard即剪貼簿

(2)第二種方法:

使用RODBC包,獲取Excel連線的函式是odbcConnectExcel()和odbcConnectExcel2007() 分別讀取Excel2003版和2007版的資料channel =odbcConnectExcel2007("d:/a.xlsx")

sqlTables(channel)# 列出Excel中的表格

獲取Sheet1中的資料,可以使用如下任意的一種方式,

data.excel2 =sqlFetch(channel,"Sheet1")

data.excel2 =sqlQuery(channel,"select * from [Sheet1$]")

close(channel) #關閉ODBC連線,釋放空間

6、讀取網頁資料

readHTMLTable()函式

7、讀取R格式的檔案:

 R的資料或者更一般的物件可以通過save()儲存為R專有的檔案格式,以Rdata為字尾,要讀取此類檔案,需要用到函式load()來載入,

8、readLines("d:/data/cat.txt"): 可以直接從連線中以行的形式來讀取文字

要顯示列表中的變數 需要使用符號$

二、資料儲存:

1、使用函式cat()

cat(...,file="",sep="",fill = FALSE ,labels=NULL,append=FALSE) #file表示要輸出的檔名,當引數append=TRUE時,在指定檔案的末尾新增內容。sep:表示以空格作為分隔符

2、儲存為文字檔案:

write僅可以寫出一個矩陣或向量的特定列,和對一個矩陣進行轉置

write.table() 可以把一個數據框或列表等物件以包含行列標籤的方式寫出。

write.csv(): 將資料框儲存為逗號分隔檔案,但是不包含列名

3、儲存R格式檔案:

save(data,file="d:/data/salary1.Rdata")

dim():求維度

mode() 用來顯示物件的型別

names():顯示物件中的標籤