1. 程式人生 > >R語言csv與txt文本讀入區分(sep參數)

R語言csv與txt文本讀入區分(sep參數)

系統 文件格式 inux 完整路徑 r語言 table weight 系統環境 dos

R語言csv與txt文本讀入區分

R語言用來處理數據很方便,而處理數據的第一步是把數據讀入內存空間,平時最常用的文本數據儲存格式有兩種;

一種是CSV(逗號分隔符文本)另一種是TXT(Tab分隔符或空格分隔符),有時候讀這兩種文件格式讀入容易混淆。

1,我們讀入數據的時候,一般寫文件名有兩種方式:

(1)將儲存數據的文件所在的目錄設置為工作目錄(setwd(“file path")),讀文件時只需要寫文件名即可

1 setwd(C:/Data/mydata)
2 data <- read.table(cancer.txt, header=TURE)

(2)不設置工作目錄,讀入文件時使用完整路徑(包括絕對路徑和相對路徑)

1 data <- read.table(C:/Data/mydata/cancer.txt, header=TURE)

(3)我個人偏愛第一種,因為設置好目錄之後我很清楚地知道我當前是在哪個目錄下;這並不意味這第二種就沒有意義;

當我們一開始就在系統環境下切換到某個確切的目錄下(DOS和Linux都使用cd命令),這種情況下使用第二種方法也同樣

只要寫文件名即可。總而言之,切換目錄是必須的,區別在於你是交給系統(通過cd命令切換),setwd函數還是指定確切的路徑來完成。

2,使用read.table函數讀入

(1)讀入txt文件

1 data <- read.table(
cancer.txt, header=TRUE)

header=TRUE代表讀入數據時將第一行作為列名(若是FALSE則相反,不使用文件中第一行作為列名),也可以簡寫問header=T(或是header=F)

不用指定sep參數,因為read.txt函數默認參數sep=‘\t‘。當然願意的話你也可以指定,那樣的話會顯得有點多余

(2)讀入csv文件

1 data <- read.txt(cancer.csv, header=TURE, sep=,)

必須指定sep=‘,‘不指定不會報錯但是會出現你讀入的數據只有一列的情況

3,使用read.csv函數讀入

(1)讀入txt文件

1 data <- read.csv(cancer.txt, header=TURE, sep=\t)

必須指定sep參數

(2)讀入csv文件

1 data <- read.csv(cancer.csv, header=TURE)

不強制指定sep參數,因為默認sep=‘,‘

4,我推薦使用read.table函數讀入txt文件,read.csv函數讀入csv文件;可以少寫幾個字為啥不偷點懶呢?

R語言csv與txt文本讀入區分(sep參數)