1. 程式人生 > >R語言學習三 各種格式資料集的匯入

R語言學習三 各種格式資料集的匯入

R支援大多數的資料分析軟體和資料庫檔案,自由無縫切換,哈哈哈 1、keyboard直接建立資料 #建立一個數據編輯器 > mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0)) #編輯資料 > mydata<-edit(mydata)
2、讀取文字類檔案 格式:mydataframe <- read.table( file, header=logical_value,  sep=" delimiter", row.names=" name") #讀取.csv的表格 >grades <- read.table("studentgrades.csv", header=TRUE, sep=",",
row.names="STUDENTID")


3、匯入excel表格 #安裝所需程式包 >install.packages("RODBC") #載入程式包 > library(RODBC) #odbcConnect( dsn)開啟Excel檔案功能,其中dsn用於指定Excel檔案路徑 >channel <- odbcConnectExcel("myfile.xls") #sqlFetch(channel, sqltable)指定讀取Excel檔案的某個sheet內的資料內容。引數channel是odbcConnectExcel函式的返回值,引數sqtable是Excel檔案內的sheet名稱 >mydataframe <- sqlFetch(channel, "mysheet")
#關閉檔案 >odbcClose(channel)
4、匯入excel表格(xlsx)
RODBC不支援xlsx,若有匯入excel2007以上版本,需使用xlsx程式包。
> library(xlsx)
> workbook <- "c:/myworkbook.xlsx"
> mydataframe <- read.xlsx(workbook, 1)
5、匯入XML程式碼
> library(XML) > f = system.file("exampleData", "mtcars.xml", package="XML") > xmlParseDoc(f)
<?xml version="1.0"?> <!DOCTYPE dataset SYSTEM "../DatasetByRecord.dtd"> <!-- Taken from the R distribution, in turn taken from Henderson and Velleman 1981,       Building multiple regression models interactively, Biometrics 37 391-411 .   --> <dataset name="mtcars" numRecords="32" source="R Project">  <variables count="11"> ................ 6、直接讀取網頁

> myHttpheader <- c(

"User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ",

"Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",

......................

)

temp <- getURL("http://.....com/",httpheader=myHttpheader) 7、spss的檔案
>install.packages("Hmisc")
>library(Hmisc)
>mydataframe <- spss.get("mydata.sav", use.value.labels=TRUE)
8、SAS的檔案
sas可同樣適用Hmisc包的read.ssd()和 sas.get()函式,當SAS的版本9.1或以上的話就不能使用,可以在SAS裡將資料輸出為csv格式: proc export data=mydata
outfile="mydata.csv"
dbms=csv;
run;


然後匯入R中:
> mydata <- read.table("mydata.csv", header=TRUE, sep=",")

9、Stata檔案 > library(foreign)
> mydataframe <- read.dta("mydata.dta")
10、netCDF > library(ncdf)
> nc <- nc_open("mynetCDFfile")
> myarray <- get.var.ncdf(nc, myvar)
11、資料庫管理系統 > library(RODBC) 
> myconn <-odbcConnect("mydsn", uid="Rob", pwd="aardvark")
> crimedat <- sqlFetch(myconn, Crime) 
> pundat <- sqlQuery(myconn, "select * from Punishment")
> close(myconn)
#odbcConnect( dsn,uid="",pwd="") 開啟資料庫的連結
#sqlFetch( channel,sqltable)讀取表格

#sqlQuery( channel,query)提交查詢並返回結果
#sqlSave( channel,mydf, tablename =sqtable, append=FALSE)寫入或者更新(append=TRUE)資料
#sqlDrop( channel,sqtable)刪除表格

相關推薦

R語言學習 各種格式資料匯入

R支援大多數的資料分析軟體和資料庫檔案,自由無縫切換,哈哈哈 1、keyboard直接建立資料 #建立一個數據編輯器 > mydata<-data.frame(age=numeric(

R語言學習()——決策樹分類

分類 分類(Classification)任務就是通過學習獲得一個目標函式(Target Function)f, 將每個屬性集x對映到一個預先定義好的類標號y。 分類任務的輸入資料是記錄的集合,每條記錄也稱為例項或者樣例。用元組(X,y)表示,其中,X 是屬性集合,y是一個特殊的

R語言學習(七)——資料規範化

由於取值範圍大的變數會在測算距離時被賦予較大的權重,降低取值範圍小的資料對結果的影響,所以要對原始變數進行規範化處理。 讀取資料: 或者將Excel檔案儲存為csv(逗號分隔)型檔案,然後用read函

[bigdata-099] R語言評分卡 德國信貸資料

1. R語言官網 https://www.r-project.org/  2. 安裝R語言 apt-get install r-base 3. 執行 在命令列輸入 R,進入互動介面,然後輸入1+2,得到3,表明安裝成功 4. 下載rstudio https://www.rs

R語言學習筆記(資料處理

本文的示例資料框集(egData)如下: 值標籤: if(FALSE){值標籤,levels代表變數實際值,labels代表標籤值} egData$sex <- factor(egDa

R語言入門——筆記()建立資料

第一部分:資料結構 1.建立向量:c() c(…, recursive = FALSE, use.names = TRUE) 根據元素座標訪問 2.建立矩陣:matrix() matrix(data = NA, nrow = 1, ncol

R語言學習二(包與資料

R語言安裝包 什麼是R語言的包? 我們可以把它視為一種擴充套件R基本功能的機制,包本身也集成了眾多的函式。在使用R的過程中如果我們要使用某些函式,而當前R裡面沒有的話,我們通常可以去查詢那些與其相關的包,那些包裡面通常已經包含了其他開發者開發好的功能,我們

R語言學習筆記之

結構 urn padding 效果 rand html 創建 字符 pri 僅用於記錄R語言學習過程: 內容提要:條件與循環 正文: 格式: 條件 ü if (條件) 執行的程序 else ü if (條件) {函數體 (分行,或者用;隔開) } else 返回值 ü

R語言學習——R讀取txt、csv、xls和xlsx格式文件

r-project ext ODB comm ade 讀取 org packages subst 最近項目中運用到了R讀取文件數據,所以把相關好用的、經過驗證的方法總結了一下,有效避免下次入坑。 1. R讀取txt文件 使用R讀取txt文件直接使用read.table()方

R語言學習(四)——對資料進行操作

判斷變數的屬性 is.character(x) #判斷是否為字元型 is.numeric(x) #判斷是否為數值型 is.vector(x) #判斷是否為一個向量 is.matrix(x) #判斷是否為一個

R語言學習-第課-R語言與MATLAB程式設計比較

求餘 y = 5 ;  x = 2;  y%%x = 1; matlab    mod(y,x); R    y%%x; 取行數 matlab  size(m,1); R    nrow(m); 重複矩陣 1 2 3

R語言學習-第一課-資料蒐集

R語言是一門快速發展的開源軟體,是SAS、STATA和SPSS這類商業軟體的競爭對手。 就業市場對R語言的需求正在迅速上升,微軟等公司也同時承諾將致力讓R語言成為資料科學通用語言。 看看由Revolution Analytics製作的90秒視訊(https://www.youtube.c

R語言——學習筆記(

1.table()    函式,生成表 2.管道處理    %>%    管道運算子     >install.packages("dplyr")     >library(dplyr)     >dat %>% table    #用左

R語言學習筆記——melt()函式之整齊資料

R語言學習筆記(二) melt()函式 melt(data,id.vars,measure.vars,variable.name=“variable”,…,na.rm=FALSE,value.name=“value”,factorsAsStrings=TRUE)

R語言學習)——二項分佈

二項分佈統計推斷 dbinom(x, size, prob):計算某點的概率值 x:生成隨機數的數量;size:伯努利實驗的次數;prob:試驗成功的概率 pbinom(q, size, prob):生成累積概率 qbinom(p, size, prob):生成

R語言學習(五)高階資料管理

(一)數值和字元處理函式 數學函式: 統計函式:  輸入help( )可以檢視函式的具體用法 z <- mean(x) z <- mean(x,trim=0.05,na.rm=TRUE) ;;丟棄最大最小百分之5後的截尾平均書  均值與標準

R語言學習-JOIN的各種實現

library(data.table) library(dplyr) A<-data.table(X1=c("a","b","c","d","e"),Y1=c(1,2,3,4,5),Z1=c("

R語言學習系列(資料探勘之決策樹演算法實現--ID3程式碼篇)

轉載自:http://blog.csdn.net/hawksoft/article/details/7760868 1、輔助類,用於計算過程和結果儲存 [csharp] view plaincopyprint? /// &

深度學習caffe平臺--製作自己.lmdb格式資料及分類標籤檔案

caffe對於訓練資料格式,支援:lmdb、h5py……,其中lmdb資料格式常用於單標籤資料,像分類等,經常使用lmdb的資料格式。對於迴歸等問題,或者多標籤資料,一般使用h5py資料的格式。當然好像還有其它格式的資料可用,本文就主要針對lmdb資料格式的製作方法,進行簡

SAS學習︱邏輯庫、資料建立與檢視、資料庫連結(SAS與R的code對照)

每每以為攀得眾山小,可、每每又切實來到起點,大牛們,緩緩腳步來俺筆記葩分享一下吧,please~———————————————————————————入門學習一週,開始寫學習筆記。用習慣R之後,發現SA