1. 程式人生 > >R數據分析(一)

R數據分析(一)

cto pda 獲取 是否 位數 ima 與或 比較 sys

R語言特點: 主要用於統計分析、圖表顯示。 屬於解釋型語言。支持模塊化編程。 應用:數據科學、統計計算、機器學習 學習方法:
  1. 做筆記,記重點或者心得
  2. 手動實踐,加深理解
  3. 堅持練習,利用身邊數據進行應用分析
  4. 理解擴展包和函數背後的原理
運行R語言的三種方式:
  1. 在console中執行交互式命令(用於比較簡單的命令)
  2. 在文本編輯器中進行編輯,然後運行。
  3. 通過source(‘x.R‘)進行運行
在shell裏面使用Rscript命令 window下的R版本更新 install.packages("installr") library(installr) updateR()
在R語言中,變量不會被聲明為某些數據類型,變量被分配給R對象,由R對象的數據類型轉變為變量的數據類型。常見的R對象類型: 向量(包含6種原子向量:邏輯、數字、整數、復數、字符、原生)、列表、矩陣、數組、因子、數據幀 數據類型: 向量 可進行算術、邏輯運算 向量的索引從1開始 兩個不同長度的向量相減,則短的向量默認被擴充。 支持的運算符: 算術運算符 —— 加減乘除 關系運算符 —— 大於小於等於 邏輯運算符(大於1的數字被認為是TRUE) 與或非 賦值運算符 <- | <<- | = 左分配符 -> | ->> 右分配符 其他運算符 : 為向量創建數字 v <- 2:8; %in% 識別元素是否屬於向量 數學運算: 平均值:x <- (3,6,9) result.mean <- mean(x) print(result.mean) 中位數:數據的中間值 x<- (1,2,3) median.result <- median(x) print(median.result) 眾數:自定義 數組 數據框 每列的數據類型可以不同 使用$取子集 列表 更加靈活 R列表類似於python列表 unlist函數:將列表轉為向量 類和對象 class() 對象的類型 /str() 對象的明細 模型和公式 summary() 常用命令: c():將元素組合成向量,非字符值強制為字符值 print():打印變量的值 cat():將多個變量整合為一個輸出 getwd() 獲取當前工作空間 setwd(0設置當前工作空間 ls()列出工作空間的對象 rm()移除一個或者多個對象 save.image("file")保存工作空間到文件中(默認後綴.RData) save(object,file="myfile") 保存指定對象到一個文件中 load("myfile")讀取工作空間 matrix(data, nrow, ncol, byrow, dimnames) #創建矩陣 dim(a,b,3) #創建數組,即多個矩陣(多維度),第三個參數為創建幾個 factor() #創建因子,即可枚舉的字符串或者整數 sys.date() 返回當前日期 date()返回當前日期和時間 可以在日期上執行算術運算

R數據分析(一)