R語言迴歸分析函式說明

阿新 • • 發佈：2018-11-11

迴歸分析相關的函式

1、一元線性迴歸

lm() #計算beta0,beta1引數

summary() # 提取lm()引數資訊

anovn() #方差分析

predict() # 根據給出自變數預測因變數的值

例：

a=lm(y~1+x,data=…) #對x,y迴歸分析

summary(a) # 提取回歸分析結果

new=data.frame(x=0.16) # 當x=0.16時對y進行預測，必須為資料框格式

lm.new=predict(a,new,interval=”prediction”,level=0.95)#利用a得到的迴歸分析，對new進行預測

abline(a)#繪製迴歸直線

b=residuals(a) # 計算迴歸方程殘差

plot(b) #繪製殘差散點圖

提取模型lm()資訊的通用函式

anova(a)#計算方差分析表aov()

coefficients()# 提取模型係數

deviance()#計算殘差平方和

formula()#提取模型公式

plot()#繪製模型診斷圖

predict()#預測

print()# 顯示

residuals()#計算殘差

step()#做逐步迴歸

summary()#提取模型資料

2、多元迴歸分析

update()修正擬合模型

例：

fm5=lm(y~x1+x2+x3+x4+x5,data=…)

fm6=update(fm5, .~.+x6)

smf6=update(fm6,sqrt(.)~.)

lm(y~x1+I(x2^2))

add1()

drop1()

step()

3、逐步迴歸

step(object,scope,

direction=c(“both”,”backward”,”forward”)

trace=1,keep=Null,steps=1000,k=2,…)

4、迴歸診斷(1.誤差項：獨立性等方差性正態性

2.選擇線性模型是否合適

3.是否存在異常樣本

4.迴歸分析結果是否對某個樣本依賴過重

5.自變數之間是否存在高度相關)

作圖

殘差

residuals()

Shapiro.test() #殘差正態性檢驗

rstandard(model,infl=lm.influence(model,do.coef=FALSE)

sd=sqrt(deviance(model)/df.residual(model)),…) #標準化殘差

rstudent()#學生化殘差

迴歸值Y與殘差的散點圖

y.res=resid(lm.sol)

yfit=predict(lm.sol)

plot(y.res~y.fit)#殘差圖

y.rst=rstandard(lm.sol)

plot(y.rst~yfit)#標準化殘差圖

R語言迴歸分析方差分析

以自變數為橫座標的殘差圖

y.res=resid(lm.sol)

plot(y.res~x1)

plot(y.res~x2)

強影響點（異常值）

hatvalues()

hat()

dffits()

cooks.distance()

covratio()

influence.measures(model)#迴歸診斷的總括

多重共線

kappa() #計算矩陣的條件數

eigen() # 計算矩陣特徵值

5、廣義線性模型

glm(formula, # 公式

family=c(binomial,Gaussian,gamma,inverse,poisson,quasi)# 分佈族

data=…)# 資料

非線性迴歸

lm(y~1+x+I(x^2),data=…)

poly(x,degree=1,codfs=NULL)正交多項迴歸 degree多項式階數

lm(y~1+poly(x,2))

nls()#求非線性最小二乘問題

nlm()#非線性模型引數估計

6、方差檢驗

單因素方差分析

aov(x~A)# x要分析變數A變數因子水平

均值的多重比較

pairwise.t.test(x,g) # x相應變數 g因子向量

P值修正

P.adjust(p,method=…)

方差齊性檢驗

誤差正態性檢驗

shapiro.test(X[A==1])

方差齊性檢驗

bartlett.test()

通過秩統計量進行方差分析(分析各水平之間是否存在差異)

K-W秩和檢驗

kruskal.test()

Friedman秩和檢驗

friedman.test()

雙因素方差分析

aov(Y~A+B+A:B)#對A B兩個因素進行分析並考慮了互動作用

R語言迴歸分析函式說明

迴歸分析相關的函式 1、一元線性迴歸 lm() #計算beta0,beta1引數 summary() # 提取lm()引數資訊 anovn() #方差分析 predict() # 根據給出自變數預測因變數的值例： a=lm(y~1+x,data=…) #對x,y

R語言統計分析技術研究——嶺回歸技術的原理和應用

gts 根據誤差 med 分享 jce not -c rt4 嶺回歸技術的原理和應用

R語言關聯分析之啤酒和尿布

mea mar 簡單 active 兩個 mark 情況 rgb efault 關聯分析概述啤酒和尿布的故事，我估計大家都聽過，這是數據挖掘裏面最經典的案例之一。它分析的方法就關聯分析。關聯分析，顧名思義，就是研究不同商品之前的關系。這裏就發現了啤酒和尿布這兩個看起來毫不相

R語言︱情感分析—詞典型代碼實踐（最基礎）（一）

text cto 關於 ora 訓練集其他查找 rap boa R語言︱情感分析—基於監督算法R語言實現筆記。可以與博客 R語言︱詞典型情感分析文本操作技巧匯總（打標簽、詞典與數據匹配等）對著看。詞典型情感分析大致有以下幾個步驟：訓練數據集、neg/pos情感

R語言生存分析

文章目錄 R語言進行生存分析 1.下載示例資料 2.R語言程式碼例項詳解 3.難點解讀 4.補充：如何用R語言手動計算生存率 R語言進行生存分析 1.下載示例資料示例資料連線 2.R語言程

R語言bootstrap分析（boot）

//## bootstrap分析資料,package = "boot" > library(boot) > city u x 1 138 143 2 93 104 3 61 69 4 179 260 5 48 75 6 37 63 7

R語言-錯誤分析-Error in .Call.graphics(C_palette2, .Call(C_palette2, NULL)) : invalid graphics state

plot時，出現的錯誤01 > ggplot(religions_long, + aes(State, value, fill = variable)) + + geom_bar(stat = "identity") + + coord_flip()

分享《R語言資料分析與挖掘實戰(張良均等)》中文PDF+原始碼

下載：https://pan.baidu.com/s/1I7hm-LP5H3-57vsUjOxeNw 更多資料分享：https://pan.baidu.com/s/1g4hv05UZ_w92uh9NNNkCaA 《R語言資料分析與挖掘實戰(張良均等)》PDF+原始碼 PDF，339頁。配套資料與原始

R語言探索性分析及plyr資料轉換包

R包dplyr可用於處理R內部或者外部的結構化資料，相較於plyr包，dplyr專注接受dataframe物件, 大幅提高了速度,並且提供了更穩健的資料庫介面。下面針對一些具體的例子介紹探索性分析和plyr資料轉換包統計diamonds（R語言自帶的資料

R語言字串處理函式

R筆記——基礎主要把學習工作中遇到的一些基礎知識記下來，方便檢視。 tryCatch() result <- tryCatch({ }, warning = function(w){ }, error = function(e){

R語言基本操作函式

1.變數變換 as.array(x),as.data.frame(x),as.numeric(x),as.logical(x),as.complex(x),as.character(x),...轉換變數型別；使用如下命令可得到全部列表，methods(as)

R語言——自定義函式求置信區間

#求單正態均值mu的置信區間 #引數依次為置信水平alpha，正態樣本x，已知總體方差（預設為未知） mu <- function(alpha,x,sigma=NA){ n <- length(x) meanx <- mean(x) if(is

R語言判別分析

自己整理編寫的R語言常用資料分析模型的模板，原檔案為Rmd格式，直接複製貼上過來，作為個人學習筆記儲存和分享。部分參考薛毅的《統計建模與R軟體》和《R語言實戰》本文中分三個方法介紹判別分析，Bayes判別，距離判別，Fisher判別。前兩種判別方法都要考慮兩個、或多個總體協方差（這裡是

R語言生存分析

自己整理編寫的R語言常用資料分析模型的模板，原檔案為Rmd格式，直接複製貼上過來，作為個人學習筆記儲存和分享。部分參考薛毅的《統計建模與R軟體》和《R語言實戰》生存分析是研究生存時間的分佈規律，以及生存時間和相關因素之間關係的一種統計分析方法。生存分析在醫學科學研究中具有廣泛而重要的應

R語言因子分析

自己整理編寫的R語言常用資料分析模型的模板，原檔案為Rmd格式，直接複製貼上過來，作為個人學習筆記儲存和分享。部分參考薛毅的《統計建模與R軟體》和《R語言實戰》因子模型： X=μ + A*F* + ε 其中F=[(f1,f2,…,fm)]^T為公共因子向量，[ε=(ε1,ε2,…,ε

[R語言繪圖]plot函式的使用

R語言中最簡單的一個繪圖函式就是plot了。如果之前用過matlab，用R畫圖的時候就很可能會嘗試plot這個命令能不能使用。plot(a)一般就能得到我們想要的圖。但是，如果想進一步設定其他屬性，如標題、x軸名稱、y軸名稱等，還需要對另外的一些引數做一些瞭解。下面就給出了

R語言字串處理函式_nchar

一、nchar函式介紹 nchar takes a character vector as an argument and returns a vector whose elements contain the sizes of the corresponding el

R語言統計分析篇

1.描述性統計分析（1）方法雲集通過summary，sapply（）計算描述性統計量 vars<-c("mpg","hp","wt") vars head(mtcars[vars]) #通過summary（）函式來獲取描述性統計量 summary(mtcars[

R語言之grep函式和正則萬用字元查詢 [

在R語言的道路上又學到了一個新知識，記下來一起分享！首先，grep函式可以像資料庫查詢一樣對向量中的具有特定條件的元素進行查詢！其次，介紹幾種R語言中的正則萬用字元：（1）“^”匹配一個字串的開始，比如sub("^a","",c("abcd","dcba"))，表示將開頭為a的字串。如果要將開頭的一個

R語言判別分析小結

判別分析（discriminant analysis）是一種分類技術。它通過一個已知類別的“訓練樣本”來建立判別準則，並通過預測變數來為未知類別的資料進行分類。判別分析的方法大體上有三類，即距離判別、Fisher判別和Bayes判別和。距離判別思想是根據已知

R語言 迴歸分析函式說明

相關推薦

R語言迴歸分析函式說明