1. 程式人生 > >R語言統計分析技術研究——嶺回歸技術的原理和應用

R語言統計分析技術研究——嶺回歸技術的原理和應用

gts 根據 誤差 med 分享 jce not -c rt4

嶺回歸技術的原理和應用

作者馬文敏

嶺回歸分析是一種專用於共線性分析的有偏估計回歸方法,實質上是一種改良的最小二乘估計法,通過放棄最小二乘法的無偏性,以損失部分信息,降低精度為代價獲得回歸系數更為符合實際,更可靠的回歸方法,對病態數據的耐受性遠遠強於最小二乘法。

技術分享

回歸分析:他是確立兩種或兩種以上變量間相互依賴的定量關系的一種統計分析法。運用十分廣泛,回歸分析按照設計量的多少,分為一元回歸和多元回歸分析,按照因變量的多少,可分為簡單回歸分析和多重回歸分析,按照自變量和因變量的多少類型可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變量和因變量,且兩者關系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或倆個以上的自變量,且自變量之間存在線性相關,則稱為多重性回歸分析

嶺回歸的原理:嶺回歸的原理較為復雜。根據高斯馬爾科夫定理,多重相關性並不影響最小二乘估計量的無偏性和最小方差性,但是,雖然最小二乘法估計量在所有線性無偏估計量中是方差最小的,但是這個方差卻不一定最小。而實際上可以找一個有偏估計量,這個估計量雖然有微笑的偏差,但他的精度卻能夠大大高於無偏的估計量。嶺回歸分析就是依據這個原理,通過在正規方程中引入有偏常數而求得回歸估計量的,具體情況可以查閱資料。

對於有些矩陣,矩陣中某個元素的一個很小變動,會引起最後計算結果誤差很大,這種矩陣稱為病態矩陣。有些時候不正確的計算方法也會使一個正常的矩陣在運算中表現出病態。對於高斯消去法來說,如果主元上的元素很小,在計算時就會表現出病態的特征。

嶺回歸方程的平方值會稍低於普通回歸分析,但回歸技術的顯著性往往明顯高於普通回歸,在存在共線性的問題和病態數據偏多的研究中有較大的利用價值

嶺回歸的應用:在家禽育植的應用:討論了嶺回歸方法應用於混合線性模式方程組中估計家禽育植方法,其實質是將傳統的混合線性模型方程組理解為一種廣義嶺回歸估計,為確定遺傳參數的估計提供一種途徑,同時,以番鴨為例,考慮了一個性狀和兩個固定效應,采用廣義嶺回歸對公番鴨育植進行了估計,並與最佳線性無偏預測法進行了比較,結果表明,廣義嶺回歸方法和BLUP法估計的育種植及其排序極其相似,其相關系數和秩 相關系數分別達到了0.998和0.986,且采用廣義嶺回歸法預測的誤差率極低,表明在混合線性模型方程組中使用廣義嶺回歸估計動物育植方法具有可行性,並可省去估計遺傳參數的過程,使BLUP法在動物選育中的應用更具有實用性。

正向和反向相結合的衛星攝影數據模擬:衛星攝影數據仿真,通常采用正向模擬和反向模擬兩種方法。正向模擬方法簡單易行,無需替代計算,但地面點坐標在Y方向存在較大的差異,反向模擬可規避Y方向存在的差異問題,但必須基於已有的DEM數據,且DEM數據範圍要與外方位元素範圍基本一致,模擬數據受數據源條件制約。

參考文件

百度-----人大經濟論壇

百度------道客巴巴

火狐瀏覽器

R語言統計分析技術研究——嶺回歸技術的原理和應用