1. 程式人生 > >一元線性迴歸的詳解及其Spss和Java的實現 之 理論說明

一元線性迴歸的詳解及其Spss和Java的實現 之 理論說明

不要過於教條地對待研究的結果,尤其當資料的質量受到懷疑時。

本文主要對統計學中最常見的一元線性迴歸內容進行系統全面的講解,以及相應案例的Excel Spss 和Java的相關實現。
準備知識 : 對概率中隨機變數的期望、方差、協方差、和相關係數的定義、性質和簡單的計算。可參考期望,方差,協方差及相關係數
[註釋:]上述參考文件中在性質3中線性組合的方差中書寫錯誤: 正確如下:

var(ax+by)=a2var(x)+b2var(y)+2abcov(x,y).
參考資料 :賈俊平統計學第6版.

一元線性迴歸內容詳解

1.1 變數間的關係

變數與變數之間的關係呢可以分為兩種:
(1)函式關係;
(2)相關關係;
函式關係:

設有兩個變數xy,變數y隨變數x一起變化,並完全依賴於x,也就是,當x取某個值時,y依確定的關係取相應的值,則稱yx的函式:y=f(x), x為自變數,y為因變數。
相關關係 :當變數之間的這種確定關係變為不確定的數量關係,就是相關關係。
相關關係的特點:一個變數的取值並不能由另一個變數唯一確定,當變數x取某個值時,變數y的取值可能有幾個。對這種關係的不確定性沒法用函式關係來表示,但也不是無任何規律可尋。

1.2 相關關係的描述和測度

相關分析要解決的問題:
(1)變數之間是否存在關係;
(2)如果存在關係,他們之間是什麼樣的關係;
(3)他們之間的關係強度如何;
(4)如何確定用樣本所反映的變數之間的關係可以代替總體變數之間的關係。
前提假設:


(1)兩個變數之間是線性關係;
(2)兩個變數都是隨機變數。
步驟 :
(1)繪製散點圖來判斷變數之間的關係形態,如果是線性關係,可以用相關係數來測度兩個變數的關係強度。
(a)正線性相關;
(b)負線性相關;
(c)完全正線性相關;
(d)完全負線性相關;
(e)非線性相關;
(f)不相關。
(2)對相關係數進行顯著性檢驗,以判斷樣本所反映的關係能否用來代表兩個變數總體上的關係。
總體相關係數 ρ :根據總體資料計算的,稱為總體相關係數;
樣本相關係數 r
:根據樣本的資料計算的,稱為樣本相關係數;
樣本相關係數計算公式 :

r=(xx¯)(yy¯)(xx¯)2(yy¯)2
公式簡化:
r=(xx¯)(yy¯)(xx¯)2(yy¯)2=(xyx¯yyx¯+x¯y¯)(x2+x¯22xx¯)(y2+y¯22yy¯)=xyx¯yy¯x+x¯y¯x2+x¯22x¯xy2+