1. 程式人生 > >對面板資料模型中的一些理解

對面板資料模型中的一些理解

一、我對幾種面板資料模型的理解

1 混合效應模型  pooled model

    就是所有的省份,都是相同,即同一個方程 ,截距項和斜率項都相同

yit=c+bxit+ᵋit     c 與b 都是常數

2 固定效應模型fixed-effect model  和隨機效應模型random-effects model

   就是所有省份,既有相同的部分,即斜率項都相同;也有不同的部分,即截距項不同。

    2.1 固定效應模型  fixed-effect model

yit=ai+bxit+ᵋit  cov(ci,xit)≠0

   固定效應方程隱含著跨組差異可以用常數項的不同刻畫。每個a

i都被視為未知的待估引數。xit中任何不隨時間推移而變化的變數都會模擬因個體而已的常數項

    2.2 隨機效應模型  random-effects model

yit=a+ui+bxit+ᵋit  cov(a+ui,xit)=0

   A是一個常數項,是不可觀察差異性的均值,ui為第i個觀察的隨機差異性,不隨時間變化。

3 變係數模型Variable Coefficient Models(變係數也分固定效應和隨機效應)

    每一個組,都採用一個方程進行估計。就是所有省份的線性迴歸方程的截距項和斜率項都不相同。

yit=ui+bixit+ᵋit

    1.混合估計模型就是各個截面估計方程的截距和斜率項都一樣,也就是說迴歸方程估計結果在截距項和斜率項上是一樣的。如果是考察各個省份,歷年的收入對消費影響。則各個省份的迴歸方程就完全相同,無論是截距,還是斜率。

    2.隨機效應模型和固定效應模型在斜率項都是相同的,都是截距項不同。區別在於截距項和自變數是否相關,不相關選擇隨機效應模型,相關選擇固定效應模型。則說明各個省份的迴歸方程,斜率相同,差別的是截距項,即平移項。

    3 .變係數模型,就是無論是截距項,還是係數項,對於不同省份,每個省份都有一個迴歸方程,都一個最適合自己的迴歸方程,完全不管整體。每個省份的迴歸方程與其他省份的,無論在斜率上,還是截距上都不相同。

    總之,從混合估計模型,到變截距模型,再到變係數模型,考察省份是從完全服從整體和沒有個性(迴歸方程是從整體角度而定的和估計的,是一刀切的,是完全沒有差異性和個性的,完全犧牲自我),到隨心所欲和完全個性化(每個省份都有一個最適合自己的迴歸方程)。即從完全無個性而言到完全有個性

 二、一個做醫學哥們在固定效用模型和隨機效用模型選擇中的甄別方法

關於隨機效應模型及固定效應模型的選擇,一貫做法是兩個模型都分析,看結果是否一致。如果一致且異質性較小或無,則選擇固定效應模型。 如果結果不一致且異質性較大,則選擇隨機效應模型,並進行亞組分析尋找異質性的來源,並且下結論應比較保守好幾篇meta-analysis在方法學部分都說:“All pooled outcome measures were determined usingrandom-effects models” 、"All pooled outcome measures were determined usingrandom-effects models as described by DerSimonian and Laird"。 為什麼都直接用隨機效應模型卻不用固定效應模型?是因為考慮RCTs異質性大,所以直接用隨機效應模型嗎? 1.就是根據12值來決定模型的使用,大部分認為>50%,存在異質性,使用隨機效應模型,≤50%,用固定,有了異質性,通過敏感性分析,或者亞亞組分析,去探求異質性的來源,但是這兩者都是定性的,不一定能找到,即使你做了,研究數目多的話,可以做個meta迴歸來找異質性的來源 2.在任何情況下都使用隨機效應模型,因為如果異質性很小,那麼隨即和固定效應模型最終合併結果不會有很大差別,當異質性很大時,就只能使用隨機效應模型,所以可以說,在任何情況下都使用隨機效應模型 3.還有一種,看P值,一般推薦P的界值是0.1,但現在大部分使用0.05,就是說P>0.05,用固定,≤0.05用隨機 其實個人偏向於第三種,因為P值可以看出來有沒有異質性,I2是定量描述一致性的大小

本來隨機效應的假設就是我們的樣本從一個很大的母體抽取,所以大家的期望(均值)相同;如果我們的樣本幾乎是全部母體了,我們就不能說個體的差異是隨機的,所以固定效應比較好;這是從模型的設定角度說的。但是隨機效應模型有一個致命的硬傷,就是假設cov(x,ui)=0,而固定效應不要求這個假設,Hausman檢驗所做的工作就是檢驗一下這個假設對隨機效應模型來說是不是成立,如果不成立,隨即效應模型的估計是有偏的,即使採用B-P的LM檢驗表明存在隨機效應,你也沒有辦法用了。

總結:檢驗固定效應是否顯著,採用F檢驗(對比模型是pooled)檢驗隨機效應是否顯著,採用LM檢驗(對比模型也是pooled)檢驗固定和隨機哪個更適用,採用Hausman檢驗(對比fe和be)

1 用eviews可以檢驗面板資料適用於混合估計法還是固定效應法

2 然後再進行豪斯曼檢驗,確定是用固定效應模型還是隨機效應模型

三、是選擇固定效應模型,還是隨機效應模型的Hausman test

    Hausman test 是為了區分是選擇固定效應模型,還是選擇隨機效應模型的計算。並且Hausman test 是針對隨機效應模型進行的檢驗,原假設是接受隨機效應模型。

   A Hausman test說明一個有效的估計與它和一個非有效的估計之差的協方差是0。即Cov(b-b,b)=Cov(b,b)-var(b)=0

   B 原假設是隨機效應模型有效,備選假設是固定效應模型有效

C 根據隨機效應模型有效構造的統計量W服從自由度為k-1的有限卡方分佈。即var(b-b)=var(b)-var(b)=W

四、處理異方差問題

實際上,在處理面板資料線性迴歸時,主要考慮固定效應模型與pooled OLS的異方差問題因為隨機效應模型使用GLS估計,本身就已經控制了異方差。

GLS(廣義最小二乘法)是一種常見的消除異方差的方法.它的主要思想是為解釋變數加上一個權重,從而使得加上權重後的迴歸方程方差是相同的.因此在GLS方法下我們可以得到估計量的無偏和一致估計,並可以對其進行OLS下的t檢驗和F檢驗.