1. 程式人生 > >MMSE估計(二):從估計到估計器

MMSE估計(二):從估計到估計器

【本文內容摘自"Signals, Systems and Inferences"之"8.2-From Estimate to an Estimator", by Alan V.Oppenheim and George C.Verghese, 2010.】   上面我們得到對於特定的X=xX=x,有 y^(x)=E[YX=x].\hat y(x)={\rm E}\left[Y|X=x\right]. 然而,儘管XX是隨機變數,但其取值xx不是,因此y^(x)\hat y(x)也不是。   在我們進入更深入的討論時,我們有必要在估計隨機變數和實現估計的步驟間劃分出界限。這就好像對於函式的取值和函式本身進行區分。我們把產生估計的過程或者函式稱為估計器(estimator)。   我們用y

^(X)\hat y(X)來表示MMSE估計器,即 Y^=y^(X)=E[YX]. \hat Y=\hat y({\bf X})={\rm E}[Y|{\bf X}]. 注意這裡E[YX]{\rm E}[Y|{\bf X}]表示一個隨機變數,而非一個數值。   給定X{\bf X}時對Y的MMSE估計器將最小化MSE,這是由於MMSE估計器對於每個特定的值xx,都最小化MSE,即 EY,X([Yy^(X)]2)=EX{EY,X([Yy^(X)]2X)}=EY,X([Yy^(X)]2X=x)fX(x)dx. {\rm E}_{Y,{\bf X}}\left( [Y-\hat y({\bf X})]^2\right)={\rm E}_{{\rm X}}\left\{{\rm E}_{Y,{\bf X}}\left( [Y-\hat y({\bf X})]^2|{\bf X}\right)\right\}\\ =\int_{-\infty}^{\infty}{\rm E}_{Y,{\bf X}}\left( [Y-\hat y({\bf X})]^2|{\bf X=x}\right)f_{\bf X}({\bf x})d{\bf x}.
由於估計y^(x)\hat y({\bf x})對於XX的每個值都能夠最小化EYX{\rm E}_{Y|{\bf X}},因此也能夠最小化EX{\rm E}_{\bf X},因為fX(x)f_{\bf X}({\bf x})非負。

正交性   MMSE估計器的另外一個重要特性時殘留誤差Yy^(X)Y-\hat y({\rm X})與測量的隨機變數的任意函式h(X)h({\bf X})

正交,即 EY,X{[Yy^(X)]h(X)}=0.(1) {\rm E}_{Y,X}\{[Y-\hat y ({\bf X)}]h({\bf X})\}=0.\qquad \qquad (1) 因此 EY,X{y^(X)h(X)}=EY,X{Yh(X)}.(2) {\rm E}_{Y,X}\{\hat y ({\bf X)}h({\bf X})\}={\rm E}_{Y,X}\{Yh({\bf X})\}.\qquad \qquad (2) 特別地,選擇h(X)=1h({\bf X})=1,有 EY,X{y^(X)}=EY{Y}. {\rm E}_{Y,X}\{\hat y ({\bf X)}\}={\rm E}_{Y}\{Y\}. 因此,估計器被稱為無偏的(unbiased):它的期望值等於估計的隨機變數的期望值。我們可以用無偏性來理解(1),即MMSE估計器的估計誤差與用來構造估計器的隨機變數的任意函式都是無關的。 (2)的證明如下 EY,X{y^(X)h(X)}=EX[EYX(YX)h(X)}=EX[EYX[Yh(X)X}=EY,X{Yh(X)} {\rm E}_{Y,X}\{\hat y({\bf X})h({\bf X})\}={\rm E}_{X}[ {\rm E}_{Y|X}(Y|{\bf X})h({\bf X})\}\\={\rm E}_{X}[ {\rm E}_{Y|X}[Yh({\bf X})|{\bf X}\}={\rm E}_{Y,X}\{Yh({\bf X})\} 由此可以得到(1)中的正交性。