>  翻譯總結By joey周琦

參考NG的lecture note1 part3
本文將首先簡單介紹指數族分佈，然後介紹一下廣義線性模型（generalized linear model, GLM), 最後解釋了為什麼邏輯迴歸（logistic regression, LR) 是廣義線性模型的一種。

指數族分佈

指數族分佈 (The exponential family distribution),區別於指數分佈（exponential distribution)。在概率統計中，若某概率分佈滿足下式，我們就稱之屬於指數族分佈。

p (y; η) = b (y) \exp (η^{T} T (y) - a (η))

其中 $η$ 是natural parameter, $T (y)$ 是充分統計量, $\exp^{- a (η))}$ 是起到歸一化作用。確定了 $T, a, b$ ,我們就可以確定某個引數為 $η$ 的指數族分佈.
統計中很多熟悉的概率分佈都是指數族分佈的特定形式，如伯努利分佈，高斯分佈，多項分佈（multionmal), 泊松分佈等。下面介紹其中的伯努利分佈和高斯分佈。

伯努利分佈
$p (y; ϕ) = ϕ^{y} (1 - ϕ)^{1 - y} = e x p [y \log ϕ + (1 - y) \log (1 - ϕ)] = e x p [y \log \frac{ϕ}{1 - ϕ} + l o g (1 - ϕ)]$
把伯努利分佈可以寫成指數族分佈的形式，且
$T (y) = y η = \log \frac{ϕ}{1 - ϕ} a (η) = - \log (1 - ϕ) = \log (1 + e^{η}) b (y) = 1$
同時我們可以看到 $ϕ = \frac{1}{1 + e^{- η}}$ , 居然是logistic sigmoid的形式，後面在討論LR是廣義線性模型時，也會用到。

高斯分佈

高斯分佈也可以寫為指數族分佈的形式如下：

p (y; μ) = \frac{1}{\sqrt{2 π}} \exp (- \frac{1}{2} (y - μ)^{2}) = \frac{1}{\sqrt{2 π}} \exp (- \frac{1}{2} y^{2}) \exp (μ y - \frac{1}{2} μ^{2})

我們假設方差為1，當然不為1的時候也是可以推導的。上述我們就把高斯分佈寫為了指數族分佈的形式，對應的

η = μ T (y) = y a (η) = μ^{2} / 2 = η^{2} / 2 b (y) = \frac{1}{\sqrt{2 π}} \exp (- \frac{1}{2} y^{2})

廣義線性模型 (Generalized linear model, GLM)

本節將講述廣義線性模型的概念，以及LR,最小二乘為何也屬於廣義線性模型。

考慮一個分類或迴歸問題，我們就是想預測某個隨機變數 $y$ ， $y$ 是某些特徵(feature) $x$ 的函式。為了推導廣義線性模式，我們必須做出如下三個假設

機器學習演算法之：指數族分佈與廣義線性模型

指數族分佈

高斯分佈

廣義線性模型 (Generalized linear model, GLM)

機器學習演算法之：指數族分佈與廣義線性模型

用Python開始機器學習（3：資料擬合與廣義線性迴歸）

機器學習演算法之：決策樹 (decision trees)

機器學習演算法之：邏輯迴歸 logistic regression (LR)

機器學習演算法之：分類演算法概述

機器學習演算法之七：5分鐘上手SVM

機器學習演算法之二：5分鐘上手K-Means

機器學習演算法之KNN

機器學習演算法之正則化

機器學習演算法之CART（分類和迴歸樹）

機器學習演算法之樸素貝葉斯（Naive Bayes）--第二篇

機器學習（十）——指數族（The exponential family）

機器學習演算法之邏輯迴歸以及python實現

機器學習演算法二：詳解Boosting系列演算法一Adaboost

機器學習演算法之隨機森林

【機器學習演算法】：提升樹（Boosting tree）

機器學習演算法之隨機森林（1）pyspark.mllib中的RF

機器學習演算法之分類

機器學習演算法之SVM的多分類

機器學習演算法之樸素貝葉斯（Naive Bayes）--第一篇