【機器學習】AIC、BIC準則

阿新 • • 發佈：2019-01-09

選擇最優模型的指導思想是從兩個方面去考察：一個是似然函式最大化，另一個是模型中的未知引數個數最小化。似然函式值越大說明模型擬合的效果越好，但是我們不能單純地以擬合精度來衡量模型的優劣，這樣回導致模型中未知引數越來越多，模型變得越來越複雜，會造成過擬合。所以一個好的模型應該是擬合精度和未知引數個數的綜合最優化配置。

AIC準則

AIC準則是由日本統計學家Akaike與1973年提出的，全稱是最小化資訊量準則（Akaike Information Criterion）。它是擬合精度和引數個數的加權函式：
AIC=2（模型引數的個數）-2ln（模型的極大似然函式）

BIC準則

AIC為模型選擇提供了有效的規則，但也有不足之處。當樣本容量很大時，在AIC準則中擬合誤差提供的資訊就要受到樣本容量的放大，而引數個數的懲罰因子卻和樣本容量沒關係（一直是2），因此當樣本容量很大時，使用AIC準則選擇的模型不收斂與真實模型，它通常比真實模型所含的未知引數個數要多。BIC（Bayesian InformationCriterion）貝葉斯資訊準則是Schwartz在1978年根據Bayes理論提出的判別準則，稱為SBC準則(也稱BIC)，彌補了AIC的不足。SBC的定義為：
BIC = ln(n)(模型中引數的個數) - 2ln(模型的極大似然函式值)

小結

在進行ARMA引數的選擇是，AIC準則和BIC準則的提出可以有效彌補根據自相關圖和偏自相關圖定階的主觀性，在有限的階數範圍內幫助我們尋找相對最優擬合模型

【機器學習】AIC、BIC準則

AIC準則

BIC準則

小結

【機器學習】AIC、BIC準則

【機器學習】資訊、資訊熵、資訊增益、增益率及基尼係數的概念總結

【機器學習】最容易實現的基於OpenCV的人臉檢測程式碼、檢測器及檢測效果

【機器學習】先驗概率、似然函式、後驗概率、對數似然函式等概念的理解

【機器學習】【線性代數】正交基、標準正交基、正交矩陣，正交變換等數學知識點

【機器學習】過擬合、欠擬合與正則化

【機器學習】演算法模型效能中的偏差、方差概念

【機器學習】決策樹（下)CART演算法分類樹、迴歸樹

【機器學習】C++與OpenCV、Tensorflow-python聯合呼叫

【機器學習】機器學習（十二、十三）：K-means演算法、高斯混合模型

【機器學習】兩分佈間距離的度量：MMD、KL散度、Wasserstein 對比

【機器學習】分類效能度量指標 : ROC曲線、AUC值、正確率、召回率、敏感度、特異度

【機器學習】先驗概率、後驗概率、貝葉斯公式、似然函式

【機器學習】決策樹（三）——生成演算法（ID3、C4.5與CRAT）

【機器學習】關於t-sne：降維、視覺化

【機器學習】聚類演算法：層次聚類、K-means聚類

【機器學習】交叉驗證、正則化例項Python程式碼實現

【機器學習】最近鄰演算法KNN原理、流程框圖、程式碼實現及優缺點

【機器學習】K-Means演算法的原理流程、程式碼實現及優缺點

【機器學習】隨機森林 Random Forest 得到模型後，評估參數重要性

【機器學習】AIC、BIC準則

AIC準則

BIC準則

小結

相關推薦