機器學習_論文筆記_2: bagging predictors （ BREIMAN[1996]）

阿新 • • 發佈：2018-12-17

By joey周琦

Bagging predictor可以產生多個版本的predictor, 並把這些predictor聚集(aggregate)為一個。這種策略對於不穩定的系統可以提高其精度。

有一個學習資料集 $L$ ，包含資料 ${(y_n,x_n),n=1,\dots,N}$ ,其中 $x$ 為輸入向量， $y$ 或者為一個類（分類問題）或者數值（迴歸問題）。我們可以從資料集 $L$ 中學到一個predictor φ

(x,L) $\varphi(x,L)$ .

假設現在我們有一系列資料集合 ${L_k}$ , 每個集合都有 $N$ 個訓練資料，並且都來自與資料集 $L$ 相同的概率分佈。那麼明顯我們可以得到一系列的predictor $\varphi(x,L_k)$ . 如何利用 ${L_k}$ 來得到一個比”單一資料集 $L$ 得到的predictor”更好的predictor呢？

對於迴歸問題：

φA(x)=ELkφ(x,Lk)

$\varphi_A(x) = E_{L_k}\varphi(x,L_k)$
對於分類問題，通過投票選擇出初測最多的那個。

但是一般情況下，我們只有一個數據集 $L$ , 如何得到一些列的資料集 $L_k$ 並且和 $L$ 服從相同分佈呢？利用bootstrap 從 $L$ 進行有放回的取樣(random sampling with replace ment)的到一些列資料集 ${L^B}$ ,再通過上面的方法聚集出一個預測器. 我們稱這個過程為”bootstrap aggregating”,組合起來就稱為”bagging”

bagging可以提高“不穩定的演算法”精度
- 這裡的不穩定表示，資料集 $L$ 小幅度的改變，就可能大幅度改變predictor $\varphi(x,L)$ .(詳見Breiman[1994])
- 不穩定的演算法有神經網路，分類樹，迴歸樹等
- 穩定的演算法有KNN
bagging可能會降低“穩定演算法”的精度
bagging可以減少variance, 但是會小幅度提高bias

機器學習_論文筆記_2: bagging predictors （ BREIMAN[1996]）

機器學習_論文筆記_2: bagging predictors （ BREIMAN[1996]）

機器學習_論文筆記_1: A few useful things to know about machine learning

Python機器學習全流程專案實戰精講（2018版）

機器學習演算法之樸素貝葉斯（Naive Bayes）--第二篇

Python機器學習演算法實踐——k均值聚類（k-means）

和機器學習和計算機視覺相關的數學（from LinDahua）

機器學習演算法之樸素貝葉斯（Naive Bayes）--第一篇

基於python的機器學習人工智慧入門之tensorflow / keras安裝（Windows環境）

機器學習公開課筆記第九周之大數據梯度下降算法

機器學習_路徑

機器學習基礎概念筆記

廣義線性模型 - Andrew Ng機器學習公開課筆記1.6

有關機器學習的論文中的英語詞匯

ng機器學習視頻筆記（五） ——過擬合與正則化

ng機器學習視頻筆記（六） ——神經網絡基礎

ng機器學習視頻筆記（一）——線性回歸、代價函數、梯度下降基礎

ng機器學習視頻筆記（二） ——梯度下降算法解釋以及求解θ

ng機器學習視頻筆記（十一） ——K-均值算法理論

ng機器學習視頻筆記（四） ——logistic回歸

ng機器學習視頻筆記（十六） ——從圖像處理談機器學習項目流程

機器學習_論文筆記_2: bagging predictors （ BREIMAN[1996]）

相關推薦