1. 程式人生 > >機器學習入門(二) — 迴歸模型 (理論)

機器學習入門(二) — 迴歸模型 (理論)

講述了迴歸模型的基本原理和演算法,並結合迴歸介紹了交叉驗證的方法
近期房屋的銷售情況圖示(過去兩年)

1 預測房價

1.1 通過相似的房子預測你的房子


2 線性迴歸

2.1 應用線性迴歸模型



那麼哪條線才是最好的呢?

2.2 應用一條線的成本

2.3 預測你的房價

3 加入更高階的因素

3.1 用直線擬合房價或者...?

3.2 如果用二次函式怎麼樣?

3.3 更高階的多項式

4 你相信這個模型嗎?

顯然,相比二次函式並不好!!!
過擬合

5 通過訓練-測試分離來評估過擬合

你相信這個擬合嗎?

二次函式怎麼樣呢

如何選擇模型階數 / 複雜度

訓練 / 測試分離

  • 訓練集
    用於模型構建
  • 測試集
    用於檢測模型構建,此資料只在模型檢驗時使用,用於評估模型的準確率

訓練誤差

  • 藍色點為訓練集資料

測試誤差

6 訓練測試曲線

7 加入新的特徵

僅僅通過房屋大小預測

加入其他的特徵

應該選擇多少特徵

8 其他迴歸示例

薪資預測


股票預測

微博流行度

智慧房屋

9 迴歸總結

機器學習流水線