機器學習之路： python線性回歸過擬合 L1與L2正則化

阿新 • • 發佈：2018-05-06

擬合 python sco bsp orm AS score 未知數 spa

git：https://github.com/linyi0604/MachineLearning

正則化：
    提高模型在未知數據上的泛化能力
    避免參數過擬合
正則化常用的方法：
    在目標函數上增加對參數的懲罰項
    削減某一參數對結果的影響力度

L1正則化：lasso
    在線性回歸的目標函數後面加上L1範數向量懲罰項。
    
    f = w * x^n + b + k * ||w||1 
    
    x為輸入的樣本特征
    w為學習到的每個特征的參數
    n為次數
    b為偏置、截距
    ||w||1 為 特征參數的L1範數，作為懲罰向量
    k 為懲罰的力度

L2範數正則化：ridge
    在線性回歸的目標函數後面加上L2範數向量懲罰項。
    
    f = w * x^n + b + k * ||w||2 
    
    x為輸入的樣本特征
    w為學習到的每個特征的參數
    n為次數
    b為偏置、截距
    ||w||2 為 特征參數的L2範數，作為懲罰向量
    k 為懲罰的力度
        
        
下面模擬 根據蛋糕的直徑大小 預測蛋糕價格
采用了4次線性模型，是一個過擬合的模型
分別使用兩個正則化方法 進行學習和預測

 1 from sklearn.linear_model import LinearRegression, Lasso, Ridge
 2 # 導入多項式特征生成器
 3 from sklearn.preprocessing import PolynomialFeatures
 4 
 5 
 6 ‘‘‘
 7 正則化：
 8     提高模型在未知數據上的泛化能力
 9     避免參數過擬合
10 正則化常用的方法：
11     在目標函數上增加對參數的懲罰項
12     削減某一參數對結果的影響力度
13 
14 L1正則化：lasso
15     在線性回歸的目標函數後面加上L1範數向量懲罰項。
 
16     
17     f = w * x^n + b + k * ||w||1 
18     
19     x為輸入的樣本特征
20     w為學習到的每個特征的參數
21     n為次數
22     b為偏置、截距
23     ||w||1 為 特征參數的L1範數，作為懲罰向量
24     k 為懲罰的力度
25 
26 L2範數正則化：ridge
27     在線性回歸的目標函數後面加上L2範數向量懲罰項。
28     
29     f = w * x^n + b + k * ||w||2 
30     
31     x為輸入的樣本特征
32     w為學習到的每個特征的參數
 
33     n為次數
34     b為偏置、截距
35     ||w||2 為 特征參數的L2範數，作為懲罰向量
36     k 為懲罰的力度
37         
38         
39 下面模擬 根據蛋糕的直徑大小 預測蛋糕價格
40 采用了4次線性模型，是一個過擬合的模型
41 分別使用兩個正則化方法 進行學習和預測
42 
43 ‘‘‘
44 
45 # 樣本的訓練數據，特征和目標值
46 x_train = [[6], [8], [10], [14], [18]]
47 y_train = [[7], [9], [13], [17.5], [18]]
48 # 準備測試數據
49 x_test = [[6], [8], [11], [16]]
50 y_test = [[8], [12], [15], [18]]
51 # 進行四次線性回歸模型擬合
52 poly4 = PolynomialFeatures(degree=4)  # 4次多項式特征生成器
53 x_train_poly4 = poly4.fit_transform(x_train)
54 # 建立模型預測
55 regressor_poly4 = LinearRegression()
56 regressor_poly4.fit(x_train_poly4, y_train)
57 x_test_poly4 = poly4.transform(x_test)
58 print("四次線性模型預測得分:", regressor_poly4.score(x_test_poly4, y_test))  # 0.8095880795746723
59 
60 # 采用L1範數正則化線性模型進行學習和預測
61 lasso_poly4 = Lasso()
62 lasso_poly4.fit(x_train_poly4, y_train)
63 print("L1正則化的預測得分為：", lasso_poly4.score(x_test_poly4, y_test))  # 0.8388926873604382
64 
65 # 采用L2範數正則化線性模型進行學習和預測
66 ridge_poly4 = Ridge()
67 ridge_poly4.fit(x_train_poly4, y_train)
68 print("L2正則化的預測得分為：", ridge_poly4.score(x_test_poly4, y_test))  # 0.8374201759366456

通過比較經過正則化的模型泛化能力明顯的更好啦

機器學習之路： python線性回歸過擬合 L1與L2正則化

擬合 python sco bsp orm AS score 未知數 spa git：https://github.com/linyi0604/MachineLearning 正則化：提高模型在未知數據上的泛化能力避免參數過擬合正則化常用的方法：在目

機器學習之路：python支持向量機回歸SVR 預測波士頓地區房價

sta val dict min shape 支持 RR 訓練數據采樣 python3 學習使用api 支持向量機的兩種核函數模型進行預測 git: https://github.com/linyi0604/MachineLearning from sklear

機器學習之路： python 樸素貝葉斯分類器預測新聞類別

groups group news ckey put epo test electron final 使用python3 學習樸素貝葉斯分類api 設計到字符串提取特征向量歡迎來到我的git下載源代碼: https://github.com/linyi0604/kag

機器學習之路： python 支持向量機手寫字體識別

1.0 tar 下載分類字體 ID 導入所有 load 使用python3 學習sklearn中支持向量機api的使用可以來到我的git下載源代碼：https://github.com/linyi0604/kaggle 1 # 導入手寫字體加載器 2

機器學習之路：python 特征降維主成分分析 PCA

repo nts total python learning bsp ota spa 像素 python3 學習api使用主成分分析方法實現降低維度使用了網絡上的數據集，我已經下載到了本地，可以去我的git上參考 git:https://github.com/lin

機器學習之路： python 實踐 word2vec 詞向量技術

fetch 分離 ext .com work bsp re.sub 最終 mat git: https://github.com/linyi0604/MachineLearning 詞向量技術 Word2Vec 每個連續詞匯片段都會對後面有一定制約稱為上下

機器學習之路： python 實踐提升樹 XGBoost 分類器

git mac class form 樹模型機器 AS sta imp git: https://github.com/linyi0604/MachineLearning 數據集被我下載到本地，可以去我的git上拿數據集 XGBoost提升分類器屬於集成學習模型

20171028機器學習之線性回歸過擬合問題的解決方案

ces 函數彈性 alpha mach rom 定性 ast cep 在函數中加入一個正則項：三種方式：一、Ridge回歸（嶺回歸）：　　優點：具有較高的準確性、魯棒性以及穩定性　　缺點：求解速度慢二、Lasso回歸：　　優點：求解速度快（原理降維計算

機器學習之路： tensorflow 自定義損失函數

cond pre port var IV 學習 col float ria git: https://github.com/linyi0604/MachineLearning/tree/master/07_tensorflow/ 1 import tensor

機器學習之路的Python基礎篇2

@theme print格式化輸出 @author lz @time 2018/11/25 apple_price=float(input(“請輸入價格”))#因為input中輸入的是系統預設為字串 apple_number=float(input(“蘋果的數量”)

sklearn的機器學習之路：樸素貝葉斯

1. 基礎概念什麼是樸素貝葉斯：貝葉斯分類是一類分類演算法的總稱，這類演算法均以貝葉斯定理為基礎，故統稱為貝葉斯分類。而樸素樸素貝葉斯分類是貝葉斯分類中最簡單，也是常見的一種分類方法。貝葉斯公式

2016 機器學習之路：一年從無到有掌握機器學習

【新智元導讀】程式設計師 Per Harald Borgen 在 Medium 刊文，介紹了他在一年的時間裡，從入門到掌握機器學習的歷程。Borgen 表示，即使沒有博士學位和高深的數學造詣也能掌握機器學習。這一點相信對不少人都挺有吸引力和啟發。不過，博士學位或許真的並非

機器學習理論（一）——線性回歸

隨機 .cn 過程小寫找到想想每次回歸所在（一）單變量線性回歸。舉個例子來說，假如你要在北京的五環路租房，要預測房子的價格，其中一個比較顯著的特征就是房子的面積，根據不同的房間的面積來預測租金是多少。於是你就可以構建一個模型橫軸是房間面積，縱軸是租金

吳恩達機器學習筆記 —— 5 多變量線性回歸

擬合進行 image 價格常用從表 cnblogs 優化深度本篇主要講的是多變量的線性回歸，從表達式的構建到矩陣的表示方法，再到損失函數和梯度下降求解方法，再到特征的縮放標準化，梯度下降的自動收斂和學習率調整，特征的常用構造方法、多維融合、高次項、平方根，最後基

吳恩達機器學習筆記8-多變量線性回歸(Linear Regression with Multiple Variables)--多維特征

學習筆記機器增加都是維度能夠因此表示轉置　　我們探討了單變量/特征的回歸模型，現在我們對房價模型增加更多的特征，例如房間數樓層等，構成一個含有多個變量的模型，模型中的特征為(??1, ??1, . . . , ????)。　　增添更多特征後，我們引入一

機器學習---最小二乘線性回歸模型的5個基本假設（Machine Learning Least Squares Linear Regression Assumptions）

成員 toc 我們假設 depend element 產生 log bsp 在之前的文章《機器學習---線性回歸（Machine Learning Linear Regression）》中說到，使用最小二乘回歸模型需要滿足一些假設條件。但是這些假設條件卻往往是人們容易忽略

斯坦福大學公開課機器學習： advice for applying machine learning | regularization and bais/variance（機器學習中方差和偏差如何相互影響、以及和算法的正則化之間的相互關系）

交叉來講相對同時 test 如果開始遞增相互算法正則化可以有效地防止過擬合, 但正則化跟算法的偏差和方差又有什麽關系呢？下面主要討論一下方差和偏差兩者之間是如何相互影響的、以及和算法的正則化之間的相互關系假如我們要對高階的多項式進行擬合，為了防止過擬合現象

【通俗易懂】機器學習中 L1 和 L2 正則化的直觀解釋

機器學習中，如果引數過多，模型過於複雜，容易造成過擬合（overfit）。即模型在訓練樣本資料上表現的很好，但在實際測試樣本上表現的較差，不具備良好的泛化能力。為了避免過擬合，最常用的一種方法是使用使用正則化，例如 L1 和 L2 正則化。但是，正則化項是如

機器學習筆記（二）L1，L2正則化

2.正則化 2.1 什麼是正則化？ (截自李航《統計學習方法》) 常用的正則項有L1，L2等，這裡只介紹這兩種。 2.2 L1正則項 L1正則，又稱lasso，其公式為： L1=α∑kj=1|θj| 特點：約束θj的大小，並且可以產

SVM支援向量機系列理論（七）線性支援向量機與L2正則化 Platt模型

7.1 軟間隔SVM等價於最小化L2正則的合頁損失上一篇說到， ξi ξ i \xi_i 表示偏離邊界的度量，若樣本點

機器學習之路： python線性回歸 過擬合 L1與L2正則化

相關推薦

機器學習之路： python線性回歸過擬合 L1與L2正則化