logistic迴歸與正則化

阿新 • • 發佈：2019-01-10

常用損失函式

0-1損失函式
一般用於分類。
平方損失
一般用於迴歸，假設誤差項服從高斯分佈，有極大似然估計可推出平方損失函式。
平方損失函式對異常值敏感，絕對損失函式以及Huber損失函式對異常值魯棒
以下是Huber損失函式
絕對損失
對數損失或對數似然損失
合頁損失函式（hinge loss）
一般用於分類

邏輯迴歸損失函式

邏輯迴歸的損失函式、代價函式以及目標函式如下圖所示：
這裡寫圖片描述
邏輯迴歸的損失函式可以從兩個角度分析：
1. 極大似然
2. 交叉熵
如下圖所示：

引數估計

極大似然估計
適用於不含隱變數，以最小化經驗風險函式為目標函式。

最大後驗估計（貝葉斯）、
適用於不含隱變數，以最小化經驗風險函式和結構風險函式為目標函式的引數求解，即含有正則化項的目標函式。
EM估計
適用於含有隱變數的模型引數求解，直觀理解，k-means過程，將聚類類別個數和各類中心點最為隱變數，賦初值給隱變數，將資料聚成P類，計算P類新的中心點，有該新的中心點進行下一輪的求解計算。

模型選擇方法

正則化
交叉驗證

過擬合，欠擬合

過擬合：對已知資料建模效果好，對未知資料建模效果不好。
欠擬合：對已知資料和未知資料建模效果都不好。

邏輯斯蒂迴歸

對數機率線性迴歸
求解給定例項（實數）x情況下，求該例項屬於不同類別的概率，並將概率較大的類別定義為例項x應屬於的類別。

利用sigmoid分佈函式求解例項x的條件概率分佈。
可做二分類和多分類，模型簡單，可解釋性好，是一種廣義線性模型，方便做大規模分散式計算。
損失函式為對數損失函式，優化目標函式為交叉熵即：
可用極大似然估計求解模型引數。
梯度下降跟新引數：

優化目標函式對引數的導數為：
有多種模型調整方式，方便做模型維護，增加特徵數，加正則化項，對於非線性性可分，可進行特徵融合等處理方式，另外對二值特徵有較好的表現。
模型輸出為概率，可做分類和排序，模型結果易於解釋。
連續特徵二值化，onehot編碼的好處對於logistic迴歸來說：
1）引入非線性化，形成特徵交叉
2）增加模型魯棒性，穩定性，即對異常輸入不敏感。
3）稀疏向量內積乘法運算速度快，計算結果方便儲存，容易scalable（擴充套件）。

L1、L2、L0正則化

L0正則化的值是模型引數中非零引數的個數。
L1正則化表示各個引數絕對值之和。
L2正則化標識各個引數的平方的和的開方值。

L1正則假設引數的先驗分佈是Laplace分佈，可以保證模型的稀疏性，也就是某些引數等於0；
L2正則假設引數的先驗分佈是Gaussian分佈，可以保證模型的穩定性，也就是引數的值不會太大或太小；
在實際應用過程中，L1會趨向於產生少量的特徵，而其他的特徵都是0，而L2會選擇更多的特徵，這些特徵都會接近於0。Lasso在特徵選擇時候非常有用，而Ridge就只是一種規則化而已。在所有特徵中只有少數特徵起重要作用的情況下，選擇Lasso比較合適，因為它能自動選擇特徵。而如果所有特徵中，大部分特徵都能起作用，而且起的作用很平均，那麼使用Ridge也許更合適。

logistic迴歸與正則化

常用損失函式 0-1損失函式一般用於分類。平方損失一般用於迴歸，假設誤差項服從高斯分佈，有極大似然估計可推出平方損失函式。平方損失函式對異常值敏感，絕對損失函式以及Huber損失函式對

Stanford機器學習第三週：邏輯迴歸與正則化

一、邏輯迴歸 1.1 分類問題判斷一封電子郵件是否是垃圾郵件；判斷一次金融交易是否是欺詐；判斷腫瘤是惡性的還是良性的等屬於分類問題。 Eg:預測病人的腫瘤是惡性（malignant）還是良性（benign）,用線性迴歸的方法擬合一條直線如圖當hθ大於等於0.5時，預測 y

Machine Learning--week3 邏輯迴歸函式(分類)、決策邊界、邏輯迴歸代價函式、多分類與(邏輯迴歸和線性迴歸的)正則化

Classification It's not a good idea to use linear regression for classification problem. We can use logistic regression algorism, which is a classificati

TensorFlow 過擬合與正則化(regularizer)

sdn 就是 one 方式 regular logs none 使用 log 所謂過擬合，就是當一個模型過於復雜後，它可以很好的處理訓練數據的每一個數據，甚至包括其中的隨機噪點。而沒有總結訓練數據中趨勢。使得在應對未知數據時錯誤裏一下變得很大。這明顯不是我們要的結果。我們

ng機器學習視頻筆記（五） ——過擬合與正則化

哪些重復關註 osi 現實 regular 鏈接梯度下降簡單 ng機器學習視頻筆記（五） ——過擬合與正則化（轉載請附上本文鏈接——linhxx）一、過擬合和欠擬合 1、概念當針對樣本集和特征值，進行預測的時候，推導θ、梯度下降等，都在

吳恩達機器學習 - 邏輯迴歸的正則化吳恩達機器學習 - 邏輯迴歸的正則化

原吳恩達機器學習 - 邏輯迴歸的正則化 2018年06月19日 15:07:25 離殤灬孤狼閱讀數：181 更多

《機器學習》筆記---2 模型的損失函式與正則化

損失函式度量模型一次預測的好壞 L( Y，f(X) ) 常見型別：期望風險（風險函式）度量平均意義下的模型預測的好壞，即損失函式的期望。（關於聯行分佈的期望，未知，無法直接計算）經驗風險模型關於訓練

機器學習：偏差、方差與正則化

1. 偏差和方差 1.1 偏差通俗的講，偏差反映的模型學習的好壞程度或者捕捉訓練集主要特徵的能力大小。偏差大意味著學習不夠充分，主要特徵沒有捕捉到；偏差小意味著學習充分，捕捉到了訓練集中的主要特徵，當然這也存在過擬合的風險。 &

【A】機器學習過擬合與正則化

過擬合問題預測房價的模型：第一張圖對該資料做線性迴歸，可以獲得擬合數據的這樣一條直線，實際上這並不是一個很好的模型。很明顯，隨著房子面積增大，住房價格的變化趨於穩定或者說越往右越平緩。因此線性迴歸並沒有很好擬合訓練資料。我們把此類情況稱為欠擬合(un

Logistic 迴歸—SVM正則引數調優操作筆記

1、準備 # 首先 import 必要的模組 import pandas as pd import numpy as np from sklearn.model_selection import GridSearchCV #競賽的評價指標為logloss #from sklearn.met

【機器學習】過擬合、欠擬合與正則化

過擬合（over-fitting）在演算法對模型引數的學習過程中，如果模型過於強大，比如說，樣本空間分佈在一條直線的附近，那麼我們的模型最好是一條直線， h

機器學習----支援向量機（軟間隔與正則化）

Soft Margin 前面的假設一直都是線性可分，可是如果對所有樣本不能線性可分（比如有noisy）怎麼辦？或者過擬合怎麼辦？緩解該問題的一個方法就是允許支援向量機在一些樣本上出錯，為此引入軟間隔(soft margin)這個概念。即允許在一些樣本

線性迴歸和邏輯迴歸的正則化regularization

線性迴歸介紹為了防止過度擬合，正則化是一種不錯的思路。能夠使得獲得的邊界函式更加平滑。更好的模擬現實資料，而非訓練樣本。方法可以說，regularization是新增懲罰，使得引數接近於零，

Stanford機器學習---第三週.邏輯迴歸、正則化

第三週邏輯迴歸與正則化學完前三週簡要做個總結，梳理下知識框架：第一講邏輯迴歸Logistic Regression 1.分類問題Classification Problem for e

機器學習——支援向量機SVM之軟間隔與正則化

1、在SVM基本型的討論中，我們一直假定樣本在樣本空間或特徵空間中是線性可分的，即存在一個超平面能將不同類的樣本完全劃分開 2、然而現實任務中往往很難確定合適的核函式使得訓練樣本在特徵空間中線性可分，即使恰好找到某個核函式使訓練集樣本在特徵空間中線性可分，也很難判斷是否

機器學習基礎（三十） —— 線性迴歸、正則化（regularized）線性迴歸、區域性加權線性迴歸（LWLR）

1. 線性迴歸線性迴歸根據最小二乘法直接給出權值向量的解析解（closed-form solution）： w=(XTX)−1XTy 線性迴歸的一個問題就是有可能出現欠擬合現象，因為它求的是具有最小均方誤差（LSE，Least Square Erro

機器學習入門系列三（關鍵詞：邏輯迴歸，正則化）

一、邏輯迴歸 1.邏輯迴歸什麼是邏輯迴歸問題，通俗地講就是監督下的分類問題。通過前面的學習，我們已經掌握如何解決線性(非線性)迴歸的問題。那面對分類問題我們是否也可以用線性迴歸呢？簡單起見，我們先討論二元分類，首先讓我們來看一個例子，腫瘤的大小與是否是惡性的關係，其中紅色的×表示腫瘤大小，對應的y軸

[一起面試AI]NO.5過擬合、欠擬合與正則化是什麼？

Q1 過擬合與欠擬合的區別是什麼，什麼是正則化欠擬合指的是模型不能夠再訓練集上獲得足夠低的「訓練誤差」，往往由於特徵維度過少，導致擬合的函式無法滿足訓練集，導致誤差較大。過擬合指的是模型訓練誤差與測試誤差之間差距過大；具體來說就是模型在訓練集上訓練過度，導致泛化能力過差。「所有為了減少測試誤差的策略統稱

Pytorch_第八篇_深度學習 (DeepLearning) 基礎 [4]---欠擬合、過擬合與正則化

# 深度學習 (DeepLearning) 基礎 [4]---欠擬合、過擬合與正則化 --- ## Introduce 在上一篇[“深度學習 (DeepLearning) 基礎 [3]---梯度下降法”](https://www.cnblogs.com/wangqinze/p/13438609.html)中我

機器學習筆記（四）Logistic迴歸實現及正則化

一、Logistic迴歸實現（一）特徵值較少的情況 1. 實驗資料吳恩達《機器學習》第二課時作業提供資料1。判斷一個學生能否被一個大學錄取，給出的資料集為學生兩門課的成績和是否被錄取，通過這些資料來預測一個學生能否被錄取。 2. 分類結果評估橫縱軸（特徵）為學生兩門課成績，可以在圖

logistic迴歸與正則化

常用損失函式

邏輯迴歸損失函式

引數估計

模型選擇方法

過擬合，欠擬合

邏輯斯蒂迴歸

L1、L2、L0正則化

相關推薦