1. 程式人生 > >SVM簡介、SVM與感知機、邏輯迴歸LR的區別

SVM簡介、SVM與感知機、邏輯迴歸LR的區別

軟間隔SVM

硬間隔SVM

.

核函式:

SVM與感知機的區別

SVM分類超平面的解是唯一的,要滿足間隔最大化

感知機的解不唯一,沒有間隔最大化的約束條件,滿足分開資料點的分介面都是可以的

SVM與邏輯迴歸的區別

相同點:

第一,LR和SVM都是分類演算法。

第二,如果不考慮核函式,LR和SVM都是線性分類演算法,也就是說他們的分類決策面都是線性的

第三,LR和SVM都是監督學習演算法。

第四,LR和SVM都是判別模型。

   兩種方法都是常見的分類演算法,其中心思想都是增加對分類影響較大的資料點的權重,減少與分類關係較小的資料點的權重。

SVM的處理方法是隻考慮support vectors,也就是和分類最相關的少數點,去學習分類器。

而邏輯迴歸通過非線性對映,大大減小了離分類平面較遠的點的權重,相對提升了與分類最相關的資料點的權重。兩者的根本目的都是一樣的。

比較:      
0、概率值

LR給出了後驗概率,SVM只有01分類,沒有後延概率
1、損失函式

LR採用logistic損失(誤差平方和損失)

SVM採用合頁(Hinge)損失。(損失函式是二者的本質區別)

SVM的損失函式就自帶正則!!!(損失函式中的1/2||w||^2項),這就是為什麼SVM是結構風險最小化演算法的原因!!!而LR必須另外在損失函式上新增正則項!!


2、異常值

LR對異常值敏感;SVM對異常值不敏感,泛華能力強,分類效果好。
3、訓練資料體量

在訓練集較小時,SVM較適用,而LR需要較多的樣本。
4、起作用點的範圍

LR模型找到的那個超平面,是儘量讓所有點都遠離他,而SVM尋找的那個超平面,是隻讓最靠近中間分割線的那些點儘量遠離,即只用到那些支援向量的樣本。
5、非線性問題的處理方式

對非線性問題的處理方式不同,LR主要靠特徵構造,必須組合交叉特徵,特徵離散化;

SVM也可以這樣,還可以通過kernel,kernel很強大。
6、理解性

LR相對來說模型更簡單,好理解,實現起來,特別是大規模線性分類時比較方便。而SVM的理解和優化相對來說複雜一些。但是SVM的理論基礎更加牢固,有一套結構化風險最小化的理論基礎.

7.線性SVM依賴資料表達的距離測度,所以需要對資料先做normalization,LR不受其影響
一個機遇概率,一個機遇距離

線性迴歸和邏輯迴歸

線性迴歸

  
 

實際應用中,概率p與因變數往往是非線性的,為了解決該類問題,我們引入了logit變換,使得logit(p)與自變數之
間存在線性相關的關係,

邏輯迴歸:


 

通過推導,概率p變換如下,這與Sigmoid函式相符,也體現了概率p與因變數之間的非線性關係。以0.5為界限,預

測p大於0.5時,我們判斷此時y更可能為1,否則y為0。
 

非線性情況下,可以加kernel,或者特徵相乘 

Logistic優缺點:

優:計算代價不高,易於理解和實現。

缺:容易欠擬合,分類精度可能不高。

SVM優缺點:

優:泛化錯誤率低,計算開銷不大,結果易解釋。

缺:SVM對引數調節和核函式的選擇敏感,原始分類器不加修改僅適用於處理二類問題。

相關推薦

SVM簡介SVM感知邏輯迴歸LR區別

軟間隔SVM 硬間隔SVM . 核函式: SVM與感知機的區別 SVM分類超平面的解是唯一的,要滿足間隔最大化 感知機的解不唯一,沒有間隔最大化的約束條件,滿足分開資料點的分介面都是可以的 SVM與邏輯迴歸的區別 相同點: 第

單層神經網路多層感知深度學習的總結

關於神經網路的幾點思考:單層——多層——深度 神經網路本質上是一個逼近器,一個重要的基本屬性就是通用逼近屬性。 通用逼近屬性: 1989年,George Cybenko發表文章“Approximation by Superpositions of a Sigmoidal

影象的線性分類器(感知SVMSoftmax)

  本文主要內容為 CS231n 課程的學習筆記,主要參考 學習視訊 和對應的 課程筆記翻譯 ,感謝各位前輩對於深度學習的辛苦付出。在這裡我主要記錄下自己覺得重要的內容以及一些相關的想法,希望能與大家多多交流~ 1. 線性分類器簡介   這部分所

計算機概論:02---電腦主機板架構CPU記憶體顯示卡硬碟儲存裝置擴充套件卡介面主機板主機電源簡介

一、電腦主機板架構 1.概念:主機板是連線各元件的重要部分。主機板上連線各部分元件的晶片組,其設計優劣,會影響電腦的效能 2.晶片組 ①早期晶片組:早期的晶片組通常分為兩個網橋來控制各元件的通訊 北橋:負責連線速度較快的CPU、記憶體與顯示卡等元件 南橋:負責連線速度

筆記-感知超平面

1.感知機 感知機是一種二分類的線性分類模型,輸入為例項的特徵向量,輸出為例項的類別{+1,-1}。感知機要求資料集是線性可分的。 按照統計學習三要素模型、策略、演算法的順序來介紹。 2.感知機模型 由輸入空間到輸出空間的如下函式: f(x)=si

封裝構造方法privateStaticthis關鍵字main()_Day07

形參 調用構造 查找 logs code 屬性 too person 步驟 1:成員變量和局部變量的區別(理解)    (1)定義位置區別:      成員變量:定義在類中,方法外。      局部變量:定義在方法中,或者方法聲明上。   

配置tomcat監聽80端口配置tomcat虛擬tomcat日誌

classname nginx代理 data restart cal 停止 環境 生產環境 netstat 配置tomcat監聽80端口 tomcat 監聽的是8080端口,如果想要直接訪問,不加8080端口(默認輸入一個IP或者域名,訪問80端口時是可以省略IP後端口號

security 02: 加密解密 掃描抓包 總結和答疑 SELinux安全防護

一段 數字簽名 def 接口 數據流 5.1 調用 message systemctl day01一、selinux安全防護二、數據 加密 解密三、抓包與掃描++++++++++++++++++++++++++++++一、selinux安全防護1.1 selinux 介紹1

Spring MVC溫故而知新 – 參數綁定轉發重定向異常處理攔截器

單獨 UC exclude require 加載 pre buffered nts 節點 請求參數綁定 當用戶發送請求時,根據Spring MVC的請求處理流程,前端控制器會請求處理器映射器返回一個處理器,然後請求處理器適配器之心相應的處理器,此時處理器映射器會調用Spr

ES6學習筆記之mapset數組對象的對比

fin 唯一性 ron foreach -o pty pan es6 odi ES6 ES5中的數據結構,主要是用Array和Object。在ES6中主要新增了Set和Map數據結構。到目前為止,常用的數據結構有四種Array、Object、Set、Map。下面話不多說了

正則表示式詳解(貪婪懶惰前瞻後顧後向引用等)

之前嫌正則麻煩,一直沒有深入去了解過正則,能不用的地方就不使用。 最近專案中遇到了不可避免的正則使用,所以花了點時間去了解並整理了一下,理解不一定完全準確,如有不對歡迎指出,希望對大家有所幫助。 一、名詞解釋 首先我們瞭解幾個名詞:元字元 、 普通字元、列印字元、非列印字元、 限定符 、定位符、非列

磁碟管理(裝置的檢視掛載解除安裝磁碟分割槽swap分割槽的建立刪除磁碟配額)

磁碟管理 概述: 分割槽:磁碟上的分割槽規劃 硬碟:是一種儲存裝置,可劃分分割槽(可見的) 硬碟與系統的關係: 系統管理硬碟 硬碟儲存系統資訊 1.本地儲存裝置的檢視 fdisk 是用於管理磁碟分割槽的實用程式 fdisk -l #檢視

JavaScript介紹嵌入頁面的方式註釋斷點除錯變數元素操作

JavaScript介紹 JavaScript 是執行在瀏覽器端的腳步語言,JavaScript 主要解決的是前端與使用者互動的問題,包括使用互動與資料互動。 JavaScript 是瀏覽器解釋執行的,前端指令碼語言還有JScript(微軟,IE 獨有),ActionScript(Ado

形象理解線性代數(三)——列空間零空間(核)值域特徵值(特徵向量)矩陣空間變換矩陣的秩

這裡,我們還是要以 形象理解線性代數(一)——什麼是線性變換?為基礎。矩陣對向量的作用,可以理解為線性變換,同時也可以理解為空間的變換,即(m*n)的矩陣會把一個向量從m維空間變換到n維空間。 一、矩陣的列空間與矩陣的秩以及值域的關係 矩陣的列空間,其實就是矩陣的列所組成的空間。比如我們考慮

邏輯卷lvm的管理(邏輯卷的建立 掛載 擴容縮容指定pe的大小 邏輯卷快照的製作 物理分割槽的徹底刪除)

邏輯卷的管理 概述: 物理分割槽: 用來製作物理卷 物理卷: pv 用來組成物理卷組 ;包含整數個 pe(物理拓展) 物理卷組 : vg 用來製作邏輯卷 邏輯卷: lvm 它的作用是實現硬碟的無限分割槽與擴容 1.邏輯卷的建立 (1).建立物理分割槽

字元型別char字串字元陣列字元陣列資料陣列區別

字元型別是以ASCII碼值運算的:小寫字母比相應的大寫字母大32,其中A=65,a=97 Esc鍵 27(十進位制)、'\x1B'(十六進位制)、'\33'(八進位制) 轉義字元:\0 空字元\n 換行\r 回車\t 水平製表符(Tab鍵)\' 單引號\" 雙引號\\ 反斜槓 char c='M';

幾個例子理解對稱加密非對稱加密公鑰私鑰簽名驗籤數字證書HTTPS加密方式

# 原創,轉載請留言聯絡 為什麼會出現這麼多加密啊,公鑰私鑰啊,簽名啊這些東西呢?說到底還是保證雙方通訊的安全性與完整性。例如小明發一封表白郵件給小紅,他總不希望給別人看見吧。而各種各樣的技術就是為了保障通訊的安全。(本文務必從上到下看) 1.對稱加密與非對稱加密 對稱加密: 對稱加密是

支援向量SVM)和邏輯迴歸(LR)

開篇 為什麼把這兩個機器模型放在一起呢,主要是因為它們經常會在面試中同時出現,這邊把它們放在一起,解析一下它們之間的聯絡和區別。我們先看一下問題 經典演算法問題 LR 與 SVM 的相同和不同? 講一下其中的LR、SVM,以及區別和聯絡(2018京東演算

Linux基礎命令(三):重定向展開引用——catsortuniqgrepwcheadtailtee

I/O重定向 通過這個工具,可以重定向命令的輸入輸出,命令的輸入來自檔案,而輸出也存到檔案。 也可以把多個命令連線起來組成一個強大的命令管道。 cat — 連線檔案 sort — 排序文字行 uniq — 報道或省略重複行 grep — 列印匹配行 wc — 列印

一圖秒懂“天使投資VCPE” “A輪B輪C輪融資”的關係

我們經常看到朋友圈裡某某公司獲得了某輪融資,所謂的A輪B輪究竟是個什麼概念呢?今天就跟小夥伴們分享一下A、B、C、D輪融資與天使投資、VC、PE的關係。   天使投資(AI):天使投資所投的是一些非常早期的專案,有些甚至沒有一個完整的產品和商業計劃,或者僅僅只有一個概念。天