機器學習_生成式模型與判別式模型

阿新 • • 發佈：2018-12-27

在這裡插入圖片描述
從概率分佈的角度看待模型。
給個例子感覺一下: 如果我想知道一個人A說的是哪個國家的語言，我應該怎麼辦呢?

生成式模型

我把每個國家的語言都學一遍，這樣我就能很容易知道A說的是哪國語言，並且C、D說的是哪國的我也可以知道，進一步我還能自己講不同國家語言。

判別式模型

我只需要學習語言之間的差別是什麼，學到了這個界限自然就能區分不同語言，我能說出不同語言的區別，但我哦可能不會講。

如果我有輸入資料 x ，並且想通過標註 y 去區分不同資料屬於哪一類，生成式模型是在學習樣本和標註的聯合概率分佈
$p$

( x , y ) p(x,y)

p (x, y)

而判別式模型是在學習條件概率

p(y|x)

生成式模型 $p (x$

, y ) p(x,y)

p (x, y)

可以通過貝葉斯公式轉化為

p(y|x)=\frac{p(x,y)}{p(x)}\

，並用於分類，而聯合概率分佈

p(x,y)

也可用於其他目的，比如用來生成樣本對

(x,y)

判別式模型的主要任務是找到一個或一系列超平面，利用它(們)劃分給定樣本到給定分類，這也能直白的體現出“判別”模型這個名稱。

最後給一個很簡單的例子說明一下：
假如我有以下獨立同分布的若干樣本 (x,y) ，其中 x 為特徵，
$y\in\left\{ 0,1 \right\}$ 為標註, $(x,y)\in\left\{ (2,-1),(2,-1),(3,-1),(3,1),(3,1) \right\}$ 則：
$p(x,y)$
$y(y|x)$
一些理論可看：On Discriminative vs Generative classifiers: A comparison of logistic regression and naive Bayes。

常見生成式模型
Naive Bayes
Gaussians
Mixtures of Gaussians
Mixtures of Experts
Mixtures of Multinomials
HMM
Markov random fields
Sigmoidal belief networks
Bayesian networks
常見判別式模型
Linear regression
Logistic regression
SVM
Perceptron
Traditional Neural networks
Nearest neighbor
Conditional random fields

機器學習_生成式模型與判別式模型

從概率分佈的角度看待模型。給個例子感覺一下: 如果我想知道一個人A說的是哪個國家的語言，我應該怎麼辦呢? 生成式模型我把每個國家的語言都學一遍，這樣我就能很容易知道A說的是哪國語言，並且C、D說的是哪國的我也可以知道，進一步我還能自己講不同國家語言。

機器學習小問題 -- 生成式模型與判別式模型

本篇博文總結最近學習到的生成式模型與判別式模型的知識。 1. 簡介就像之前在總結分類和聚類時說的一樣，機器學習基本在做的事情就是在分類、打標籤，我們的模型也就像一個個分類機器（個人看法，歡迎指正）。而這麼多的模型，可以分為兩類：生成式模型與判別式模型。對於一個分類器

【機器學習】生成式對抗網路模型綜述

生成式對抗網路模型綜述摘要生成式對抗網路模型(GAN)是基於深度學習的一種強大的生成模型，可以應用於計算機視覺、自然語言處理、半監督學習等重要領域。生成式對抗網路最最直接的應用是資料的生成，而資料質量的好壞則是評判GAN成功與否的關鍵。本文介紹了GAN最初被提出時的基本思想，闡述了其一步

常見生成式模型與判別式模型

col 情況玻爾茲曼機 ron location 表示受限玻爾茲曼機貝葉斯馬爾科夫生成式模型 P(X,Y)對聯合概率進行建模，從統計的角度表示數據的分布情況，刻畫數據是如何生成的，收斂速度快。 • 1. 判別式分析 • 2. 樸素貝葉斯Nati

Python資料探勘與機器學習_通訊信用風險評估實戰(4)——模型訓練與調優

系列目錄：訓練資料拆分把訓練資料拆分為訓練集和交叉驗證集，比例為7:3。x_train和y_train用來訓練模型，x_test和y_test用來交叉驗證。 data_train = data_train.set_index('Us

機器學習引數模型與非引數模型/生成模型與判別模型

2018-03-31更新：生成模型與判別模型引數模型：根據預先設計的規則，例如方差損失最小，進行學習，引數模型例子：迴歸（線性迴歸、邏輯迴歸）模型；最好可以看一下或者直接進行一下相關的推導；根據規則，擁有少部分資料就可以；非引數模型：不需要事先假設規則，直接挖掘潛在資料中的規

機器學習之---生成模型和判別模型

監督學習方法可分為兩大類，即生成方法與判別方法，它們所學到的模型稱為生成模型與判別模型。判別模型：判別模型是學得一個分類面（即學得一個模型），該分類面可用來區分不同的資料分別屬於哪一類；生成模型：生成模型是學得各個類別各自的特徵（即可看成學得多個模型），可用這些

【機器學習】生成模型和判別模型

定義：生成方法由資料學習聯合概率分佈P(x, y)，然後求出條件概率分佈P(y|x)作為預測的模型。包括樸素貝葉斯，貝葉斯網路，高斯混合模型，隱馬爾科夫模型等。判別方法由資料直接學習決策函式

機器學習_線性迴歸模型

1.線性迴歸 1.1模型 1.1.1目標函式（損失函式、正則） a.無正則：最小二乘線性迴歸（OLS） b.L2正則：嶺迴歸（Ridge Regression） c.L1正則：Lasso 1.1.2概率解釋最小二乘線性迴歸等價於

深度學習-54:生成式對抗網路GAN(原理、模型和演進)

深度學習-52:生成式對抗網路GAN(原理、模型和演進) 一般的學習模型都是基於一個假設的隨機分佈，然後通過訓練真實資料來擬合出模型。網路模型複雜並且資料集規模也不小，這種方法簡直就是憑藉天生蠻力解決問題。Goodfellow認為正確使用資料的方式，先對資料集

Stanford機器學習課程筆記4-Kmeans與高斯混合模型

這一部分屬於無監督學習的內容，無監督學習內容主要包括：Kmeans聚類演算法、高斯混合模型及EM演算法、Factor Analysis、PCA、ICA等。本文是Kmeans聚類演算法、高斯混合模型的筆記，EM演算法是適用於存在latent/hidden變數的通用演算法，高斯混

機器學習十二誤差原因與模型複雜度

誤差原因（Error）：用於測量模型效能的基本指標。在模型預測中，模型可能出現的誤差來自兩個主要來源，即：因模型無法表示基本資料的複雜度而造成的偏差（bias），或者因模型對訓練它所用的有限資料過度敏感而造成的方差（variance）。偏差：準確率和欠擬合如果模型具

機器學習_最小二乘法，線性迴歸與邏輯迴歸

1. 線性迴歸線性迴歸是利用數理統計中迴歸分析，來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。直觀地說，在二維情況下，已知一些點的X,Y座標，統計條件X與結果Y的關係，畫一條直線，讓直線離所有點都儘量地近（距離之和最小），用直線抽象地表達這些點，然後對新的X預測新的Ｙ。具體實現一般

機器學習筆記(6)-邏輯迴歸與最大熵模型

Logistic迴歸 Logistic 迴歸雖然名字叫回歸，但是它是用來做分類的。其主要思想是: 根據現有資料對分類邊界線建立迴歸公式，以此進行分類。假設現在有一些資料點，我們用一條直線對這些點進行擬合（這條直線稱為最佳擬合直線），這個擬合的過程就叫做迴歸。

機器學習讀書筆記（高斯混合模型GMM與EM）（改）

高斯混合模型（Gaussian mixture model，GMM）是單一高斯概率密度函式的延伸。GMM能夠平滑地近似任意形狀的密度分佈。欲瞭解高斯混合模型，那就先從基礎的單一高斯概率密度函式講起。（數學公式字型太難看了！！！！！！！）注意：這一一篇致力於詳

Python資料探勘與機器學習_通訊信用風險評估實戰(2)——資料預處理

系列目錄：資料說明通過對讀取資料的實踐，下面是資料集檔案對應讀取後的DataFrame說明。資料檔案 DataFrame DataTech_Credit_Train_Communication1.txt train

機器學習筆記：最大熵（模型，推導，與似然函式關係的推導，求解）

1、最大熵模型最大熵原理：最大熵原理認為在學習概率模型時，在所有可能的概率模型中，熵最大的模型是最少的模型。該原理認為要選擇的概率模型首先得承認已有的現實（約束條件），對未來無偏（即不確定的部分是等可能的）。比如隨機變數取值有A,B,C，另外已知

Amazon SageMaker 機器學習_機器學習模型構建訓練部署

Amazon SageMaker 是一個完全託管的平臺，可以幫助開發人員和資料科學家快速而輕鬆地構建、訓練和部署任何規模的機器學習模型。Amazon SageMaker 消除了通常會阻礙開發人員使用機器學習的所有障礙。大多數開發人員通常覺得機器學習要比它本身難得多，因為構建

深入淺出機器學習之生成模型，高斯判別

這一講是一塊單獨的內容，和上一部分的迴歸不太一樣，這塊側重用概率的方式來進行分類。首先說一下判別學習和生成學習之間的區別，判別學習就是直接學習P（y| x）,通過一系列

機器學習：生成模型和判別模型

經典提問：Navie Bayes和Logistic迴歸區別是什麼？ Navie Bayes是生成式模型，Logistic迴歸是判別式模型，二者的區別就是生成式模型與判別式模型的區別。首先，Navie Bayes通過已知樣本求得先驗概率P(Y), 及條件概率P(X|Y),

機器學習_生成式模型與判別式模型

相關推薦