1. 程式人生 > >機器學習讀書筆記(高斯混合模型GMM與EM)(改)

機器學習讀書筆記(高斯混合模型GMM與EM)(改)

高斯混合模型(Gaussian mixture model,GMM)是單一高斯概率密度函式的延伸。GMM能夠平滑地近似任意形狀的密度分佈。
欲瞭解高斯混合模型,那就先從基礎的單一高斯概率密度函式講起。(數學公式字型太難看了!!!!!!!)
注意:這一一篇致力於詳細闡述過程的文章,如果你懂,可以快速跳過。

單高斯分佈模型GSM

假設我們有一組在高維空間(維度為 d)的點xi , i=1,…,n,若這些點的分佈近似橢球狀,則我們可用高斯密度函式來描述產生這些點的概率密度函式(統計學記為PDF),記住這個關鍵公式:

g(xi;μ,Σ)=1(2π)d|Σ|exp[12(x
μ)TΣ1(xμ)]

其中μ代表此密度函式的中心點,Σ則代表此密度函式的協方差矩陣(Covariance Matrix),這些引數決定了此密度函式的特性,如函式形狀的中心點、寬窄及走向等。在《程式設計師的數學2》這本書中給大家一個簡單的記法。這東西就是:

exp(x1μ,x2μ,....xnμ)
前面的方框表示是多少不重要,常數而已不是0就行。(是0也沒事,這樣的模型我們都輕鬆了。。。)
在實際應用中μ通常用樣本均值來代替,Σ通常用樣本方差來代替。GSM單從橫軸,縱軸都遵循一維高斯分佈。GSM只有單中心點。如圖(圖片來源):
符合GSM分佈的二維點在平面上

協方差矩陣簡介(與主體內容無關,僅單純介紹)

那麼什麼叫協方差矩陣呢?矩陣中的第(i,j)個元素是 Xi,Xj 的協方差。
Wikipedia是這麼詳細定義的:
假設X是以n個隨機變數(其中的每個隨機變數是也是一個向量,當然是一個行向量)組成的列向量,

X=X1Xn
並且 μi 是其第i個元素的期望值,即, μi=E(Xi) , 其中 Xi 是列向量中的一個標量。協方差矩陣的第i,j項(第i,j項是一個協方差)被定義為如下形式: Σij=cov(Xi,Xj)=E[(Xiμi)(Xjμj)]
而協方差矩陣為:
Σ=E[(XiE|X|)(XjE|X|)]=
E
[(X1μ1)(X1μ1)]
E[(X2μ2)(X1μ1)]E[(Xnμn)(X1μ1)]
E[(X1μ1)(X2μ2)]E[(X2μ2)(X2μ2)]E[(Xnμn)(

相關推薦

機器學習讀書筆記混合模型GMMEM

高斯混合模型(Gaussian mixture model,GMM)是單一高斯概率密度函式的延伸。GMM能夠平滑地近似任意形狀的密度分佈。 欲瞭解高斯混合模型,那就先從基礎的單一高斯概率密度函式講起。(數學公式字型太難看了!!!!!!!) 注意:這一一篇致力於詳

網格缺陷檢測混合模型GMM

*此示例程式向您展示如何使用GMM分類器進行新穎性檢測以執行Web檢查任務。 要進行新奇檢測, *計算屬於單個訓練類的所有畫素,然後進行計算從分類ROI中減去以提取錯誤畫素。 對於網路檢查任務,GMM因此可用於檢測紋理與訓練好的物體的紋理不對應。       &nb

Spark2.0機器學習系列之10: 聚類(混合模型 GMM

       在Spark2.0版本中(不是基於RDD API的MLlib),共有四種聚類方法:      (1)K-means      (2)Latent Dirichlet allocation (LDA)      (3)Bisecting k-m

混合模型的重疊度計算 Overlap Rate, OLR

簡介 關於高斯混合模型(GMM)的相關概念可以參考另一篇博文:高斯混合模型及其EM演算法的理解 使用GMM聚類或分析兩個高斯混合分佈的資料時,我們有時會希望兩個高斯分佈離得越遠越好,這樣表示資料才有可分性。但很多情況下兩個高斯分佈會有重疊。一維和二維的重

混合模型(GMM Gaussian Mixture Model)

高斯混合模型是一種業界廣泛使用的聚類演算法,該方法使用了高斯分佈作為引數模型,並使用了期望最大演算法(EM)進行訓練。 什麼是高斯分佈 高斯分佈有時也被稱作正態分佈,是一個在數學、物理及工程等領域都非常重要的概率分佈,在統計學的許多方面都有著重大的影響。 若隨機變數X服從一個數學

05 EM演算法 - 混合模型 - GMM

04 EM演算法 - EM演算法收斂證明 __GMM__(Gaussian Mixture Model, 高斯混合模型)是指該演算法由多個高斯模型線性疊加混合而成。每個高斯模型稱之為component。 __GMM演算法__描述的是資料的本身存在的一種分佈,即樣本特徵屬性的分佈,和預測值Y無關。顯然G

R || 混合模型GMM

GMM模型的R實現 預備知識: 友情提示:本程式碼配合GMM演算法原理中的步驟閱讀更佳哦! 本文分為一元高斯分佈的EM演算法以及多元高斯分佈的EM演算法,分別採用兩本書上的資料《統計學習方法》和《機器學習》。 一元高斯混合模型 步驟: 1

混合模型GMM

使用概率模型的原因 k均值等價於假設了球對稱形狀的聚類。使用帶權歐式距離,仍然假設了軸對齊的橢球。沒有考慮聚類的形狀。 促使概率模型的原因:混合模型 提供觀測點到聚類的軟分配soft assig

EM演算法和混合模型GMM介紹

EM演算法 EM演算法主要用於求概率密度函式引數的最大似然估計,將問題$\arg \max _{\theta_{1}} \sum_{i=1}^{n} \ln p\left(x_{i} | \theta_{1}\right)$轉換為更加易於計算的$\sum_{i=1}^{n} \ln p\left(x_{i}

機器學習筆記13】聚類混合聚類

【參考資料】 【1】《統計學習方法》 【2】《概率論與數理統計》 【3】小象學院 EM演算法 高斯分佈 定義: 如果隨機變數X的概率密度為f(x)=12πσe−(x−u)22σ2f(x)= \dfrac{1}{\sqrt{2\pi}\sigma}e^{-\df

機器學習讀書筆記樸素貝葉基礎篇之網站賬號分類

pan 技巧 nbsp 增強 就是 使用 分類問題 預測 結果 一、條件概率 在學習計算p1和p2概率之前,我們需要了解什麽是條件概率,就是指在事件B發生的情況下,事件A發生的概率,用P(A|B)來表示。 根據文氏圖,可以很清楚地看到在事件B發生的情況下,事件A發

Stanford機器學習課程筆記4-Kmeans混合模型

這一部分屬於無監督學習的內容,無監督學習內容主要包括:Kmeans聚類演算法、高斯混合模型及EM演算法、Factor Analysis、PCA、ICA等。本文是Kmeans聚類演算法、高斯混合模型的筆記,EM演算法是適用於存在latent/hidden變數的通用演算法,高斯混

混合模型GMM介紹以及學習筆記

1.高斯混合模型概述 高斯密度函式估計是一種引數化模型。高斯混合模型(Gaussian Mixture Model, GMM)是單一高斯概率密度函式的延伸,GMM能夠平滑地近似任意形狀的密度分佈。高斯混合模型種類有單高斯模型(Single Gaussian Model, S

機器學習機器學習十二、十三:K-means演算法、混合模型

簡介:         本節介紹STANFORD機器學習公開課中的第12、13集視訊中的演算法:K-means演算法、高斯混合模型(GMM)。(9、10、11集不進行介紹,略過了哈) 一、K-means演算法         屬於無監督學習的聚類演算法,給定一組未標定的資料

機器學習讀書筆記決策樹基礎篇之從相親說起

方法 事務 家裏 分類 筆記 判斷 都是 rom tro 一、決策樹 決策樹是什麽?決策樹(decision tree)是一種基本的分類與回歸方法。舉個通俗易懂的例子,如下圖所示的流程圖就是一個決策樹,長方形代表判斷模塊(decision block),橢圓形成代

CS229 Machine Learning學習筆記:Note 7(K-means聚類、混合模型EM算法)

learn 不同的 inf ear 公式 course splay alt spa K-means聚類 ng在coursera的機器學習課上已經講過K-means聚類,這裏不再贅述 高斯混合模型 問題描述 聚類問題:給定訓練集\(\{x^{(1)},\cdots,x^{(m

機器學習EM演算法在混合模型學習中的應用

前言 EM演算法,此部落格介紹了EMEM演算法相關理論知識,看本篇部落格前先熟悉EMEM演算法。 本篇部落格打算先從單個高斯分佈說起,然後推廣到多個高斯混合起來,最後給出高斯混合模型引數求解過程。 單個高斯分佈 假如我們有一些資料,這些資料來自同一個

混合模型學習筆記

0 預備知識 l  設離散型隨機變數X的分佈律為 則稱 為X的數學期望或均值 l  設連續型隨機變數X的概率密度函式(PDF)為 其數學期望定義為 l  稱為隨機變數X的方差,稱為X的標準差 l  正態分佈 ~ 概率密度函式 l  設(X, Y)為二維隨機變數,若存在

斯坦福大學機器學習——EM演算法求解混合模型

EM演算法(Expection-Maximizationalgorithm,EM)是一種迭代演算法,通過E步和M步兩大迭代步驟,每次迭代都使極大似然函式增加。但是,由於初始值的不同,可能會使似然函式陷入區域性最優。辜麗川老師和其夫人發表的論文:基於分裂EM演算法的GMM引數

圖解機器學習讀書筆記-CH2

mathjax 表現 增長 模型訓練 向量 機器學習 維基 核函數 字符串 總結了如下表格: 模型種類模型圖示補充 線性模型 一般線性模型: , x為向量向量時: 多維基函數構造: 1.乘法模型: 2.加法模型: 二者對比:乘法模型