聚類之詳解FCM演算法原理及應用

【之前】 該文的pdf清晰版已被整理上傳，方便儲存學習，下載地址：

（一）原理部分

模糊C均值（Fuzzy C-means）演算法簡稱FCM演算法，是一種基於目標函式的模糊聚類演算法，主要用於資料的聚類分析。理論成熟，應用廣泛，是一種優秀的聚類演算法。本文關於FCM演算法的一些原理推導部分介紹等參考下面視訊，加上自己的理解以文字的形式呈現出來，視訊參考如下，比較長，看不懂的可以再去看看：

首先介紹一下模糊這個概念，所謂模糊就是不確定，確定性的東西是什麼那就是什麼，而不確定性的東西就說很像什麼。比如說把20歲作為年輕不年輕的標準，那麼一個人21歲按照確定性的劃分就屬於不年輕，而我們印象中的觀念是21歲也很年輕，這個時候可以模糊一下，認為21歲有0.9分像年輕，有0.1分像不年輕，這裡0.9與0.1不是概率，而是一種相似的程度，把這種一個樣本屬於結果的這種相似的程度稱為樣本的隸屬度，一般用u表示，表示一個樣本相似於不同結果的一個程度指標。

基於此，假定資料集為X，如果把這些資料劃分成c類的話，那麼對應的就有c個類中心為C，每個樣本j屬於某一類i的隸屬度為 $u_{i j}$ ，那麼定義一個FCM目標函式（1）及其約束條件（2）如下所示：

\begin{matrix} (1) & J = \sum_{i = 1}^{c} \sum_{j = 1}^{n} u_{i j}^{m} | | x_{j} - c_{i} | |^{2} \end{matrix}

\begin{matrix} (2) & \sum_{i = 1}^{c} u_{i j} = 1, j = 1, 2..., n \end{matrix}

看一下目標函式（式1）而知，由相應樣本的隸屬度與該樣本到各個類中心的距離相乘組成的，m是一個隸屬度的因子，個人理解為屬於樣本的輕緩程度，就像

x^{2}

與

x^{3}

這種一樣。式（2）為約束條件，也就是一個樣本屬於所有類的隸屬度之和要為1。觀察式（1）可以發現，其中的變數有

u_{i j} 、 c_{i}

，並且還有約束條件，那麼如何求這個目標函式的極值呢？

這裡首先採用拉格朗日乘數法將約束條件拿到目標函式中去，前面加上係數，並把式（2）的所有j展開，那麼式（1）變成下列所示：

\begin{matrix} (3) & J = \sum_{i = 1}^{c} \sum_{j = 1}^{n} u_{i j}^{m} | | x_{j} - c_{i} | |^{2} + λ_{1} (\sum_{i = 1}^{c} u_{i 1} - 1) + . . . + λ_{j} (\sum_{i = 1}^{c} u_{i j} - 1) + . . . + λ_{n} (\sum_{i = n}^{c} u_{i n} - 1)) \end{matrix}

現在要求該式的目標函式極值，那麼分別對其中的變數

u_{i j} 、 c_{i}

求導數，首先對

u_{i j}

求導。

分析式(3)，先對第一部分的兩級求和的 $u_{i j}$ 求導，對求和形式下如果直接求導不熟悉，可以把求和展開如下：

[\begin{matrix} u_{11}^{m} | | x_{1} - c_{1} | |^{2} & \dots & u_{1 j}^{m} | | x_{j} - c_{1} | |^{2} & \dots & u_{1 n}^{m} | | x_{n} - c_{1} | |^{2} \\ ⋮ & ⋮ & ⋮ & ⋮ & ⋮ \\ u_{i 1}^{m} | | x_{1} - c_{i} | |^{2} & \dots & u_{i j}^{m} | | x_{j} - c_{i} | |^{2} & \dots & u_{i n}^{m} | | x_{n} - c_{i} | |^{2} \\ ⋮ & ⋮ & ⋮ & ⋮ & ⋮ \\ u_{c 1}^{m} | | x_{1} - c_{c} | |^{2} & \dots & u_{c j}^{m} | | x_{j} - c_{c} | |^{2} & \dots & u_{c n}^{m} | | x_{n} - c_{c} | |^{2} \end{matrix}]

聚類之詳解FCM演算法原理及應用

（一）原理部分

聚類之詳解FCM演算法原理及應用

LinkedList類之詳解

Collection類之詳解（二）

Collection類之詳解（一）

詳解SpringBoot——啟動原理及自定義starter

聚類之效能度量詳解

人人都能看懂的機器學習！3個案例詳解聚類、迴歸、分類演算法

Sql Server之數據類型詳解

python之路第二篇數據類型詳解及其方法

Hadoop偽分佈安裝詳解+MapReduce執行原理+基於MapReduce的KNN演算法實現

Java之集合類總結詳解

分享《深度學習與計算機視覺演算法原理框架應用》《大資料架構詳解從資料獲取到深度學習》PDF資料集

分享《深度學習與計算機視覺演算法原理框架應用》PDF《大資料架構詳解從資料獲取到深度學習》PDF +資料集

Canny邊緣檢測演算法原理及C語言實現詳解

C++學習之路（47）---C++類模板與模板類深入詳解

常用演算法之詳解 MD5（基於演算法的官方原文件）

K-means聚類的演算法原理及實現

Java利器之UML類圖詳解

Java 併發程式設計之詳解工具類 CountDownLatch

聚類之K-means演算法