線性判別分析(LDA)和python實現（多分類問題）

阿新 • • 發佈：2019-01-30

上一篇寫過線性判別分析處理二分類問題https://blog.csdn.net/z962013489/article/details/79871789，當使用LDA處理多分類問題時，通常是作為一個降維工具來使用的。若我們有一個D維的樣本集，該樣本集包含C個類別共n個樣本，希望將D維降維成K維。之前在二分類問題中，我們定義的類間散度矩陣為：

S_{b} = (μ_{1} - μ_{2}) (μ_{1} - μ_{2})^{T}

當類別為3時就已經不再適用，在這裡引出全域性散度矩陣的概念：

S_{t} = S_{w} + S_{b} = \sum_{i = 1}^{n} (x_{i} - μ) (x_{i} - μ)^{T}

其中 $μ$ 為整個樣本集的均值向量，其中的類內散度矩陣 $S_{w}$

S_{w}

定義為所有類別的散度矩陣之和，與二分類類似，基於全域性散度矩陣，我們就可以求得類間散度矩陣

S_{b}

定義為：

S_{b} = S_{t} - S_{w} = \sum_{i = 1}^{n} m_{i} (μ_{i} - μ) (μ_{i} - μ)^{T}

其中

m_{i}

為第i個類別樣本總數，

μ_{i}

為第i個類別樣本的均值向量。這裡寫圖片描述

上圖的例子可以作為參考便於理解。
我們要計算一個W矩陣，使樣本向量在該投影矩陣的作用下能夠實現其與同類樣本的中心距離儘量小，而與異類樣本的中心距離儘量大。常見的一種優化目標為：

max_{W} \frac{t r (W^{T} S_{b} W)}{t r (W^{T} S_{w} W)}

其中的tr()為矩陣的跡，一個n×n的對角矩陣A的主對角線（從左上方至右下方的對角線）上各個元素的總和被稱為矩陣A的跡（或跡數），一般記作tr(A)。
這個優化目標實際上等價於求解多個w組合成W，那麼該問題就等價於求解多個上一章的優化目標，使用相同的方法，可以求得下式：

S_{b} W = λ S_{w} W

即

S_{w}^{- 1} S_{b} W = λ W

W的閉式解為

S_{w}^{- 1} S_{b}

的k個最大非零廣義特徵值對應的特徵向量組成的矩陣，LDA降維最多可以降至C-1，C為樣本類別數，與原始特徵維數n無關。
使用python實現LDA降維程式碼，對Iris資料集從四維降至二維，繪圖如下：
其中上圖為自己實現的方法降維表現，下圖為sklearn自帶方法降維表現。
這裡寫圖片描述

python3.6實現如下：

import numpy as np
from sklearn.datasets import load_iris
import matplotlib.pyplot as 
 plt
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis


def LDA_dimensionality(X, y, k):
    '''
    X為資料集，y為label，k為目標維數
    '''
    label_ = list(set(y))

    X_classify = {}

    for label in label_:
        X1 = np.array([X[i] for i in range(len(X)) if y[i] == label])
        X_classify[label] = X1

    mju = np.mean(X, axis=0)
    mju_classify = {}

    for label in label_:
        mju1 = np.mean(X_classify[label], axis=0)
        mju_classify[label] = mju1

    #St = np.dot((X - mju).T, X - mju)

    Sw = np.zeros((len(mju), len(mju)))  # 計算類內散度矩陣
    for i in label_:
        Sw += np.dot((X_classify[i] - mju_classify[i]).T,
                     X_classify[i] - mju_classify[i])

    # Sb=St-Sw

    Sb = np.zeros((len(mju), len(mju)))  # 計算類內散度矩陣
    for i in label_:
        Sb += len(X_classify[i]) * np.dot((mju_classify[i] - mju).reshape(
            (len(mju), 1)), (mju_classify[i] - mju).reshape((1, len(mju))))

    eig_vals, eig_vecs = np.linalg.eig(
        np.linalg.inv(Sw).dot(Sb))  # 計算Sw-1*Sb的特徵值和特徵矩陣

    sorted_indices = np.argsort(eig_vals)
    topk_eig_vecs = eig_vecs[:, sorted_indices[:-k - 1:-1]]  # 提取前k個特徵向量
    return topk_eig_vecs


if '__main__' == __name__:

    iris = load_iris()
    X = iris.data
    y = iris.target

    W = LDA_dimensionality(X, y, 2)
    X_new = np.dot((X), W)
    plt.figure(1)
    plt.scatter(X_new[:, 0], X_new[:, 1], marker='o', c=y)

    # 與sklearn中的LDA函式對比
    lda = LinearDiscriminantAnalysis(n_components=2)
    lda.fit(X, y)
    X_new = lda.transform(X)
    print(X_new)
    plt.figure(2)
    plt.scatter(X_new[:, 0], X_new[:, 1], marker='o', c=y)

    plt.show()

線性判別分析(LDA)和python實現（多分類問題）

線性判別分析(LDA)和python實現（多分類問題）

LDA線性判別分析原理及python應用（葡萄酒案例分析）

線性判別分析LDA（Linear Discriminant Analysis）

支援向量機（SVM）和python實現（三）

線性判別分析LDA原理總結

狄克斯特拉演算法之Python實現（個人獨創）易於理解和擴充套件。

高斯判別分析演算法及其python實現

【轉載】Java動態代理之JDK實現和CGlib實現（簡單易懂）

梯度下降演算法及python實現（學習筆記）

Java動態代理之JDK實現和CGlib實現（簡單易懂）

JAVA實驗三抽象類的繼承和介面的實現（多型）

TF-IDF演算法-Python實現（附原始碼）

線性迴歸——lasso迴歸和嶺迴歸（ridge regression）

Python multiprocessing （多程序）使用

Python機器學習庫sklearn裡利用感知機進行三分類（多分類）的原理

Tensorflow實戰：Word2Vec_Skip_Gram原理及實現（多註釋）

Python機器學習庫sklearn裡利用LR模型進行三分類（多分類）的原理

文字分類實驗（多分類）

matlab 下交叉驗證與 svm （多分類）模型的使用

機器學習演算法的Python實現 (1)：logistics迴歸與線性判別分析（LDA）

線性判別分析(LDA)和python實現（多分類問題）

相關推薦