機器學習之LDA線性判別分析模型

阿新 • • 發佈：2018-11-23

機器學習之LDA線性判別分析模型

# -*- coding: utf-8 -*-
"""
Created on Wed Nov 21 21:03:14 2018

@author: muli
"""

import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets, discriminant_analysis,cross_validation


def load_data():
    '''
    載入用於分類問題的資料集

    :return: 一個元組，用於分類問題。元組元素依次為：訓練樣本集、測試樣本集、訓練樣本集對應的標記、測試樣本集對應的標記
    '''
    # 使用 scikit-learn 自帶的 iris 資料集
    iris=datasets.load_iris() 
    X_train=iris.data
    y_train=iris.target
    # 分層取樣拆分成訓練集和測試集，測試集大小為原始資料集大小的 1/4
    return cross_validation.train_test_split(X_train, y_train,test_size=0.25,
		random_state=0,stratify=y_train)


def test_LinearDiscriminantAnalysis(*data):
    '''
    測試 LinearDiscriminantAnalysis 的用法

    param data: 可變引數。它是一個元組，這裡要求其元素依次為：訓練樣本集、測試樣本集、訓練樣本的標記、測試樣本的標記
    return:  None
    '''
    X_train,X_test,y_train,y_test=data
    # 載入LDA線性判別分析模型
    lda = discriminant_analysis.LinearDiscriminantAnalysis()
    # 訓練模型
    lda.fit(X_train, y_train)
    # 返回 W值 和 b值
    print('Coefficients:%s, intercept %s'%(lda.coef_,lda.intercept_))
    # 返回預測的準確率
    print('Score: %.2f' % lda.score(X_test, y_test))


def plot_LDA(converted_X,y):
    '''
    繪製經過 LDA 轉換後的資料

    :param converted_X: 經過 LDA轉換後的樣本集
    :param y: 樣本集的標記
    :return:  None
    '''
    from mpl_toolkits.mplot3d import Axes3D
    fig=plt.figure()
    ax=Axes3D(fig)
    colors='rgb'
    markers='o*s'
    for target,color,marker in zip([0,1,2],colors,markers):
        pos=(y==target).ravel()
        X=converted_X[pos,:]
        ax.scatter(X[:,0], X[:,1], X[:,2],color=color,marker=marker,
			label="Label %d"%target)
    ax.legend(loc="best")
    fig.suptitle("Iris After LDA")
    plt.show()


def run_plot_LDA():
    '''
    執行 plot_LDA 。
    其中資料集來自於 load_data() 函式

    :return: None
    '''
    X_train,X_test,y_train,y_test=load_data()
    X=np.vstack((X_train,X_test))
    Y=np.vstack((y_train.reshape(y_train.size,1),y_test.reshape(y_test.size,1)))
    lda = discriminant_analysis.LinearDiscriminantAnalysis()
    lda.fit(X, Y)
    converted_X=np.dot(X,np.transpose(lda.coef_))+lda.intercept_
    plot_LDA(converted_X,Y)


def test_LinearDiscriminantAnalysis_solver(*data):
    '''
    測試 LinearDiscriminantAnalysis 的預測效能隨 solver 引數的影響

    :param data: 可變引數。它是一個元組，這裡要求其元素依次為：訓練樣本集、測試樣本集、訓練樣本的標記、測試樣本的標記
    :return:  None
    '''
    X_train,X_test,y_train,y_test=data
    solvers=['svd','lsqr','eigen']
    for solver in solvers:
        if(solver=='svd'):
            lda = discriminant_analysis.LinearDiscriminantAnalysis(solver=solver)
        else:
            lda = discriminant_analysis.LinearDiscriminantAnalysis(solver=solver,
			shrinkage=None)
        lda.fit(X_train, y_train)
        print('Score at solver=%s: %.2f' %(solver, lda.score(X_test, y_test)))


def test_LinearDiscriminantAnalysis_shrinkage(*data):
    '''
    測試  LinearDiscriminantAnalysis 的預測效能隨 shrinkage 引數的影響

    :param data: 可變引數。它是一個元組，這裡要求其元素依次為：訓練樣本集、測試樣本集、訓練樣本的標記、測試樣本的標記
    :return:  None
    '''
    X_train,X_test,y_train,y_test=data
    shrinkages=np.linspace(0.0,1.0,num=20)
    scores=[]
    for shrinkage in shrinkages:
        lda = discriminant_analysis.LinearDiscriminantAnalysis(solver='lsqr',
			shrinkage=shrinkage)
        lda.fit(X_train, y_train)
        scores.append(lda.score(X_test, y_test))
    ## 繪圖
    fig=plt.figure()
    ax=fig.add_subplot(1,1,1)
    ax.plot(shrinkages,scores)
    ax.set_xlabel(r"shrinkage")
    ax.set_ylabel(r"score")
    ax.set_ylim(0,1.05)
    ax.set_title("LinearDiscriminantAnalysis")
    plt.show()


if __name__=='__main__':
    X_train,X_test,y_train,y_test=load_data() # 產生用於分類的資料集
    # 呼叫 test_LinearDiscriminantAnalysis
#    test_LinearDiscriminantAnalysis(X_train,X_test,y_train,y_test)
    # 呼叫 run_plot_LDA
#    run_plot_LDA() 
    # 呼叫 test_LinearDiscriminantAnalysis_solver
#    test_LinearDiscriminantAnalysis_solver(X_train,X_test,y_train,y_test) 
    # 呼叫 test_LinearDiscriminantAnalysis_shrinkage
    test_LinearDiscriminantAnalysis_shrinkage(X_train,X_test,y_train,y_test)

機器學習之LDA線性判別分析模型

機器學習之LDA線性判別分析模型 # -*- coding: utf-8 -*- """ Created on Wed Nov 21 21:03:14 2018 @author: muli """ import matplotlib.pyplot as plt im

【機器學習】LDA線性判別分析原理及例項

1、LDA的基本原理 LDA線性判別分析也是一種經典的降維方法，LDA是一種監督學習的降維技術，也就是說它的資料集的每個樣本是有類別輸出的。這點和PCA不同。PCA是不考慮樣本類別輸出的無監督降維技術。LDA的思想可以用一句話概括，就是“*投影后類內方

Python機器學習筆記：線性判別分析（LDA）演算法

預備知識　　首先學習兩個概念：　　線性分類：指存在一個線性方程可以把待分類資料分開，或者說用一個超平面能將正負樣本區分開，表示式為y=wx，這裡先說一下超平面，對於二維的情況，可以理解為一條直線，如一次函式。它的分類演算法是基於一個線性的預測函式，決策的邊界是平的，比如直線和平面。一般的方法有感知器，最小

LDA 線性判別分析模型

線性判別分析（Linear Discriminant Analysis，LDA）是一種可作為特徵抽取的技術，可以提高資料分析過程中的計算效率，同時對於不適用於正則化的模型，它可以降低模型災難帶來的過擬合。 1、LDA 的概念與 PCA 區別與聯絡 1.PCA 試圖在資

文字分類之降維技術之特徵抽取之LDA線性判別分析

背景：為什麼需要特徵抽取？基於的向量空間模型有個缺點，即向量空間中的每個關鍵詞唯一地代表一個概念或語義單詞，也就是說它不能處理同義詞和多義詞，然而實際情況是：一個詞往往有多個不同的含義，多個

機器學習之LDA主題模型演算法

1、知道LDA的特點和應用方向 1.1、特點知道LDA說的降維代表什麼含義：將一篇分詞後的文章降維為一個主題分佈（即如20個特徵向量主題）。根據對應的特徵向量中的相關主題概率（20個主題的概率相加為1即為主題分佈）得到對應的文件主題，屬於無監督學習（你沒有

生成學習演算法之高斯判別分析模型

第四部分生成學習演算法到目前為止，我們主要討論了建模——給定下的的條件分佈——的學習演算法。例如，邏輯迴歸把建模成，這裡是sigmoid函式。在這些講義中，我們將討論一種不同形式的學習演算法。考慮一個分類問題，在這個分類問題中，我們想基於一個動物的一些特徵，來學習

LDA 線性判別分析

討論 report 二維一個 tutorial 沒有 ron get 是否 http://blog.csdn.net/porly/article/details/8020696 1. LDA是什麽線性判別式分析（Linear Discriminant Anal

機器學習之PCA主成分分析

ping app 最大們的理解 style 避免 -m size 前言以下內容是個人學習之後的感悟，轉載請註明出處~ 簡介　　在用統計分析方法研究多變量的課題時，變量個數太多就會增加課題的復雜性。人們自然希望變量個數較少而得到的信息較

[七]機器學習之LDA

7.1 目標i任務 1.熟悉LDA在自然語言處理中的應用 2.掌握python-lda庫 3.測試LDA模型訓練中，不同引數的設定對結果產生的影響 7.2 實驗環境 1.python2.7、Numpy、Sklearn 2.Python-jieba：結巴分詞，用於對語料檔案進行

機器學習之一元線性迴歸

概述線性迴歸是利用數理統計中迴歸分析，來確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法，運用十分廣泛。其表達形式為y = w'x+e，e為誤差服從均值為0的正態分佈。迴歸分析中，只包括一個自變數和一個因變數，且二者的關係可用一條直線近似表示，這種迴歸分析稱為一元線性迴歸分析。如果迴歸分析

MATLAB實現LDA線性判別分析

程式碼如下 clear all;close all;clc; x=[0.697,0.774,0.634,0.608,0.556,0.403,0.481,0.437,0.666,0.243,0.245,0.343,0.639,0.657,0.360,0.593,0

史上最好的LDA(線性判別分析)教程

一、前言最近由於研究需要，要用到線性判別分析(LDA)。於是找了很多資料來看，結果發現大部分講的都是理論知識，因此最後還是看的一知半解，後來終於找到了個英文的文件，作者由PCA引入LDA，看過後豁然開朗，主要是文件中有詳細的例子，為了保持原版在此就直接貼

機器學習之多變量回歸模型（一）

廢話主要是用sklearn庫中的linear_model中的LinearRegression模型進行訓練，另外對於訓練集資料的讀取用到了上一篇提到的檔案讀取的相關操作，這裡熟悉一下https://blog.csdn.net/jiaowosiye/articl

LDA-線性判別分析

降維方法-LDA線性判別分析

alt box ati 一條直線以及這樣的 pan ear 滿足降維-LDA線性判別分析【機器學習】LDA線性判別分析 1. LDA的基本思想 2. LDA求解方法 3. 將LDA推廣到多分類 4. LD

機器學習之Validation（驗證，模型選擇）

　　對於機器學習的模型選擇來說，即使只是對於二元分類，我們已經學習了很多方法，比如PLA，LR等；很多學習演算法都是可迭代的，需要決定迭代次數；你可能還需要決定每一次迭代走多大，例如梯度下降；或者有很多

LDA線性判別分析Python程式

理論講解需要匯入的包 # -*- coding: utf-8 -*- import numpy as np import csv from matplotlib import pyplot as plt import math 匯入資料集 d

機器學習之樸素貝葉斯模型及程式碼示例

一、樸素貝葉斯的推導樸素貝葉斯學習（naive Bayes）是一種有監督的學習，訓練時不僅要提供訓練樣本的特徵向量X，而且還需提供訓練樣本的實際標記Y，是一種基於貝葉斯定理和特徵條件獨立假設的分類方法。 1. 貝葉斯定理：貝葉斯定理：。對於分

Python機器學習/LinearRegression（線性回歸模型）（附源碼）

max ide 示意圖 res tree near main atp then LinearRegression（線性回歸） 2019-02-20 20:25:47 1.線性回歸簡介線性回歸定義：　　百科中解釋我個人的理解就是：線性回歸算法就是一個使用線性函數作為模

機器學習之LDA線性判別分析模型

相關推薦