淺談PCA（主成分分析）線性降維演算法用法

阿新 • • 發佈：2018-12-10

sklearn.decomposition.PCA(n_components = None, copy = True, whiten = False)

n_components表示需要保留的主成分個數，即需要降低到幾維；若n_components=1，則表示降低為1維，若n_components=‘mle’，則自動選取要保留的維度。 copy表示是否需要將原始資料集複製一份；若copy=True，則複製原始訓練集的副本，並在副本上進行運算，原始訓練不會有任何改變；若copy=False ，則直接在原始訓練集上進行降維運算。 whiten表示使每個特徵擁有相同的方差

例資料如下這裡寫圖片描述

程式碼如下

#-*- coding: utf-8 -*-
#主成分分析 降維
import pandas as pd

#引數初始化
inputfile = '../data/principal_component.xls'
outputfile = '../tmp/dimention_reducted.xls' #降維後的資料

data = pd.read_excel(inputfile, header = None) #讀入資料

from sklearn.decomposition import PCA

pca = PCA()
pca.fit(data)    #訓練資料
pca.components_ #返回模型的各個特徵向量 

pca.explained_variance_ratio_ #返回各個成分各自的方差百分比
print(pca.components_)
print(pca.explained_variance_ratio_)

執行結果

[[ 0.56788461  0.2280431   0.23281436  0.22427336  0.3358618   0.43679539
   0.03861081  0.46466998]
 [ 0.64801531  0.24732373 -0.17085432 -0.2089819  -0.36050922 -0.55908747
   0.00186891  0.05910423]
 [-0.45139763  0.23802089 
 -0.17685792 -0.11843804 -0.05173347 -0.20091919
  -0.00124421  0.80699041]
 [-0.19404741  0.9021939  -0.00730164 -0.01424541  0.03106289  0.12563004
   0.11152105 -0.3448924 ]
 [-0.06133747 -0.03383817  0.12652433  0.64325682 -0.3896425  -0.10681901
   0.63233277  0.04720838]
 [ 0.02579655 -0.06678747  0.12816343 -0.57023937 -0.52642373  0.52280144
   0.31167833  0.0754221 ]
 [-0.03800378  0.09520111  0.15593386  0.34300352 -0.56640021  0.18985251
  -0.69902952  0.04505823]
 [-0.10147399  0.03937889  0.91023327 -0.18760016  0.06193777 -0.34598258
  -0.02090066  0.02137393]]
[7.74011263e-01 1.56949443e-01 4.27594216e-02 2.40659228e-02
 1.50278048e-03 4.10990447e-04 2.07718405e-04 9.24594471e-05]

本博文主要參考書籍張良均等著《python資料分析與挖掘實戰》

淺談PCA（主成分分析）線性降維演算法用法

sklearn.decomposition.PCA(n_components = None, copy = True, whiten = False) n_components表示需要保留的主成分個數，即需要降低到幾維；若n_components=1，則表

PCA （主成分分析）詳解（寫給初學者）結合matlab（轉載）

整數變量行為保持 sum osc 入參函數 data 一、簡介 PCA（Principal Components Analysis）即主成分分析，是圖像處理中經常用到的降維方法，大家知道，我們在處理有關數字圖像處理方面的問題時，比如經常用的圖像的查詢

PCA（主成分分析）降維演算法詳解和程式碼

1. 前言 PCA ： principal component analysis ( 主成分分析) 最近發現我的一篇關於PCA演算法總結以及個人理解的部落格的訪問量比較高，剛好目前又重新學習了一下PCA （主成分分析）降維演算法，所以打算把目前掌握的做個全面的

機器學習實戰——PCA（主成分分析）

本章關於PCA的程式碼雖少，但涉及到的知識卻很多，由於數學知識比較淺薄，所以在看這章時提前查詢資料複習了很多的概率論和統計學知識和python基礎知識，這裡記錄的很多都是關於PCA的相關知識或理論（例如：特徵向量、協方差矩陣等），由於部分知識涉及較多，講的有點詳細所以文章篇幅

PCA（主成分分析）方法資料降維、重構和人臉識別

本文使用matlab採用PCA完成對資料的降維、重構和人臉識別。我眼中的PCA：資料的維數過高，處理起來耗時又費力，於是就在想我能不能只處理部分維數，並且得到的結果與全部維數的結果一致。噹噹噹，PCA就出爐了。簡單來說，就是一個圖片有2000個特徵維度，而實際上只有其

機器學習系列1 PCA（主成分分析法）

1.PCA的應用 1.降維 2.去除資料相關性，對資料特徵進行抽取 2.主成分選擇原則 (1)主成分是原來變數的線性組合; (2)各主成分之間互不相關; (3)主成分分析的實質就是找到一個正交變換,即有正交陣U,使得一個?維向量

PCA演算法（主成分分析）

寫在前面 Principle Component Analysis 顧名思義，是通過分析向量空間的主成分，將主成分提取出來，不重要的成分略去，從而達到降維壓縮資訊的目的。那什麼才是主成分呢？大家應該知道，一個空間會有自己的一組基向量，空間中的任何一個向量都

運用PCA（主成分分析法）進行人臉識別的MATLAB 程式碼實現

PCA（主成分分析演算法）出現的比較早。PCA演算法依賴於一個基本假設：一類影象具有某些相似的特徵（如人臉），在整個影象空間中呈現出聚類性，因而形成一個子空間，即所謂特徵子空間，PCA變換是最佳正交變換，利用變換基的線性組合可以描述、表達和逼近這一類影象，因此可以進行影象識別

Principal Component Analysis（主成分分析）

PCA原理：通常情況下，在收集資料集時會有很多的特徵，這代表著資料是高冗餘的表示，但是對於某個工程來說其實可能並不需要那麼多的特徵。所以就需要給資料進行降維（Dimensionality Reduction）。降維可以簡化資料，使資料集更易使用，降低時間開銷，而且能減少一部分

（魯棒性主成分分析）Robust PCA

很久很久沒有寫學習筆記了，現在記錄一個老知識。主成分分析，這種方法可以有效的找出資料中最“主要”的元素和結構，去除噪音和冗餘，將原有的複雜資料降維，揭示隱藏在複雜資料背後的簡單結構。我們知道，最簡單的主成分分析方法就是PCA了。從線性代數的角度看，PCA的目

從矩陣（matrix）角度討論PCA（Principal Component Analysis 主成分分析）、SVD（Singular Value Decomposition 奇異值分解）相關原理

0. 引言本文主要的目的在於討論PAC降維和SVD特徵提取原理，圍繞這一主題，在文章的開頭從涉及的相關矩陣原理切入，逐步深入討論，希望能夠學習這一領域問題的讀者朋友有幫助。這裡推薦Mit的Gilbert Strang教授的線性代數課程，講的非常好，循循善誘，深入淺出。 Relevant Link:&

R語言 PCA(主成分分析）

1、關鍵點綜述：主成分分析因子分析典型相關分析，三種方法的共同點主要是用來對資料降維處理的從資料中提取某些公共部分，然後對這些公共部分進行分析和處理。 #主成分分析是將多指標化為少數幾個綜合指標的一種統計分析方法主成分分析是一種通過降維技術把多個變數化成少數幾個主成分的方法，這些主成分能夠反映原

ICA（獨立成分分析）方法及應用於視訊分析心跳檢測

本文整理自論文《Non-contact, automated cardiac pulse measurements using video imaging and blind source separation》及ICA相關資料。獨立成分分析（Independent Component

淺談adb（android debug bridge）的使用

一、什麼是adb 全稱是：Android Debug Bridge，即安卓除錯橋，是安卓sdk的一個工具； adb的B/S結構 adb工具是一個客戶端-伺服器的應用程式，包含三個方面： 1. client（客戶端）：執行在PC上。其實就是shell，用來發送命令給Server

一隻簡單的網路爬蟲（基於linux C/C++）————淺談併發（IO複用）模型

Linux常用的併發模型 Linux 下設計併發網路程式，有典型的 Apache 模型（ Process Per Connection ，簡稱 PPC ）， TPC （ Thread Per Connection ）模型，以及 select 模型， poll

淺談ACL（訪問控制列表）

精準掩碼數據包過濾列表 OSI七層匹配 acc seq ACL（訪問控制列表）是應用在路由器接口的指令列表。這些指令列表用來告訴路由器，那些數據包可以接收，那些數據包需要拒絕。基本原理為：ACL使用包過濾技術，在路由器上讀取OSI七層模型的第三層及第四層包頭中的信

淺談DDD（領域驅動設計）

![領域驅動設計](https://img2020.cnblogs.com/blog/1133883/202011/1133883-20201114163143505-517119101.png) # 背景（Why） 2003 年埃裡克·埃文斯（Eric Evans）發表了《領域驅動設計》（Domain-

【機器學習】主成分分析PCA（Principal components analysis）

大小限制總結情況 pca 空間會有 ges nal 1. 問題真實的訓練數據總是存在各種各樣的問題：　　1、比如拿到一個汽車的樣本，裏面既有以“千米/每小時”度量的最大速度特征，也有“英裏/小時”的最大速度特征，

主成分分析（PCA）原理詳解（轉載）

增加信息什麽之前 repl 神奇 cto gmail 協方差一、PCA簡介 1. 相關背景上完陳恩紅老師的《機器學習與知識發現》和季海波老師的《矩陣代數》兩門課之後，頗有體會。最近在做主成分分析和奇異值分解方面的項目，所以記錄一下心得體會。

【轉載】主成分分析法（PCA）

差異投影 3D 方式分享 alt 訓練矩陣 9.png https://www.jisilu.cn/question/252942 進行維數約減（Dimensionality Reduction），目前最常用的算法是主成分分析法 (Principal Componet

淺談PCA（主成分分析）線性降維演算法用法

相關推薦