【python】雙向二維PCA（2D-2D PCA）演算法實現

阿新 • • 發佈：2019-01-08

原理介紹

PCA

這篇教程講的非常詳細。

以圖片為例，將每張圖片（假設寬高為 m n）轉化為m*n的一維向量，然後減去每張圖片畫素的均值（使得每張圖片均值為零），然後資料集中的所有圖片一起合成一個大的矩陣X。

計算圖片矩陣的方差-協方差矩陣，我們的優化目標就是將這個矩陣對角化，使得欄位（代表一張圖片）兩兩之間的協方差為零，也就是相關性最小，欄位與自身的方差儘可能大。如下：
D=1mYYT=1m(PX)(PX)T=1mPXXTPT=P(1mXXT)PT=PCPT

Y=PX，P為一組基，Y為在P上對映後的資料，D為對映後資料的協方差矩陣，也就是我們的優化目標矩陣，X為資料矩陣。C=

1mXXT，也就是原資料的協方差矩陣。我們的目標現在是找到能將矩陣C對角化，使得D成為一個對角矩陣。

數學上矩陣對角化只需計算出C的特徵值和特徵向量，並取前k大的特徵值對應的特徵向量，也就是投影之後方差最大的那些基，即可得到P矩陣，k就是降維後的維數。

2D PCA

相較於傳統PCA，2D PCA不用將圖片轉換為1D向量，極大的減少了資料的維度。基本思路和PCA相同，也是將資料投影到某組基上，然後使得投影之後資料的協方差矩陣成為對角陣。投影后資料的協方差矩陣為：

Sx=E[(Y−EY)(Y−EY)T]=E[AX−E(AX)][AX−E(AX)]T=E[(A−EA)X][(A−EA)

X]T

Y為投影之後的資料，Y=AX，A是原資料，X是一組正交基，Sx也就是協方差矩陣。上述公式變形之後之後可得（利用tr(AB)=tr(BA)，只要保證跡不變即可，這裡還有點沒搞懂為什麼）：

Sx=XT[E(A−EA)T(A−EA)]X

然後再定義矩陣Gt為：

Gt=E(A−EA)T(A−EA)
也就是原資料的協方差矩陣。

類似於傳統PCA，我們優化目標就是將使矩陣S_x成為對角陣，並找出對應的特徵向量和特徵值，也就是將G_t對角化，取前K大的特徵向量。

2D-2DPCA

雙向2D PCA的改進之處在於，普通2D PCA中的變換隻提取了資料矩陣行內的特徵，對行進行了變換，而雙向PCA則加上了對列進行的變換。

Sx=E[(B−EB)(B−EB)T]=E[ZTA−E(ZTX)][ZTA−E(ZTA)]T=ZTE[(A−EA)(A−EA)T]Z

列變換對應的Gt矩陣為：

Gt=E[(A−EA)(A−EA)T]

對列進行2D PCA也就是對上述矩陣提取特徵向量，得到一組基Z，然後對原始資料進行投影。

為了將列和行的變換合併，最後進行如下變換：

C=ZTAX

X為行方向上2D PCA得到的變換矩陣，Z為列方向上2D PCA得到的變換矩陣，A為原資料。要還原圖片資料也很簡單，已知C矩陣：

A=ZCXT

因為特徵向量相互正交，Z，X均為正交陣，正交陣的逆矩陣就是其轉置。

python 實現

用python實現了一下演算法：

# a implementation of 2D^2 PCA algorithm

import numpy as np
from PIL import Image

def PCA2D_2D(samples, row_top, col_top):
    '''samples are 2d matrices'''
    size = samples[0].shape
    # m*n matrix
    mean = np.zeros(size)

    for s in samples:
        mean = mean + s

    # get the mean of all samples
    mean /= float(len(samples))

    # n*n matrix
    cov_row = np.zeros((size[1],size[1]))
    for s in samples:
        diff = s - mean;
        cov_row = cov_row + np.dot(diff.T, diff)
    cov_row /= float(len(samples))
    row_eval, row_evec = np.linalg.eig(cov_row)
    # select the top t evals
    sorted_index = np.argsort(row_eval)
    # using slice operation to reverse
    X = row_evec[:,sorted_index[:-row_top-1 : -1]]

    # m*m matrix
    cov_col = np.zeros((size[0], size[0]))
    for s in samples:
        diff = s - mean;
        cov_col += np.dot(diff,diff.T)
    cov_col /= float(len(samples))
    col_eval, col_evec = np.linalg.eig(cov_col)
    sorted_index = np.argsort(col_eval)
    Z = col_evec[:,sorted_index[:-col_top-1 : -1]]

    return X, Z


samples = []
for i in range(1,6):
    im = Image.open('image/'+str(i)+'.png')
    im_data  = np.empty((im.size[1], im.size[0]))
    for j in range(im.size[1]):
        for k in range(im.size[0]):
            R = im.getpixel((k, j))
            im_data[j,k] = R/255.0
    samples.append(im_data)

X, Z = PCA2D_2D(samples, 90, 90)

res = np.dot(Z.T, np.dot(samples[0], X))
res = np.dot(Z, np.dot(res, X.T))

row_im = Image.new('L', (res.shape[1], res.shape[0]))
y=res.reshape(1, res.shape[0]*res.shape[1])

row_im.putdata([int(t*255) for t in y[0].tolist()])
row_im.save('X.png')

在實現過程中遇到了一個小坑，特此記錄一下。PIL圖片中的size是圖片的（寬，高）二元組，而numpy中的array的shape則是矩陣的（行數，列數）二元組，索引的時候也是按照這種二元組來索引的。

在從圖片讀取畫素然後轉存到array中的時候很容易混淆這兩個概念，實際上矩陣的行數相當於圖片中的高，列數相當於寬，二者的概念剛好顛倒，很容易出錯。

用下面5張圖片做了實驗：

這裡寫圖片描述

下面分別是X，Z矩陣分別取前5，10，20，40個特徵向量時，圖片還原的結果：

這裡寫圖片描述

可以看出用前40個特徵向量時，已經能夠還原出很細緻的原圖了，原圖解析度為96*118，就是說，經過雙向2D PCA後，用40*40的特徵就能很好地表達96*118的資料，極大的降低了維度。

【python】雙向二維PCA（2D-2D PCA）演算法實現

原理介紹 PCA 這篇教程講的非常詳細。以圖片為例，將每張圖片（假設寬高為 m n）轉化為m*n的一維向量，然後減去每張圖片畫素的均值（使得每張圖片均值為零），然後資料集中的所有圖片一起合成一個大的矩陣X。計算圖片矩陣的方差-協方差矩陣，我們的優

Python編程：從入門到實踐——【作業】——第十一章（測試代碼）

stc 增加收集得到 width .com ast 接受 ted 第十一章 11-1 城市和國家：編寫一個函數，它接受兩個形參：一個城市名和一個國家名。這個函數返回一個格式為City, Country 的字符串，如Santiago, Chile 。將這個函

【JS】搜尋二維矩陣 #陣列 #二分查詢

編寫一個高效的演算法來判斷 m x n 矩陣中，是否存在一個目標值。該矩陣具有如下特性：每行中的整數從左到右按升序排列。每行的第一個整數大於前一行的最後一個整數。示例 1: 輸入: matrix = [ [1, 3, 5, 7], [10, 11, 16, 20], [23,

【劍指offer】重建二叉樹（含測試函式）

根據前序遍歷和中序遍歷，利用遞迴的思想實現重建二叉樹，並輸出後序遍歷程式碼如下： /** * Created by Administrator on 2018/11/28. */ class TreeNode{//建立類 int val; TreeNode left

【python】leetcode 125. Valid Palindrome （easy）

125. Valid Palindrome （easy） Given a string, determine if it is a palindrome, considering only alphanumeric characters and ignoring

【python】leetcode 189. Rotate Array （easy）

189. Rotate Array （easy） Given an array, rotate the array to the right by k steps, where k is non-negative. Example 1:

【LeetCode】304. 二維區域和檢索 - 矩陣不可變結題報告 (C++)

原題地址：https://leetcode-cn.com/problems/range-sum-query-2d-immutable/submissions/ 題目描述：給定一個二維矩陣，計算其子矩形範圍內元素的總和，該子矩陣的左上角為 (row1, col1) ，右下角為 (row2,

【python】re模組的用法（2）—— 提取字串中括號內的內容

Python使用re模組正則提取字串中括號內的內容示例這篇文章主要介紹了Python使用re模組正則提取字串中括號內的內容,結合例項形式分析了Python使用re模組進行鍼對括號內容的正則匹配操作,並簡單解釋了相關修正符與正則語句的用法,需要的朋友可以參考下本文例項講述

【LeetCode】【Python】驗證二叉搜尋樹

題目給定一個二叉樹，判斷其是否是一個有效的二叉搜尋樹。一個二叉搜尋樹具有如下特徵：節點的左子樹只包含小於當前節點的數。節點的右子樹只包含大於當前節點的數。所有左子樹和右子樹自身必須也是二叉搜尋樹。示例 1:輸入: 2 / \ 1 3 輸出: true 示

【Swift】原生二維碼掃描

import UIKit import AVFoundation protocol ScanViewDelegate: NSObjectProtocol{ /// 掃碼資料 /// /// - Parameter pileCode: 編碼 func cap

【leetcode】迴文連結串列（Palindrome Linked List）【python】三種方法

題目連結時間複雜度O(N),空間複雜度O(N) class ListNode: def __init__(self, x): self.val = x se

【Python】高階特性之切片（slice）

在瞭解什麼是切片之前，先考慮一個問題：給定一個字串或者陣列，在Python中如何取其中的一部分資料。比如說我們要取前五個數或者前五個字元。在C++或者Java中底層都封裝了很好的庫函式給我們直接呼叫，比如Java中有subString，那麼在Python中，我們首先

【模板】zoj2859_二維st表

#include <cstdio> #include <algorithm> #include <cmath> using namespace std; int stmin[301][301][9][9]; int n;

【python】打飛機小遊戲（一）

首先宣告一點，這篇部落格完全參照了小甲魚的《零基礎入門學習Python》教學視訊打飛機小遊戲思路： 1、載入背景音樂 2、播放背景音樂（單曲迴圈） 3、我方飛機誕生 interval = 0（

【C++】過載二維陣列下標 [ ][ ]

寫在文章開頭的話讀完這篇文章後，你將學習到下面的知識：（1）一個多維陣列是如何工作的（2）如何過載二維陣列下標 1. 分析過載一維陣列下標很簡單，通過下標傳入的索引值，返回內部陣列中相應的值。那過載二維陣列的下標運算呢？其實過載二維和一維本質是一樣的，因為 C/

【BZOJ3924】幻想鄉戰略遊戲（動態點分治）

truct 產生。。 sum 遊戲 stream str pos struct 【BZOJ3924】幻想鄉戰略遊戲（動態點分治）題面權限題。。。（窮死我了）洛谷題解考慮不修改發現一個貪心的做法假設當前放在當前位置如果它有一個子樹的兵的總數大於總數的一半那

【SPOJ】Longest Common Substring II （後綴自動機）

公共子串排序 -i max node bstr cst 後綴 post 【SPOJ】Longest Common Substring II （後綴自動機）題面 Vjudge 題意：求若幹個串的最長公共子串題解對於某一個串構建\(SAM\) 每個串依次進行匹配同時記

【BZOJ4566】找相同字符（後綴自動機）

print tdi iostream extend 當前位置字符 map 自動 code 【BZOJ4566】找相同字符（後綴自動機）題面 BZOJ 題解看到多串處理，\(SA\)就連起來 \(SAM???\) 單串建自動機然後其他串匹配對於一個串建完\(SAM\

【BZOJ2342】雙倍回文（回文樹）

geo max blog mes ble struct 一半 har void 【BZOJ2342】雙倍回文（回文樹）題面 BZOJ 題解構建出回文樹之後在\(fail\)樹上進行\(dp\) 如果一個點代表的回文串長度為\(4\)的倍數並且存在長度為它的一半的回文

【題解】 [ZJOI2009]假期的宿舍（二分圖匹配）

src max span true bool box 同學 down DC Solution: 處理出床位、要留校的人（註意來訪問的人一定住校），和人與人的關系（連邊）再接著就是二分圖。註意的就是連向的人必須是有床位的還要註意的就是只用判斷住校的同學二分圖板子都

【python】雙向二維PCA（2D-2D PCA）演算法實現

原理介紹

PCA

2D PCA

2D-2DPCA

python 實現

相關推薦