1. 程式人生 > >圖信號處理進行大數據分析

圖信號處理進行大數據分析

決策 lsi reg rac sig 能夠 .com 計劃 represent

Sandryhaila A, Moura J M F. Big data analysis with signal processing on graphs: Representation and processing of massive data sets with irregular structure[J]. IEEE Signal Processing Magazine, 2014, 31(5): 80-90.

用圖信號處理進行大數據分析

discrete signal processing 離散信號處理 DSP

圖上的DSP : DSPG

linear shift-invariant 線性平移不變濾波 LSI

這篇文章討論了一種基於圖上離散信號處理的大規模數據分析範式。 從經典信號處理理論到由一般圖標記的數據,DSPG推廣了信號處理的概念和方法。

1. 簡介

大量的原始數據能夠用於決策制定和行動計劃,但它們的容量和增長的復雜結構限制了許多廣泛應用於小數據集的方法的可用性,如 主成分分析(PCA),奇異值分解(SVD),譜分析等。大數據的問題,需要新的範式,技術和算法。

一些算法可以用來表示和處理擁有復雜結構的大數據集。由多個參量描述的多維數據,可以用多路數組(multiway arrays)來表示和分析。多路數組已應用於生物醫學信號處理,電訊和傳感器信號處理等領域。

高維數據的低維表示

已得到了廣泛研究。在這些方法中,數據集被視為高維空間中的圖,數據被投影到由圖拉普拉斯本征基的子集生成的低維子空間。

圖上的信號處理將經典信號處理推廣到一般的圖。

2. 圖上的信號處理

2.1 圖信號 graph signals

  DSPG 研究對於數據集的分析和處理,其中的數據元素由依賴性,相似性,物理鄰近,或其它性質相聯系。這種關系通過一個圖來表示:

  G=( V, A) V是N個節點的集合;A 是圖的權重鄰接矩陣。每個數據元素對應一個節點 vn , 非0權重(矩陣元) An,m 表示從vm 到 vn 的有向邊。

  給定一個圖, 數據集構成一個圖信號,定義為一個映射:

$\mathbf{s}: v_{n} \mapsto \mathit{s}_{\mathit{n}} $

可以將圖信號寫為一個矢量:

  $\mathbf{s}=\left [ s_{0} \right s_{1} \cdots s_{N-1}]^{T} $

  這個矢量不僅僅是個列表, 而是一個圖。

  技術分享

  (a): 有限周期時間序列, 用有向有環圖標記。

  (b) 傳感器網絡收集的天氣數據。

  (c)網站的特征為圖信號。每個節點表示一個網站,有向邊表示超鏈接。比如很多網站都指向某個網站,被指向的網站可能會具有很高的瀏覽量。

  (d)社交網絡中采集的圖信號:個體特征構成了社交圖中的圖信號。節點表示個體,邊將人們連接起來基於他們的友誼,合作或其他關系。

2.2 圖位移 graph shift

  在DSP中,信號位移由時間延遲執行。 一個長度為N 的延遲有限周期時間序列為: $\mathbf{\tilde{s}}_{n}=s_{\textup{mod}(n-1,N)} $ (商可以為負數,而余數必須為非負數)

  即原信號為:

  $\mathbf{s}=\left [ s_{0} \right s_{1} \cdots s_{N-1}]^{T} $

  位移信號為:

  $ \mathbf{\tilde{s}}_{n}=\left [ s_{N-1} \right s_{0} ,s_{1} \cdots s_{N-2}]^{T}$

  兩者的關系為:

  $\mathbf{\tilde{s}}=\mathbf{C}\mathbf{s}$

  C為 N*N 循環位移矩陣:

  $$

\mathbf{C}=\begin{bmatrix}
0&0 &0 &0 &0 &1 \\
1 & & & & & \\
& .& & & & \\
& &. & & & \\
& & &. & & \\
& & & &1 &
\end{bmatrix}

$$

 $\mathbf{C}=$ 

圖信號處理進行大數據分析