1. 程式人生 > >圖分析與視覺化

圖分析與視覺化

  • 非迴圈圖(Acyclic Graph): 從任意節點沿著連線經過其他任意節點時不包含迴圈的圖
  • 鄰接矩陣(Adjacency Matrix): 一個表,其中所有節點都被分配一個行和一個列。單元格中的非零值代表行節點與列節點之間的一個連線
  • 間距中心度(Betweenness Centrality):節點重要性的一種度量,反映了該節點在圖中每個節點之間的最短路徑上的次數
  • 二部圖(Bipartite Graph): 在這種圖中,一類節點只能連線到另一類節點。例如,在顧客購買資料中,顧客只能通過公共產品連線起來,而不能直接彼此連線。
  • 廣度優先搜尋(Breadth-First Search,BFS):這種演算法從一個節點開始,依次遍歷其每個臨近節點,然後才向外下降一度,直到到達目標節點
  • 中心度(Centrality): 節點在圖中的重要性,基於其連線計算
  • 弦圖(Chord Diagram):一種圖視覺化技術,用於視覺化包含不對稱雙向流的資料。其中,節點被排列在一個圓上,並且通過兩端寬度不同的帶形連線起來
  • 團伙(Clique): 一個子圖,其中每個節點都連線到了該子圖中的其他每個節點
  • 緊密中心度(Closeness Centrality): 節點在圖中的重要性的一種特殊的計算度量,基於該節點到其他所有節點的路徑距離的接近程度。在這種中心度形式中,如果某個節點到達其他所有節點所用的步驟最少,那麼該節點就是重要的節點。
  • 聚類(Clustering): 按照相對相關性分組。圖聚類是一種特殊型別的聚類,在計算相關性時會評估連線
  • 社群(Community): 圖中緊密關聯的節點構成的簇
  • 決策樹(Decision Tree): 一個樹,從根節點開始,其中的每個節點都代表一個決策,其分支反映了採用一個路徑或另一個路徑的條件
  • 度(Degree): 度可以表示節點度,即節點的連線數;也可以表示路徑度,即從一個節點出發,沿著連線到達其他節點的步驟數。
  • 度中心度(Degree Centrality): 節點在圖中的重要性的一個簡單的度量,基於節點具有的連線數
  • 深度優先搜尋(Depth-First Search): 這種演算法從一個節點開始,依次儘可能深地遍歷每個分支,然後再返回去遍歷下一個分支,直到到達目標節點
  • 有向迴圈圖(Directed Acyclic Graph): 不包含迴圈(連接回到路徑上已存在的節點的路徑)的有向圖
  • 有向圖(Directed Graph): 連線具有方向的圖
  • 不連通圖(Disconnected Graph): 圖中有兩個或多個子圖,這些子圖沒有連通起來
  • 邊(Edge): 節點之間的一種關係,通常用線條表示。邊更常被叫做連線
  • 自我網路(Ego NetWork): 圍繞一個節點的子圖,由該節點連線的節點及它們之間的所有連線組成。自我網路也可被叫做鄰域。自我網路可由度定義
  • 特徵向量中心度(Eigenbvector Centrality):節點在圖中的重要性的一種特殊的計算度量,基於傳遞影響(transitive influence)。在這種度中心度形式中,如果其他重要的節點都連線到某個節點,那麼該節點就是最重要的節點。
  • 力導向佈局(Force-Directed Layout):一類圖佈局,使用節點間的斥力和連線上的吸引力在空間上聚類相關節點
  • 關聯連線(Incident Links): 如果一個連線與一個節點連通,就稱該連線關聯到該節點
  • 孤立節點(Isolated Node):沒有節點的節點
  • 葉節點(Leaf Node): 有入連線,但是沒有出連線的節點
  • 連線(Link): 節點之間的一種關係,通常被表示為一個線條。在圖論中,連線常常被叫做邊
  • 迴路(Loop): 起點和終點連線到相同節點的連線,也叫做自迴路
  • 模組度(Modularity): 社群強度的一種度量,或者,更多時候指的是以計算該度量為基礎的社群發現演算法
  • 網路(NetWork): 圖的另外一個名稱,其中的每個節點通常代表一個物理實體,而不是更加抽象或者概念化的東西
  • 頁面排名(Page Rank): 特徵向量中心度的一種變體,是Google的第一個搜尋演算法的基礎。頁面排名根據連結到某個頁面的其他相關頁面的聚合權重,評估該頁面的相關性。儘管名稱提到了頁面,但是該演算法可以用到任意型別的圖資料來估計節點的重要性
  • 路徑(Path): 從一個節點到達另一個節點時遍歷的一系列連線
  • 平面圖(Planar Graph): 在繪製時連線不會交叉的圖
  • 鄰域(Neighborhood): 圍繞一個節點的子圖,由該節點連線的節點及它們之間的所有連線組成。在社交網路中,自我網路就是一個鄰域。鄰域可由度定義
  • 節點(Node): 連線到其他實體或事物的一個實體或事物。在圖論中,節點通常被稱為頂點
  • 桑基圖(Sankey Diagram): 一種視覺化技術,按列排列節點,並且不同大小的連線從一段進入,從另一端離開
  • 自迴路 (Self-Loop): 起點和終點連線到相同節點的連線
  • 最短路徑(Shortest Path):兩個節點間的最小路徑或距離
  • 生成樹(Spanning Tree): 一個子圖,其中包含所有相連節點,但是隻包含將這些節點連線起來所需的最小連線集合,從而形成一個樹
  • 空間網路(Spatial Network):一種圖,其中的節點位置反映了所表示元素內在的空間特性,而不是與其他節點的關係
  • 子圖(Subgraph): 圖中的一個節點和連線子集
  • 樹(Tree): 一種圖,不包含迴圈路徑,並且任意兩個節點之間只有一條路徑。分層是樹的一個例子
  • 無向圖(Undirected Graph): 連線的方向沒有意義的圖(例如代表互相關係—如友情—的連線)
  • 頂點(Vertex): 連線到其他實體(或事物)的一個實體(或事物)。頂點更常被叫做節點
  • 權重(Weight): 權重以抽象的方式指示連線或節點相對於其他連線或節點的強度或重要性。連線權重通常直接從它所表示的關係的基本屬性對映而來,而節點權重通常從派生度量(例如中心度)對映而來。在兩種情況中,權重常常被規範化,並且大部分時候在視覺上通過大小反映出來