1. 程式人生 > >Hierarchical Attention Based Semi-supervised Network Representation Learning

Hierarchical Attention Based Semi-supervised Network Representation Learning

can 識別 sent 新的 序列 -type 信息 註意力 semi

Hierarchical Attention Based Semi-supervised Network Representation Learning

1. 任務

給定:節點信息網絡 目標:為每個節點生成一個低維向量 基於半監督的分層關註網絡嵌入方法

2. 創新點:

以半監督的方式結合外部信息 1. 提出SHANE 模型,集成節點結構,文本和標簽信息,並以半監督的方式學習網絡嵌入 2. 使用分層註意網絡學習節點的文本特征, 兩層雙向GRU 提取單詞和句子的潛在特征

3. 背景

1. 現有方法通常基於單詞獲取節點的文本特征矩陣,忽略分層結構(單詞、句子) 2. 不同單詞和句子包含不同數量信息,如何評估節點內容的差異性 3. 標簽,也是重要的監督信息 4. 網絡中存在大量未標記節點,如何合理利用 技術分享圖片

4. 模型

整合節點的結構,文本和標簽信息 基於文本的表示學習 使用分層註意機制

4.1. 問題定義

G = (V, E, T, L) ( V: 節點集 E: 邊集合 T: 節點的文本信息 L: 標簽節點信息 ) 節點u 的文本信息Du = (Su1, Su2,...,Suq) 句子信息 Sui = (Wui..) 給定信息網絡,目標:為每個節點u 整合其結構和文本信息 學習一個低維向量 u,

4.2. 基於文本的表示

分層學習可獲取不同粒度的文本信息
  • 詞嵌入:捕獲詞匯特征
  • 句子嵌入: 捕獲文本特征

4.2.1. word 編碼器

  • 使用雙向 GRU 編碼單詞序列
  • 使用註意力機制識別重要單詞
  • 類似:使用雙向GRU 編碼句子
假設節點 u 包含 q 個句子, 每個句子包含 m 個單詞,通過查詢獲取句子 Sui 的詞語序列 技術分享圖片 使用雙向 GRU 編碼單詞序列 技術分享圖片 ( 通過連接以上兩個方向的 h 可包含兩個方向的信息,使用註意機制識別詞語的重要性,如下) 技術分享圖片 ( Sui 是節點 u 第 i 個句子的嵌入, Cw 是全局的詞語向量,a 是用於句子表示,融合單詞嵌入的權重)

4.2.2. 句子編碼器

類似單詞編碼器,類似的雙向GRU ,得到分層編碼的文本嵌入 ut 為了避免新的表示與原始文本的偏差,獲取分層關註網絡的嵌入後,添加該節點詞嵌入的平均值向量 Uta,得到節點 u 的文本表示 ut 技術分享圖片

4.3. 基於結構的表示

含有邊的兩個節點結構相似 CANE 中將每個部分的對數似然表示為 技術分享圖片 ( u 與 v 相連接, Wu,v為權重,Us 是基於結構的嵌入) u 生成 v 的條件概率為 技術分享圖片 節點 u 的基於結構的嵌入區別於所連接的節點,結構的最終嵌入為與不同節點連接所得的平均值 技術分享圖片 ( E 為 u 的邊)

4.4. 半監督的分層網絡嵌入

未標記的節點:只考慮結構和文本特征 技術分享圖片 為了匹配標簽丟失的節點,我們通過全連接層將節點的嵌入映射到標簽空間,可預測節點的標簽分布 技術分享圖片 ( Ll 表示有標簽的節點子集,有標簽的節點的目標函數為:) 技術分享圖片 ( lamda 是標簽損失權重) SHANE 的全局目標函數: 技術分享圖片

5. 實驗

技術分享圖片 技術分享圖片

Hierarchical Attention Based Semi-supervised Network Representation Learning