《Aspect Based Sentiment Analysis with GCN》閱讀筆記
論文連線: ofollow,noindex">Aspect Based Sentiment Analysis with Gated Convolutional Networks
一、abstract
基於aspect的情感分析(ABSA)旨在預測文字中給定的aspect或實體的情感偏向(sentiment polarities),因此它能提供比一般情感分析更詳細的資訊。
多數實驗使用LSTM和attenion機制來預測有關目標的情感極性,但模型往往很複雜並且需要很長的訓練時間。本文提出了一個基於CNN和Gating Mechanisms(門機制)的模型。一種新的Tanh-ReLU 門單元能夠根據給定的aspect或實體選擇輸出的情感特徵。這個結構比應用於現有模型的attention層簡單得多。同時,本文中模型的計算在訓練中很容易並行化,因為卷積層不像LSTM層那樣有時間依賴性,並且門單元也能夠獨立工作。本文在SemEval 資料集上進行試驗,表明了實驗效果的提升。
二、資料集
SemEval:使用者對相關餐館、筆記本電腦的評論。
三、主要模型


對使用者評論進行意見挖掘和情緒分析可以為商家和消費者提供有價值的資訊。除了預測整體情緒極性, 基於細粒度方面的情緒分析被提出來比傳統的情緒分析更好地理解評論。具體地說, 本文關注文字中的aspect類別或目標實體的情緒極性。有時, 也會加上aspect實體提取。基於細粒度(同一物體中不同子類物體的分類)的情感分析 (ABSA) 能夠比傳統情感分析更好地理解評論。本文關注aspect類別或目標實體的情感極性。許多基於ABSA的模型已經被開發, 主要處理兩個不同的子任務:aspect分類情緒分析 (ACSA) 和aspect實體的情緒分析 (ATSA)。ACSA 的目標是對於給定的幾個預定義的類別之一的aspect預測情緒偏向;ATSA的目標是識別文字中出現的目標實體的情緒偏向,這可能是一個多詞短語或一個單詞。例如, 在句子 "Average to good Thai food, but terrible delivery ."中, ATSA 會分析實體Thai food的情感極性;ACSA 會分析aspect“service”情感極性, 即使“service”沒有出現在句子中。
本文模型在更端的訓練時間下能得到更好的精確度。對於ACSA任務,模型在embedding層之上有兩個單獨的卷積層,這個embedding層的輸出是由新型門單元的組合組成的。多個濾波器的卷積層可以有效地提取每個接受域上多個粒度的n-gram特徵。門單元有兩個非線性門,兩個中的每一個都和一個卷積層連結。在給定的aspect資訊下,對於情感的預測能夠抽取aspect-specific情感資訊。比如說,在句子“Average to good Thai food, but terrible delivery”中當food這個aspect被提供,門單元能夠自動忽視在第二個子句中delivery這個aspect的消極情緒,並且只輸出第一個子句的積極情緒。因為模型中的每個組成部分都能夠並行,因此比LSTM和attention機制需要更少的訓練時間。對於ATSA任務,其中aspect由多個單片語成,本文擴充套件了模型以包含目標表達式的另一個卷積層。
四、相關工作
4.1 Neural Networks
語法翻譯:Tree-LSTM ,Recursive Neural Tensor Network
情感分析:RNN(比如LSTM和GRU)
自然語言處理(NLP):CNN
4.2 Aspect based Sentiment Analysis
Aspect-Term Sentiment Analysis :對給定句子中標記的Aspect-Term進行情感分析;許多文獻試圖利用目標詞和周圍語境詞之間的關係或位置,或者使用依賴樹結構,或者簡單地把它們之間的詞數作為關聯資訊。
Aspect-Category Sentiment Analysis: 基於attention的LSTM利用指向aspect詞的嵌入式向量來選擇性地關注LSTM生成的表示區域
五、實驗結果
5.1 Datasets and Experiment Preparation
現有的工作從四類情緒標籤刪除了“conflict”標籤,這使得他們的結果非常好。本文重現了這種比較方法。
在評論資料中, 對句子中不同aspect或目標有不同情緒標籤的句子比標準情緒分類更常見。表1中的句子顯示了評論者對兩個方面的不同態度: 食物和配送。因此, 為了更準確地評估模型對評論句子的處理方式, 本文建立了一些小而複雜的資料集, 它們由對不同aspect/目標有相反或不同情緒的句子組成。在表1中, 資料集包括像這樣的兩個相同的句子, 但有不同的情緒標籤。如果一個句子有4個aspect的目標, 這個句子將有4個副本在資料集, 其中每一個副本都與不同的目標和情緒標籤相關聯。

5.2 ACSA任務
本文在SemEval 2014 Task 4中餐館評論資料中進行實驗,有5個aspect:food、price、 service、ambience和misc;4個情感極性:positive、negative、neutral和conflict。通過整理2014-2016年的餐館評論,得到一個大資料集“Restaurant-Large”。其中不相容的部分在合併時已經被修剪。在2014年的資料中我們將conflict標籤用neutral標籤替代。在2015和2016年的資料中,一個句子可能有多對“aspect terms”“aspect category”。對於每個句子,用p來表示positive標籤的數量減去negative標籤的數量的結果。當p>0時我們分配這個句子積極標籤,當p<0時消極標籤,或者p=0是neutral標籤。統計結果如下表2,最後的資料集有8個aspect:restaurant、food、drinks、ambience、service、price、misc和location。

5.3 ATSA 任務
本文在SemEval 2014 Task 4中的餐館評論資料中進行實驗,在每個資料集上,我們複製每個句子na次,這等於關聯的方面類別(ACSA)或方面術語(ATSA)的數量。hard data的大小也在表2中展示出來,該測試集旨在測量模型是否可以在一個句子中針對不同的實體檢測到多個不同的情感極性。如果沒有這樣的句子,對於僅與一個情感標籤相關聯的句子,用於整體情感分類的分類器效果會更好。
向量初始化: 在本文的實驗中,使用300維GloVe向量初始化單詞嵌入向量,該向量在840億標記的未標記資料上進行預訓練。GloVe詞彙表外的單詞隨機初始化為均勻分佈U(-0.25,0.25)。

六、Results and Analysis
ASCA

ATSA

Gating Mechanisms

Visualization

七、Conclusions and Future Work
本文提出了一種高效的卷積神經網路來處理ACSA和ATSA任務。GTRU可以根據給定的aspect資訊有效地控制情緒流,兩個卷積層分別對aspect和情感資訊進行建模。通過對 SemEval 資料集的廣泛實驗,證明了與其它神經模型相比其效能的提升。如何利用神經網路中的大規模情緒詞彙是未來進一步探究的工作。