A Hierarchical End-to-End Model for Jointly Improving Text Summarization and Sentiment Classificatio
abstract
文字摘要和情感分類都是要捕獲文字的重要資訊,但是在不同的水平上的。文字摘要是用一些句子表示原始文件,情感分類是給文字貼標籤。
提出層次級的端到端模型進行摘要抽取和情感分類的聯合學習,標籤是作為文字摘要抽取的輸出,情感分類依賴於摘要抽取, 情感分類放在摘要抽取上面
1 Introduction
文字分類和情感分類是自然語言處理中的兩大任務,文字摘要主要抽取原始文字的主要資訊,和抽取式摘要(從文字中抽取一部分文字出來)相比,抽象型摘要建立在內部語義資訊的表示,然後使用自然語言生成技術獲得摘要。我們主要關注抽象型文字摘要,情感分類是給文字貼標籤,決定文字的正負,也叫觀點挖掘,文字摘要和情感分類都是挖掘文字的主要意思,文字摘要使用詞語和句子表示文字,而情感分類使用標籤表示文字。
現有模型中,
對於抽象型的文字摘要,最流行的模型是sequence-to-sequence模型,在長文字和短文字之間學習一個對映。模型包含了一個編碼器和解碼器,編碼器把原始文字使用潛在空間表示,解碼器獲得摘要,最近的一些抽象型摘要模型是sequence-to-sequence模型的變體,對於情感分類,最近使用最多的是神經網路結構,比如LSTM,CNN。
一些工作提出的模型可以產生摘要和情感標籤,但是,摘要抽取和情感分類是分開的,並且需要人工抽取特徵,也有一些工作是情感摘要,從特定的類中的文字抽取句子,這主要關注摘要抽取,而不是情感分類。
本工作主要是提高文字摘要和情感分類,提出層次級的端到端網路,包含了摘要層和分類層,抽取層將原始文字壓縮成短句子,情感分類層再總結層一個標籤,層次級結構建立了文字摘要和情感分類之間的關係,兩個任務可以互相提高,壓縮文字後,對於分類器可以更容易進行預測標籤,還有,文字抽取可以獲得重要和有資訊的詞,並且去除多餘和複雜資訊,這些資訊對於預測有害,情感分類可以提供更重要的資訊給文字摘要抽取,並且指導摘要抽取部分捕獲原始文字的重要資訊,這可以提高短文字和長文字之間的聯絡。
使用Amazon的線上語料。
本文的貢獻:
1 把文字分類作為一種特殊的摘要,在同一個模型中進行情感分類和文字摘要。
2 提出multi-view的注意力機制獲得文字的不同的表示,
3 實驗證明我們的結果比baselines好。
2 Proposed Model
2.1 Problem Formulation
2.2 Model Overview
2.3 Text Encoder
2.4 Summary Decoder with Multi-View Attention
2.5 Summary-Aware Sentiment Classifier
2.6 Overall Loss Function and Training
3 Experiments
3.1 Datasets
3.2 Evaluation Metric
3.3 Experimental Details
優化器:Adam
learning rate=0.003
two momentum parameters:β1=0.9, β2=0.999
batch size=64