1. 程式人生 > >A Hierarchical End-to-End Model for Jointly Improving Text Summarization and Sentiment Classificatio

A Hierarchical End-to-End Model for Jointly Improving Text Summarization and Sentiment Classificatio

abstract

文字摘要和情感分類都是要捕獲文字的重要資訊,但是在不同的水平上的。文字摘要是用一些句子表示原始文件,情感分類是給文字貼標籤。

提出層次級的端到端模型進行摘要抽取和情感分類的聯合學習,標籤是作為文字摘要抽取的輸出,情感分類依賴於摘要抽取, 情感分類放在摘要抽取上面

1 Introduction

文字分類和情感分類是自然語言處理中的兩大任務,文字摘要主要抽取原始文字的主要資訊,和抽取式摘要(從文字中抽取一部分文字出來)相比,抽象型摘要建立在內部語義資訊的表示,然後使用自然語言生成技術獲得摘要。我們主要關注抽象型文字摘要,情感分類是給文字貼標籤,決定文字的正負,也叫觀點挖掘,文字摘要和情感分類都是挖掘文字的主要意思,文字摘要使用詞語和句子表示文字,而情感分類使用標籤表示文字。

現有模型中,

對於抽象型的文字摘要,最流行的模型是sequence-to-sequence模型,在長文字和短文字之間學習一個對映。模型包含了一個編碼器和解碼器,編碼器把原始文字使用潛在空間表示,解碼器獲得摘要,最近的一些抽象型摘要模型是sequence-to-sequence模型的變體,對於情感分類,最近使用最多的是神經網路結構,比如LSTM,CNN。

一些工作提出的模型可以產生摘要和情感標籤,但是,摘要抽取和情感分類是分開的,並且需要人工抽取特徵,也有一些工作是情感摘要,從特定的類中的文字抽取句子,這主要關注摘要抽取,而不是情感分類。

本工作主要是提高文字摘要和情感分類,提出層次級的端到端網路,包含了摘要層和分類層,抽取層將原始文字壓縮成短句子,情感分類層再總結層一個標籤,層次級結構建立了文字摘要和情感分類之間的關係,兩個任務可以互相提高,壓縮文字後,對於分類器可以更容易進行預測標籤,還有,文字抽取可以獲得重要和有資訊的詞,並且去除多餘和複雜資訊,這些資訊對於預測有害,情感分類可以提供更重要的資訊給文字摘要抽取,並且指導摘要抽取部分捕獲原始文字的重要資訊,這可以提高短文字和長文字之間的聯絡。

使用Amazon的線上語料。

本文的貢獻:

1 把文字分類作為一種特殊的摘要,在同一個模型中進行情感分類和文字摘要。

2 提出multi-view的注意力機制獲得文字的不同的表示,

3 實驗證明我們的結果比baselines好。

2 Proposed Model

2.1 Problem Formulation

2.2 Model Overview

2.3 Text Encoder

2.4 Summary Decoder with Multi-View Attention

2.5 Summary-Aware Sentiment Classifier

2.6 Overall Loss Function and Training

3 Experiments

3.1 Datasets

3.2 Evaluation Metric

3.3 Experimental Details

優化器:Adam

learning rate=0.003

two momentum parameters:β1=0.9, β2=0.999

batch size=64

3.4 Baselines

3.5 Results

3.6 Ablation Study

3.7 Visualization of Multi-View Attention

4 Related Work