A Hierarchical End-to-End Model for Jointly Improving Text Summarization and Sentiment Classificatio

阿新 • • 發佈：2018-12-12

abstract

文字摘要和情感分類都是要捕獲文字的重要資訊，但是在不同的水平上的。文字摘要是用一些句子表示原始文件，情感分類是給文字貼標籤。

提出層次級的端到端模型進行摘要抽取和情感分類的聯合學習，標籤是作為文字摘要抽取的輸出，情感分類依賴於摘要抽取，情感分類放在摘要抽取上面

1 Introduction

文字分類和情感分類是自然語言處理中的兩大任務，文字摘要主要抽取原始文字的主要資訊，和抽取式摘要（從文字中抽取一部分文字出來）相比，抽象型摘要建立在內部語義資訊的表示，然後使用自然語言生成技術獲得摘要。我們主要關注抽象型文字摘要，情感分類是給文字貼標籤，決定文字的正負，也叫觀點挖掘，文字摘要和情感分類都是挖掘文字的主要意思，文字摘要使用詞語和句子表示文字，而情感分類使用標籤表示文字。

現有模型中，

對於抽象型的文字摘要，最流行的模型是sequence-to-sequence模型，在長文字和短文字之間學習一個對映。模型包含了一個編碼器和解碼器，編碼器把原始文字使用潛在空間表示，解碼器獲得摘要，最近的一些抽象型摘要模型是sequence-to-sequence模型的變體，對於情感分類，最近使用最多的是神經網路結構，比如LSTM，CNN。

一些工作提出的模型可以產生摘要和情感標籤，但是，摘要抽取和情感分類是分開的，並且需要人工抽取特徵，也有一些工作是情感摘要，從特定的類中的文字抽取句子，這主要關注摘要抽取，而不是情感分類。

本工作主要是提高文字摘要和情感分類，提出層次級的端到端網路，包含了摘要層和分類層，抽取層將原始文字壓縮成短句子，情感分類層再總結層一個標籤，層次級結構建立了文字摘要和情感分類之間的關係，兩個任務可以互相提高，壓縮文字後，對於分類器可以更容易進行預測標籤，還有，文字抽取可以獲得重要和有資訊的詞，並且去除多餘和複雜資訊，這些資訊對於預測有害，情感分類可以提供更重要的資訊給文字摘要抽取，並且指導摘要抽取部分捕獲原始文字的重要資訊，這可以提高短文字和長文字之間的聯絡。

使用Amazon的線上語料。

本文的貢獻：

1 把文字分類作為一種特殊的摘要，在同一個模型中進行情感分類和文字摘要。

2 提出multi-view的注意力機制獲得文字的不同的表示，

3 實驗證明我們的結果比baselines好。

2 Proposed Model

2.1 Problem Formulation

2.2 Model Overview

2.3 Text Encoder

2.4 Summary Decoder with Multi-View Attention

2.5 Summary-Aware Sentiment Classifier

2.6 Overall Loss Function and Training

3 Experiments

3.1 Datasets

3.2 Evaluation Metric

3.3 Experimental Details

優化器：Adam

learning rate=0.003

two momentum parameters：β1=0.9, β2=0.999

batch size=64

3.4 Baselines

3.5 Results

3.6 Ablation Study

3.7 Visualization of Multi-View Attention

4 Related Work

A Hierarchical End-to-End Model for Jointly Improving Text Summarization and Sentiment Classificatio

abstract 文字摘要和情感分類都是要捕獲文字的重要資訊，但是在不同的水平上的。文字摘要是用一些句子表示原始文件，情感分類是給文字貼標籤。提出層次級的端到端模型進行摘要抽取和情感分類的聯合學習，標籤是作為文字摘要抽取的輸出，情感分類依賴於摘要抽取，情感分類放在摘要

【論文筆記】An End-to-End Model for QA over KBs with Cross-Attention Combining Global Knowledge

一、概要該文章發於ACL 2017，在Knowledge base-based question answering (KB-QA)上，作者針對於前人工作中存在沒有充分考慮候選答案的相關資訊來訓練question representation的問題，提出

【USE】《An End-to-End System for Automatic Urinary Particle Recognition with CNN》

Urine Sediment Examination（USE） JMOS-2018 目錄目錄 1 Background and Motivation 2 Innovation

Direct Shape Regression Networks for End-to-End Face Alignment

端到端人臉對齊的直接形狀迴歸網路1 主要的挑戰在於人臉影象和相關的面部形狀之間的高度非線性關係，這種非線性關係是基於標記的相關性耦合。現有的方法主要依賴於級聯迴歸，存在固有的缺點，例如對初始化的強依賴性和未能利用相關的標記。本文提出了一種**直接形狀迴歸網路（direct shap

《An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its...》論文閱讀之CRNN

An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition paper: CRNN 翻譯：CRNN

《End-to-End Learning of Motion Representation for Video Understanding》論文閱讀

CVPR 2018 | 騰訊AI Lab、MIT等機構提出TVNet：可端到端學習視訊的運動表徵動機儘管端到端的特徵學習已經取得了重要的進展，但是人工設計的光流特徵仍然被廣泛用於各類視訊分析任務中。為了彌補這個不足而提出；以前的方法：

深度學習論文翻譯解析（二）：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition

論文標題：An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition 論文作者： Baoguang Shi, Xiang B

A Hierarchical End-to-End Model for Jointly Improving Text Summarization and Sentiment Classificatio

1 Introduction