《D,R,G: Approach to Senti and Style Transfer 》閱讀筆記
原題目 :《Delete, Retrieve, Generate: A Simple Approach to Sentiment and Style Transfer
》
來源 :NAACL 2018
連結 : ofollow,noindex"> https:// arxiv.org/abs/1804.0643 7v1
一.介紹 :
本文用了一個較簡單但是十分有效的思路來進行語言風格遷移,即將句子的每一個小部分計算與該句子情感的相關度,然後將相似度達到一定閾值的那一小部分給“挖掉”,就得到了句子中與情感無關的部分,然後再用與我們的目標情感相關度最大的一個句子去生成相反情感的相同內容的語句,這樣一來就完成了我們的情感轉換任務。
一.方法:

該方法分為三個步驟:
1. Delete:
思路就是統計一下每一個情感下的詞和長度小於四的短語的詞頻,然後給基於詞頻給每一個短語和詞加一個權重,大於某個閾值時,定義為情感詞。並進行刪除,剩下的即是內容;
2. Retrieve:
在刪除情感詞後,在對應語料中查詢具有相似內容的語句,方法是比較每一句話詞向量的距離;
3. Generate:
用一個seq2seq的模型做生成,因為沒有對齊語料,在deleteandretrieve的方法中,將原語句的內容的放入encoder中,並於目標的情感詞的詞向量及聯,放入decoder進行生成;
訓練過程 就是

由於內容和情感詞都來自於同一句話,這樣訓練的話會造成過擬合,所以作者以一定的比例把情感詞進行了修改,相當於加噪。
二.實驗:
本篇文章的工作量還有一個方面是做了幾個模型之間的對比,包括
RETRIEVEONLY,
TEMPLATEBASED,
DELETEONLY,
DELETEANDRETRIEVE;
在對比之中將生成的好處展現出來;
資料集: Yelp reviews (YELP)
Amazon reviews (AMAZON),
changing image captions to be romantic or humorous (CAPTIONS)
結果:在評價指標方面,還是需要人工的評價結合bleu;


三.總結;
1. 解決了訓練過程中沒有對齊語料的問題;
2. 思路簡單,效果較好;