1. 程式人生 > >基於關鍵詞的文字生成----思路和思考

基於關鍵詞的文字生成----思路和思考

文字生成是最近研究的熱點,他的生成源有很多,如:圖片、文字、視訊等。本文想針對一些特殊場合的需要關鍵詞的文字生成工作,在這裡把思路記錄一下。這裡使用的是傳統方式,有機會會嘗試深度學的方式。

(1)依賴的語法選擇

如果想讓句子讀起來通順,就需要一定的語法框架,但是常規的語法會有較多的問題,如主語,能夠做主語的成分很多,如代詞、名詞甚至短語,所以生成起來不好控制,建議使用詞性序列作為語法序列。

(2)關鍵詞在詞性序列上填充

在這沒有考慮一個詞多個詞性的情況,是根據詞典的方式查詢的詞性。

(3)備選集合生成

每種詞性都會對應相應的詞的集合,沒有被關鍵詞填充的位置,可以用來作為備選。

(4)最有路徑選取與最優句子

找出最像句子的路徑,然後重複生成多個句子的備選,選出最優的句子。這裡使用語言模型做的。

效果:

key word :"孩子", "淘氣"

這些 孩子 這麼 淘氣 呀

key word :"孩子", "可愛"

什麼樣 的 孩子 最 可愛 呀

一些想法:

語法模板的選擇目前是隨機選擇,會有機率生成不出好的句子,需要對語法序列進一步歸納總結。

關鍵詞可以通過語義進行擴充套件(如詞嵌入)生成出更加豐富的句子。