1. 程式人生 > >fasttext文字分類原理

fasttext文字分類原理

http://www.52nlp.cn/fasttext

https://www.jiqizhixin.com/articles/2018-06-05-3  

這兩篇文章總結一下     

於是fastText的核心思想就是:將整篇文件的詞及n-gram向量疊加平均得到文件向量,然後使用文件向量做softmax多分類。這中間涉及到兩個技巧:字元級n-gram特徵的引入以及分層Softmax分類。

fastText和傳統CBOW模型對比

 

 

 輸入層:CBOW的輸入是目標單詞的上下文並進行one-hot編碼,fastText的輸入是多個單詞embedding向量,並將單詞的字元級別的n-gram向量作為額外的特徵;

· 從輸入層到隱藏層,CBOW會將上下文單詞向量疊加起來並經過一次矩陣乘法(線性變化)並應用啟用函式,而fastText省略了這一過程,直接將embedding過的向量特徵求和取平均;

· 輸出層,一般的CBOW模型會採用Softmax作為輸出,而fastText則採用了Hierarchical Softmax,大大降低了模型訓練時間;

· CBOW的輸出是目標詞彙,fastText的輸出是文件對應的類標。