1. 程式人生 > >詞向量:如何評價詞向量的好壞

詞向量:如何評價詞向量的好壞

一、前言

詞向量、詞嵌入或者稱為詞的分散式表示,區別於以往的獨熱表示,已經成為自然語言任務中的一個重要工具,對於詞向量並沒有直接的方法可以評價其質量,下面介紹幾種間接的方法。

二、評價方法

對於詞向量的評價更多還是應該考慮對實際任務的收益,脫離的實際任務很難確定A模型就一定比B好,畢竟詞向量方法更多是一種工具。

1、語義相關性任務

這個任務用來評價詞向量模型在兩個詞之間的語義相關性,如:學生與作業,中國與北京等。
具體方法由監督模式實現,首先需要一份如下的標記檔案,一般可以由人工標註:

學生 上課 0.78
教師 備課 0.8
...

上述檔案代表了詞語之間的語義相關性,我們利用標註檔案與訓練出來的詞向量相似度進行比較,如:詞向量之間的cos距離等,確定損失函式,便可以得到一個評價指標。
但這種方法首先需要人力標註,且標註的準確性對評價指標影響非常大。

2、語義類比任務

這個任務詞向量來考察不同單詞間的語義關係能力,一般給定三個詞,如a、b、c,要求尋找a+b = c + ?任務中最相似的詞,一般使用向量間距離來進行尋找,如:

queen-king+man=women

同樣需要準備標記檔案,根據尋找出來的詞的正確率判斷詞向量的質量。

3、文字分類任務

這個任務利用詞向量構成文字向量,一般採用求和平均的方式,之後利用構成的文字向量進行文字分類,根據分類的準備率等指標衡量詞向量的質量。

三、模型優化

1、模型

對於自然語言處理任務,在模型效果相差不大的情況下,選用簡單的模型。
同樣,複雜的模型對於大規模的語料效果更為明顯,小語料儘量用簡單模型。

2、語料

選用與自然語言任務同領域的語料,提升效果會非常明顯,在一定語料規模範圍內,語料越大,效果越好;如果使用不同領域的語料,甚至會有反面效果。
在語料的選擇上,同領域的語料比大規模的其他領域語料重要。

3、向量維度

向量維度太小難以表現出語義的複雜度,一般更大的維度的向量表現能力更強,綜合之下,50維的向量可以勝任很多工。