1. 程式人生 > >文字轉詞向量原理Word2Vec

文字轉詞向量原理Word2Vec

文字轉詞向量原理Word2Vec

Word2Vec 的訓練模型,是具有一個隱含層的神經元網路
它的輸入是詞彙表向量,當看到一個訓練樣本時,對於樣本中的每一個詞,就把相應的在詞彙表中出現的位置的值置為1,否則置為0。它的輸出也是詞彙表向量,對於訓練樣本的標籤中的每一個詞,就把相應的在詞彙表中出現的位置的值置為1,否則置為0。那麼,對所有的樣本,訓練這個神經元網路。收斂之後,將從輸入層到隱含層的那些權重,作為每一個詞彙表中的詞的向量。比如,第一個詞的向量是(w1,1 w1,2 w1,3 … w1,m),m是表示向量的維度。所有虛框中的權重就是所有詞的向量的值。