Pytorch求索(3)：使用訓練好的詞向量

阿新 • • 發佈：2018-11-20

nn.Embedding

Pytorch自帶Embedding模組，可以方便使用

self.embed = nn.Embedding(vocab_size, embedding_dim)

那麼，如何使用已經訓練好的詞向量呢？
詞向量其實是模型的embedding層的權重，所以，如下方法便可以實現：

self.embed = nn.Embedding(vocab_size, embedding_dim)
self.embed.weight.data.copy_(torch.from_numpy(pretrained_embeddings))

同時，使用已經訓練好的詞向量之後，我們又有如下選擇，即保持詞向量不更新（固定詞向量），或者基於載入的詞向量進行更新權重，很多人往往會忘記這一點。

不需要改變，因此就涉及到固定子層引數不更新的技巧。這個方法有很多，常用的是requires_grad和volatile，requires_grad = False等同於volatile = True。

self.embed = nn.Embedding(V, D)
self.embed.weight.data.copy_(torch.from_numpy(pretrained_embeddings))
self.embed.weight.requires_grad = False

因此我們可以設定embeding層的引數的parameter的requires_grad為False，這樣就不會計算其梯度了，這樣還會提升模型訓練的速度，因為預訓練的詞向量矩陣維度很大，如果每次反向傳播都計算它的梯度會極大地影響訓練的速度。此外，設定優化器的時候，第一個引數就不可以是model.parameter()，因為embeding層的梯度是沒有的，也就優化不了，因此要將它排除。程式碼如下：

optimizer = torch.optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=lr, weight_decay=opt.weight_decay)

程式碼使用了過濾器將requires_grad為False的過濾掉（預設為True），這樣就可以保證程式碼的正確性。

Pytorch求索(3)：使用訓練好的詞向量

nn.Embedding

Pytorch求索(3)：使用訓練好的詞向量

Pytorch求索(2)： Pytorch使用visdom進行視覺化

Pytorch求索(1)：pytorch與Tensorboard的結合使用

如何使用“預訓練的詞向量”，做文字分類

比賽必備︱省力搞定三款詞向量訓練 + OOV詞向量問題的可性方案

在Keras模型中使用預訓練的詞向量

詞向量：如何評價詞向量的好壞

字和詞語聯合訓練的詞向量模型

使用Keras和預訓練的詞向量訓練新聞文字分類模型

Python Word2Vec使用訓練好的模型生成詞向量

word2vec訓練好的詞向量

[ pytorch ] ——基本使用：(2) 訓練好的模型引數的儲存以及呼叫

tensorflow ：使用預訓練詞向量

【深度學習】120G+訓練好的word2vec模型（中文詞向量）

文本分布式表示（二）：用tensorflow和word2vec訓練詞向量

tensorflow 1.0 學習：用別人訓練好的模型來進行圖像分類

TF：利用TF的train.Saver載入曾經訓練好的variables(W、b)以供預測新的數據

機器不學習：word2vec是如何得到詞向量的？

機器學習之路： python 實踐 word2vec 詞向量技術

基線系統需要受到更多關註：基於詞向量的簡單模型

Pytorch求索(3)：使用訓練好的詞向量

nn.Embedding

相關推薦