GloVe模型的理解及實踐（1）

阿新 • • 發佈：2018-11-10

一、GloVe模型的理解

1）原理

功能：基於語料庫構建詞的共現矩陣，然後基於共現矩陣和GloVe模型對詞彙進行向量化表示

輸入：語料庫　　輸出：詞向量

2）與Skip-Gram、CBOW模型比較

例如：句子為"dog barked at the mailman" ，目標單詞為'at'

Skip-gram模型：Skip-gram模型只關注單個輸入/輸出元組中的目標詞和上下文中的單個單詞，輸入為["dog", "at"]

CBOW模型：關注目標單詞和單個樣本中上下文的所有單詞，則輸入為[["dog","barked","the","mailman"],"at"]

因此，在給定資料集中，對於指定單詞的上下文而言，CBOW比Skip-gram會獲取更多的資訊。Global Vector融合了矩陣分解的全域性統計資訊和上下文資訊。

3）步驟

1.構建共現矩陣

例如句子為：i love you but you love him i am sad
包括7個單詞：i、love、you、but、him、am、sad

設context = 5，則目標單詞的左右長度都為2，以下為統計視窗：

注：中心詞為目標單詞，視窗內容為目標單詞的左右各兩個單詞。

如："i"左邊無單詞，右邊有兩個單詞"love","you",所以視窗內容為["i","love","you"]

設：語料句子長度為n，共現矩陣為 $X$ ，n*n維的矩陣，矩陣元素為 $X_{i,j}$

$X_{i,j}$ 表示在整個語料庫中，單詞 $i$ 和單詞 $j$ 出現在同一個視窗中的次數。

如中心詞為“you”(下標為2)，context單詞為“i、love、but、you”

（下標分別為0,1,3,4），則執行：

$X_{2,0}+=1$

$X_{2,1}+=1$

$X_{2,3}+=1$

$X_{2,4}+=1$

再重複以上步驟，將整個語料庫遍歷一遍。

2.使用GloVe模型訓練詞向量

代價函式為

下一篇文章為Glove工具的具體實現。

參考：https://blog.csdn.net/codertc/article/details/73864097

GloVe模型的理解及實踐（1）

一、GloVe模型的理解 1）原理功能：基於語料庫構建詞的共現矩陣，然後基於共現矩陣和GloVe模型對詞彙進行向量化表示輸入：語料庫　　輸出：詞向量 2）與Skip-Gram、CBOW模型比較例如：句子為"dog barked at the mailman" ，目標

GloVe模型的理解及實踐（2）

一、執行環境 Ubuntu16.04 + python 3.5 二、安裝gensim 兩種安裝方式 1）開啟終端 sudo easy_install --upgrade gensim 2）開啟終端 pip install gensim 三、Git官方

ELMo模型的理解與實踐（1）

論文：2018 NAACL 《Deep Contextualized Word Representations》一、優點 1.學習單詞的複雜特徵，包括語法、語義 2.學習在不同上下文下的一詞多義二、模型 1.Bidirectional language models（BLM）

Openstack實踐（1）安裝部署第一個實例及neutron網絡

模型處理實踐（1）——simplygon下載與安裝

一、simplygon 1.Simplygon介紹 1.1 簡介 Simplygon是一個平臺，利用它可對模型和紋理之類的 3D 素材進行不同目的的優化，無需手動操作（或僅需少量操作）。可使用 Simplygon 建立 LOD 鏈、減少繪製呼叫、將多個高精度模型

ELMo模型的理解與實踐（2）

預訓練好的詞向量已經released，這裡介紹一下，如何直接獲取ELMo詞向量。在pytorch裡可以通過AlenNLP包使用ELMo。一、環境配置 1) 在conda中建立allennlp環境： conda create -n allennlp python=3.6 2) 安裝a

（6）javascript的程序控制結構及語句-----（1）條件判斷

江湖 too 分支語句 copy 表達 demo oct alt javascrip 程序控制結構及語句編程就是將現實應用，轉換為程序能夠讀得懂的語法語句。Javascript編程中對程序流程控制主要是通過條件判斷語句、循環控制語句及continue、break來完成的

軟件工程綜合實踐（1）

creat from tro log ble nav .com jdbc logs 軟件工程綜合實踐（1） 1.學習回顧 mysql 使用 a. sql 文的使用（增、刪、改、查詢）創建數據庫 mybatis a1. 表的創建保存的表名 user

智能指針原理及實現（1）- shared_ptr

red ++ 直接初始 targe -- div urn 記錄 C++沒有內存回收機制，每次程序員new出來的對象需要手動delete，流程復雜時可能會漏掉delete，導致內存泄漏。於是C++引入智能指針，可用於動態資源管理，資源即對象的管理策略。一、智能指針類別智

React技術實踐（1）

透明度 weex 常用 lar evel 目的模塊 nat name 隨著系統越來越龐大，前端也變得越來越復雜，因此，構建一套組件化的前端變得很重要了。之前一直在使用Asp.net來進行前端的組件化，Asp.net組件化有個很大的缺陷，就是和後臺代碼綁定太緊密了，不符合

深入理解多態（1）

之間數據 override 擴展結束不同的 img over str 1.1 public abstract class Birds{ 2 3 //什麽樣的方法是抽象方法 4 5 public abstract void Fly(); 6

KVM虛擬化的四種簡單網絡模型介紹及實現（一）

_for only 應該 code eth tun x86_64 信息 dock KVM中的四種簡單網絡模型，分別如下：1、隔離模型：虛擬機之間組建網絡，該模式無法與宿主機通信，無法與其他網絡通信，相當於虛擬機只是連接到一臺交換機上。2、路由模型：相當於虛擬機連接到一臺路由

KVM虛擬化的四種簡單網絡模型介紹及實現（二）

str drive 51cto -c water -a return dfa 模型接上篇，介紹NAT網絡模型和橋接模型。三、NAT模型 NAT模型其實就是SNAT的實現，路由中虛擬機能將報文發送給外部主機，但是外部主機因找不到通往虛擬機的路由因而無法回應請求。但是外部

MATLAB編程與應用系列-第2章數組及矩陣的創建及操作（1）

基本 while 能力 ++ 基本概念包括沒有 tab 其他本系列教程來源於出版設計《基於MATLAB編程基礎與典型應用書籍》，如涉及版權問題，請聯系：[email protected]。出版社：人民郵電出版社，頁數：525。本系列教程目前基於MATLABR200

assimp編譯及使用（1）

之前的https://blog.csdn.net/wodownload2/article/details/77905708 講述過怎麼編譯assimp，但是這次又遇到了新的問題，所以再來總結下編譯assimp的過程。 1、下載assimp原始碼 https://github.com/

Spring MVC 配置及應用（1）

一，分析目的：通過控制器呼叫hello.jsp /hello.do -->DispatcherServlet(配置） -->HanlderMapping(配置） -->HelloController(編寫+配置） -->ViewResolver -

空域分析及變換（1）：濾波卷積

空域分析及變換（1）：濾波卷積引言 1、均值濾波 2、中值濾波 3、高斯濾波 4、梯度Prewitt濾波 5、梯度Sobel濾波 6、梯度Sobel濾波 7、梯度Laplacian濾波 8、其他

框架綜合實踐（1）-driver的封裝（capability）

讀取yaml配置檔案：有兩種方式，一個是file open，一個是with open 方式1 file = open('../config/WiFibanlv_caps.yaml', 'r') data = yaml.load(file) file.close() #必須使用clo

python實現人臉檢測及識別（1）---- 採集人臉資料

本次專案是採用keras深度學習框架，訓練人臉識別模型，採用opencv實時檢測與識別周圍的人臉，本文主要講解如何採集訓練集，本次程式碼在人臉識別的程式碼上添加了將識別的照片依次寫入指定資料夾，並命名(000-499).jpg和顯示識別的第N張照片的文字顯示。程式

C++物件模型之記憶體佈局（1）

轉載地址： https://mp.weixin.qq.com/s/LMJ4Hsa1hmued2egk9uWMQ 如果想學習在linux或者在linux平臺下開發，學習C/或C++是非常好的選擇．俗話說，術業有專攻，學一門技術，就儘量學得深，也可以作為行走江湖，混口飯吃的一項本領

GloVe模型的理解及實踐（1）

一、GloVe模型的理解

相關推薦