1. 程式人生 > >自然語言處理環境搭建,就是這麼簡單–(手把手教程)

自然語言處理環境搭建,就是這麼簡單–(手把手教程)

最近看了一些關於自然語言處理方面的書,對其很感興趣,在昨天晚上搞到了深夜,總算功夫不負有心人,現在基礎環境已經搭建完成,閒言少敘,現將搭建的具體過程和遇到的問題分享給大家。

基礎環境:windows 7 32位作業系統

1.安裝Python(我安裝的是Python2.7,目錄C:\Python27可以到CSDNOSChinaSina Share等網站下載也可以到Python官網下載:(推薦用這個)。

2.新增環境變數。在命令列模式下輸入:set PATH=%PATH%;C:\Python27這種方法最容易,當然也可以在計算機-->屬性-->高階系統設定-->環境變數,新增系統變數,變數名為

PATH,對應的屬性值為C:\Python27即可。

3.在命令列模式下執行python,出現如下圖所示,即說明Python已安裝成功。

nltk-3.0.0解壓到C:\Python27目錄開啟cmd,進到C:\Python27\nltk-2.0.3目錄(輸入:cd C:\Python27\nltk-3.0.0

輸入命令:python setup.py install

5.這個時候,會報錯,因為缺少setuptools包沒有安裝。下載setuptools包,地址:http://www.cncrk.com/downinfo/28512.html,安裝後再執行python setup.py install

命令即可。

6.安裝PyYAML:到這裡下載:http://download.csdn.net/detail/caicai1617/7023063

下載之後執行exe檔案(程式會自動搜尋python27目錄)

7.在所有程式中找到python2.7資料夾,開啟IDLE,輸入import nltk,沒有錯誤的話,就說明安裝成功了。到這裡,NLP所需的基本python模組都已經安裝好了,然後要安裝NLTK_DATA了下載NLTK_DATA有好幾種方法,這裡我只介紹。第一種:輸入import nltk,然後輸入nltk.download(),這樣就可以開啟一個NLTK DownloaderNLTK下載器)

注意下載器下邊的Download Directory,我設定的是C:\nltk_data。(這種方法很慢,並且安裝了幾次都不能全部安裝)第二種:上360雲盤下載:http://aczaym88yr.l3.yunpan.cn/lk/cgGUPFzF3spir,提取碼為504e。下載好之後,放到C:\nltk_data目錄下。因為是壓縮包,選擇C:\nltk_data\corpora目錄下的所有壓縮檔案,選擇解壓到當前資料夾。(之後再用到其他的檔案,再進行類似的解壓即可)

8.在計算機-屬性-高階系統設定-高階-環境變數-系統變數-新建:變數名:NLTK_DATA屬性值:C:\nltk_data。這一步與上面第二步的操作基本相同。

9.在IDLE下輸入:form nltk.book import  *會出現下圖所示:

10.測試環境搭建的效果:接著第九步的操作,輸入:text2.concordance('is');結果如下所示:

說明:text2NLTK資料包中的一段資料來源,是一大串字串。這句話實現的是從這一大串字串中找尋出包含is這個單詞的語句。

到此為止,基本的搭建已經完成,初學者的一點經驗,也是每個要學習自然語言分析必會的基本知識。如有什麼不懂的,歡迎在下面評論,我會及時回覆。