HanLP分詞器的使用方法
阿新 • • 發佈:2018-12-20
前言:分析關鍵詞
如何在一段文字之中提取出相應的關鍵詞呢?
之前我有想過用機器學習的方法來進行詞法分析,但是在專案中測試時正確率不夠。於是這時候便有了 HanLP-漢語言處理包 來進行提取關鍵詞的想法。
下載:.jar .properties data等檔案
這裡提供官網下載地址 HanLP下載,1.3.3資料包下載
在intellij中配置環境,並執行第一個demo
在專案中配置jar包,新增依賴。
file->Project Structure->Modules->Dependencies->+Jars
將properties檔案轉移到src根目錄下,修改root為自己的資料集路徑
執行第一個demo
public class TestHanLP {
public static void main(String[] args) {
System.out.println(HanLP.segment("你好,歡迎使用HanLP!"));
}
}
可能的錯誤
字元型別對應表載入失敗:D:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes
解決辦法:檢視錯誤提示頁面下是否有該檔案,如果沒有則去網上下載一個。像我這裡,由於只是使用其一部分功能,為了方便就不再下載了,這裡我直接修改了一個檔案的檔名—–成功執行!。
成功執行
文章來源於csu_zipple的部落格