SCWS中文分詞PHP擴展詳細安裝說明
因最近寫的一段代碼,需要用到中文分詞,在網上找了一下,發現了scws這個不錯的插件,故根據文檔安裝使用,下面記錄下安裝的全過程
系統:centos
安裝scws
wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2
tar xvjf scws-1.2.3.tar.bz2
cd scws-1.2.3
./configure --prefix=/usr/local/scws
make
make install
下載詞典
cd /usr/local/scws/etc
wget http://www.xunsearch.com/scws/down/scws-dict-chs-gbk.tar.bz2
wget http://www.xunsearch.com/scws/down/scws-dict-chs-utf8.tar.bz2
tar xvjf scws-dict-chs-gbk.tar.bz2
tar xvjf scws-dict-chs-utf8.tar.bz2
擴展php配置
cd ~/scws-1.2.3
cd phpext
/www/server/php/56/bin/phpize(這裏的配置按照實際的php地址配置,這裏是寶塔面板環境下的地址)
./configure --with-scws=/usr/local/scws --with-php-config=/www/server/php/56/bin/php-config(這裏的配置按照實際配置,這裏是寶塔面板環境下的地址)
make
make install
在php.ini中加入
[scws]
;
; 註意請檢查 php.ini 中的 extension_dir 的設定值是否正確, 否則請將 extension_dir 設為空,
; 再把 extension = scws.so 指定絕對路徑。
;
extension = scws.so
scws.default.charset = gbk
scws.default.fpath = /usr/local/scws/etc
保存後重新啟動php環境
測試代碼
<?php $so = scws_new(); $so->set_charset(‘gbk‘); // 這裏沒有調用 set_dict 和 set_rule 系統會自動試調用 ini 中指定路徑下的詞典和規則文件 $so->send_text("小姐姐,我喜歡你,做我女朋友吧!"); while ($tmp = $so->get_result()){ print_r($tmp); } $so->close(); ?>
小小吐槽
ps:這裏吐槽一下,該項目作者的產品,xunsearch中也包含了scws分詞,我一開始用的就是這個,但是,如果長時間執行,會提示超時。
修改配置,查看源代碼,修改stocket鏈接超時也不起作用,百度在論壇上發現類似問題,但是沒有解答。
故,如果使用分詞,最好還是用scws搭建。
原文地址:http://lovefc.cn/view/49.html
SCWS中文分詞PHP擴展詳細安裝說明