1. 程式人生 > >深藍詞庫轉換2.4版發布,支持最新的搜狗用戶詞庫備份bin格式

深藍詞庫轉換2.4版發布,支持最新的搜狗用戶詞庫備份bin格式

不用 使用 github上 inf http 根據 inline style src

很高興的告訴大家,感謝GitHub上的h4x3rotab提供python版的搜狗用戶詞庫備份bin格式的解析算法,感謝tmxkn1提供了C#版的實現,深藍詞庫轉換終於迎來了一個重大更新,能夠支持搜狗用戶詞庫的bin格式備份的導出了。再也不用受到搜狗輸入法的鉗制,可以自由切換到其他輸入法了。搜狗bin詞庫只解析到了用戶詞條和詞頻,沒有拼音,所以如果要導出其他拼音輸入法,中間轉換工具會根據詞條的內容重新生成拼音。

技術分享圖片

另外在2.4版中,增加了用戶詞頻強制設置的功能,比如將搜狗用戶詞庫bin格式備份轉換為Win10自帶的微軟拼音,那麽詞頻會導致該詞條在微軟拼音上的位置不對,那麽我們就需要忽略掉搜狗bin格式解析出來詞頻,而是使用1表示詞頻,這樣在微軟拼音中才會顯示正常。

技術分享圖片

設置了強制的默認詞頻後,所有詞頻將按照新詞頻算法生成。

技術分享圖片

導入到Win10自帶微軟拼音的用戶自定義短語後的效果如圖:

技術分享圖片

最新版的深藍詞庫轉換的下載地址:

https://github.com/studyzy/imewlconverter/releases

深藍詞庫轉換2.4版發布,支持最新的搜狗用戶詞庫備份bin格式