author/文玩菩提

elasticsearch實戰---中文拼音A-Z排序(完美解決)

公司目前業務系統偏向後臺系統,目前包含500W+資料,在許多列表中支援各種條件查詢,含有大量的模糊搜尋條件。由於在mysql中模糊查詢效率低下,目前公司已使用es搜尋引擎進行條件搜尋。es版本如下: ela

文章相似度計算

演算法思路 首先看個簡單的例子: 句子A: 我喜歡看電視,不喜歡看電影 句子B: 我不喜歡看電影,也不喜歡看電視 基本思路 如果兩句話的用詞越相似,它們的內容越相似。因此,可以從詞頻入手,計

牛文文:美好的創業,不是一枝獨秀

10月10日,在“2018年全國大眾創業萬眾創新活動周”成都主會場,創業黑馬董事長牛文文出席“創業創新+創投經驗與發展展望”主題論壇併發言。 10月10日,在“2018年全國大眾創業萬眾創新活動周

知識付費時代誰最吃香?

消費粉絲是一門好生意。 9月,大型武裝劇《鬥破蒼穹》正式在芒果臺首播,該劇由天蠶土豆的同名網路玄幻小說改編。 又是一個"莫欺少年窮"的老套劇情,一路打怪升級,刷副本,越級戰鬥,

Go 高效能分詞 Gse v0.20.0 釋出, 優化效能

Go 語言高效分詞, 支援英文、中文、日文等 詞典用雙陣列trie(Double-Array Trie)實現, 分詞器演算法為基於詞頻的最短路徑加動態規劃。 支援普通和搜尋引擎兩種分詞模式,支援使用者詞

資料處理-招聘資訊-中文分詞與詞頻統計

智慧決策上手系列教程索引 通過前面的幾篇文章,相信大家都嘗試抓取了一些網站上招聘資訊的資料,並存儲到自己的檔案裡面了,可能是一堆 .json 或 .csv 檔案。 如果你還沒有抓到資料,請看這

1748829113.0045