author/SCRUM中文網

centos coreseek4.1安裝和配置

概念 1. sphinx是國外的一款搜尋軟體,一款基於SQL的高效能全文檢索引擎 2. coreseek是在sphinx的基礎上,增加了中文分詞功能,增加對中文的支援。4.1版本是2011年釋出的,它是基於

深度有趣 | 15 淺談中文分詞

簡單瞭解下中文分詞的概念,並用標準資料集、Keras和TensorFlow,分別基於LSTM和CNN實現中文分詞器 原理 中文分詞是指,將句子根據語義切分成詞 我來到北京清華大學 -> 我

深度有趣 | 03 高階又一般的詞雲

詞雲是一種資料呈現方式 不會的時候,感覺很厲害、很高大上 會用了之後,感覺到哪都看到別人在用 掌握用 Python 實現詞雲的方法 準備 安裝包 pip instal

Elasticsearch權威指南學習筆記

為什麼es查詢和聚合都這麼快?底層是如何實現的? 資料在es叢集中如何儲存的?如何做到自動分散式的? 為什麼es的主分片數設定了之後就不能調整,而副本分片數可以調整? 如何優化索引方式

分詞,難在哪裡?

題圖:by Lucas Davies 一、前言 分詞,我想是大多數大前端開發人員,都不會接觸到的一個概念。這個不影響我們瞭解它,畢竟我們要多方向發展。今天就來簡單介紹一些分詞,

NLP系列之文字分類

本篇部落格主要是記錄自然語言處理中的文字分類任務中常見的基礎模型的使用及分析。Github上 brightmart 大佬已經整理出很完整的一套文字分類任務的基礎模型及對應的模型程式碼實現。網上也有部分部落格將

從閱文到米讀:網路文學真的被付費耽誤了?

阿里和京東當初一定沒料到會半路殺出個拼多多;頭條號、企鵝號等內容平臺可能也沒想到會被趣頭條分走一大塊蛋糕;去年閱文、掌閱恐怕也沒料到會跑出一個與主流唱反調,主打免費閱讀,計劃複製趣頭條成功的米讀。 從閱文到

1746053158.848