author/NASA中文愛好者團隊第3頁

【火爐煉AI】機器學習034-NLP對文字進行分詞

稀土掘金

2018-10-12 10:18:02

(本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2， NLTK 3.3) 文字分塊是將一大段文字分割成

Go 高效能分詞 Gse v0.20.0 釋出, 優化效能

開源中國

2018-10-10 06:11:30

Go 語言高效分詞, 支援英文、中文、日文等詞典用雙陣列trie（Double-Array Trie）實現，分詞器演算法為基於詞頻的最短路徑加動態規劃。支援普通和搜尋引擎兩種分詞模式，支援使用者詞

資料處理-招聘資訊-中文分詞與詞頻統計

簡書

2018-10-09 09:10:40

智慧決策上手系列教程索引通過前面的幾篇文章，相信大家都嘗試抓取了一些網站上招聘資訊的資料，並存儲到自己的檔案裡面了，可能是一堆 .json 或 .csv 檔案。如果你還沒有抓到資料，請看這

Lucene 全文檢索

簡書

2018-10-08 11:08:10

Lucene 全文檢索 Field域 Field是文件中的域，包括Field名和Field值兩部分，一個文件可以包括多個Field，Document只是Field的一個承載體，Field值即為要

NLPCC2013中文微博細粒度情感識別（二）

部落格園精華區

2018-10-02 16:06:00

偷懶若干天后迴歸。。在上一篇中我們得到了NLPCC2013的中文微博資料，將其按照8：1：1的比例分成了訓練集，驗證集和測試集。下一步就是對資料進行預處理以及embedding。這是第一次嘗試一邊寫部落格一邊把

深度有趣 | 25 影象標題生成

稀土掘金

2018-09-21 20:06:03

輸入是一張圖片，輸出是一句對圖片進行描述的文字，這就是影象標題生成基本思路是先通過預訓練的影象分類模型，從某一個卷積層得到原始圖片的表示，或者稱為上下文contexts 例如從VGG19的 conv

centos coreseek4.1安裝和配置

莫飛

2018-09-20 12:43:04

概念 1. sphinx是國外的一款搜尋軟體,一款基於SQL的高效能全文檢索引擎 2. coreseek是在sphinx的基礎上，增加了中文分詞功能,增加對中文的支援。4.1版本是2011年釋出的，它是基於

深度有趣 | 15 淺談中文分詞

2018-09-20 10:02:04

簡單瞭解下中文分詞的概念，並用標準資料集、Keras和TensorFlow，分別基於LSTM和CNN實現中文分詞器原理中文分詞是指，將句子根據語義切分成詞我來到北京清華大學 -> 我

深度有趣 | 03 高階又一般的詞雲

稀土掘金

2018-09-19 21:58:01

詞雲是一種資料呈現方式不會的時候，感覺很厲害、很高大上會用了之後，感覺到哪都看到別人在用掌握用 Python 實現詞雲的方法準備安裝包 pip instal

Elasticsearch權威指南學習筆記

稀土掘金

2018-09-14 14:00:29

為什麼es查詢和聚合都這麼快？底層是如何實現的？資料在es叢集中如何儲存的？如何做到自動分散式的？為什麼es的主分片數設定了之後就不能調整，而副本分片數可以調整？如何優化索引方式

Elastic Stack-Elasticsearch使用介紹(二)

部落格園精華區

2018-09-12 08:14:00

一、前言寫部落格，更要努力寫部落格！二、Mapping介紹 Mapping類似於資料庫中的表結構的定義:這裡我們試想一下表結構定義需要那些: 1.欄位和欄位型別，在Elastics

分詞，難在哪裡？

2018-09-10 12:47:03

題圖：by Lucas Davies 一、前言分詞，我想是大多數大前端開發人員，都不會接觸到的一個概念。這個不影響我們瞭解它，畢竟我們要多方向發展。今天就來簡單介紹一些分詞，

新資本 | 常見投資——用“研究+服務”助力中國天才創業團隊成長

36氪

2019-04-15 11:25:13

【新資本】系列旨在挖掘投資機構真實的、有價值的內容，讓更廣泛的創業者和讀者去了解一個個機構背後真實的樣子。這些資本是目前市場上最活躍的投資群體之一，也是未來的捕手。常見投資成立於2016年，由本見投資和

高校開跑腿公司更長遠的發展方向是？

簡書

2019-04-04 14:48:42

我們不難發現，現在不只是在市、區、縣有很多人開跑腿公司，很多高校也興起大學生創業團隊開跑腿公司的一陣狂風。是什麼原因導致現在越來越多的創業團隊開跑腿公司呢？是開跑腿公司的創業成本低？是開跑腿公司的市場前景

網路創業社群：創業團隊在打造的過程中需要注意的是什麼

簡書

2019-03-20 10:13:44

創業是一個技術活，也是個藝術活，一定比上班難多了，打造創業團隊當然比一個成熟的公司招聘幾個人做一個專案難多了， 1，你的團隊必須是運營合夥。什麼叫運營合夥？就是這幾個人必須是投入心血，投入精力的人。什麼都必