有道詞典

【NLP】分詞演算法綜述

之前總是在看前沿文章,真正落實到工業級任務還是需要實打實的硬核基礎,我司選用了HANLP作為分片語件,在使用的過程中才感受到自己基礎的薄弱,決定最近好好把分詞的底層演算法梳理一下。 1. 簡介 NLP的

7個優秀的開源中文分詞庫推薦,實用性強!

縱觀整個開源領域,陸陸續續做中文分詞的也有不少,不過目前仍在維護的且質量較高的並不多。下面整理了一些個人認為比較優秀的中文分詞庫,以供大家參考使用。 1、jieba —— Python

雲端計算邁入“多雲”時代,公有云仍是焦點

從2008阿里開始籌建阿里雲開始,國內雲端計算已經走過十個年頭。從當初被各方大佬不屑一顧,到現在,企業上雲已經是大勢所趨。現如今,公有云、私有云、混合雲等多種型別的雲服務正在為各行各業的數字化轉型提供技術上的支

貝銳蒲公英與可道雲合作:0門檻搭建私有云

公共網盤的上傳、下載限速,檔案安全性等問題,使得網盤的優勢越來越少。因此,很多個人和企業都開始轉向私有云,通過自建服務的方式來解決檔案雲端儲存、同步、共享等需求。 但是,部署私有云服務卻擁有較高的門檻,不僅

隱馬爾可夫分詞

雖然目前 nlp 很多工已經發展到了使用深度學習的迴圈神經網路模型和注意力模型,但傳統的模型咱們也一樣要了解。這裡看下如何使用隱馬爾科夫模型(HMM)進行分詞。 隱馬爾科夫模型 隱馬爾科夫模型是一種有向

Synergy調研:AWS仍然主導公有云市場

據Synergy Research近日公佈的最新資料顯示,AWS在公有云基礎設施服務市場上繼續獨佔鰲頭,並且與最接近的競爭對手仍保持一定的距離。 Synergy稱,據第三季度的資料顯示,AWS的主導地位遍及全球四大

觀點:我們必須要找到一個對抗資料重力的方式

就我們如何處理資料而言,IT行業正處於轉型之中。在Moor Insights and Strategy中,我們討論了無數次推動資料戰略需求的力量;這種需求如何受到實時分析的深刻影響以及資料如何逃離資料中心,又從

用100行程式碼提升10倍的效能

提出問題 從一個我常用的面試題,也是真實需求開始聊起: 你需要在前端展示 5000 條甚至更多的資料,每一條資料的資料結構是一個物件,裡面有格式各樣的屬性。每個屬性的值又可以是基本型別,物件,甚至陣

1746060926.0883