文字挖掘

基於文字挖掘技術的證券智慧監管專案

文 / 深圳證券交易所  許保勳 近年來,迅速發展的大資料、雲端計算、移動互聯技術受到了社會各方的重視。 以大資料為支撐的網際網路與各領域的深入融合發展具有廣闊前景和無限潛力,已成為不可阻擋的時代潮流,

NLP系列之文字分類

本篇部落格主要是記錄自然語言處理中的文字分類任務中常見的基礎模型的使用及分析。Github上 brightmart 大佬已經整理出很完整的一套文字分類任務的基礎模型及對應的模型程式碼實現。網上也有部分部落格將

使用NLTK做文字分析

NLTK(Natural Language Toolkit)是一個功能強大的Python包,它提供了一組自然語言演算法,例如切分詞(Tokenize),詞性標註(Part-Of-Speech Tagging),

1746022316.5322