文字摘要

NLP系列之文字分類

本篇部落格主要是記錄自然語言處理中的文字分類任務中常見的基礎模型的使用及分析。Github上 brightmart 大佬已經整理出很完整的一套文字分類任務的基礎模型及對應的模型程式碼實現。網上也有部分部落格將

使用NLTK做文字分析

NLTK(Natural Language Toolkit)是一個功能強大的Python包,它提供了一組自然語言演算法,例如切分詞(Tokenize),詞性標註(Part-Of-Speech Tagging),

fasttext使用心得(踩坑之路)

fasttext是文字分類的一大利器,優點:快,嗷嗷快;缺點:暫未發現。但是我在使用其做文字分類時候還是遇到了挺多坑,今天先總結一個: 網上有人說設定訓練引數的時候,ngrams設定大於2可以提高模型的精確

1746019634.1511