1. 程式人生 > >NLP:主題模型LDA+SVM進行文字分類

NLP:主題模型LDA+SVM進行文字分類

參考:http://www.cnblogs.com/pinard/p/6908150.htmlhttp://blog.csdn.net/TiffanyRabbit/article/details/76445909原理:使用LDA進行模型訓練,得到每個文件的主題分佈,即每個文件包含的每個主題的權重,此權重即可作為特徵,然後將此特徵進行svm訓練,即可進行後續的文字的分類處理步驟:(1)文字分詞,去除停用詞(2)LDA模型訓練(3)SVM訓練和分類