1. 程式人生 > >基於 svm 的金融諮詢情感分析

基於 svm 的金融諮詢情感分析

處理流程:

(1)金融諮詢處理

1.利用 7 萬多條利好/利空語料(已經標註好的,分為 1 正性,-1 負性兩類),首先採用 B-gram 卡方差提取特徵詞彙

2.使用卡方提取的特徵詞為每一篇諮詢建立向量表示模型

3.使用向量進行 svm 分割,訓練語料 80%,測試語料 20%,並評估模型準確率,儲存模型。

4.載入儲存的模型進行 利好/利空 預測。

模型效果:正面諮詢識別率 0.96 ,負面諮詢識別率 0.82,總體識別率 0.91 左右。

(2)app 評論處理

流程同上,只不過訓練的語料不同並且採用 ngram = 1,由於語料是我自己標註的 502 條評論資料,因此模型的準確率達不到金融諮詢的基於 7萬 多條語料處理的模型。對負面評論的識別率大概在 0.82 左右,總體識別率在 0.86 左右。