1. 程式人生 > >[原始碼和文件分享]Python實現基於AdaBoost演算法的微博情感分類系統

[原始碼和文件分享]Python實現基於AdaBoost演算法的微博情感分類系統

摘 要

隨著網際網路的快速發展,各類社交媒體平臺如微信、QQ等也與日俱增,而微博更是集成了傳統網站、論壇、部落格等的優點,並加上了人與人之間的互動性、關係親密程度等多種智慧演算法,並以簡練的形式讓資料爆發性的傳播,促進了人與人之間的交流。網民可以通過微博來分享自己的生活,同時抒發自己的喜怒哀樂。因此對微博每天產生的資訊量的分析和利用的需求顯得更為迫切。

情感分析,也稱傾向性分析、意見抽取和意見挖掘。主要是通過對帶有情感色彩的主觀性文字進行分析、處理、歸納然後進行推理的過程。而微博,人口基數大,涉及的話題廣泛,對人們的日常生活產生了不可估量的影響,而對微博的情感分析,更是有著十分重要的意義。為此,本文針對了微博文字的情感分析進行了如下幾個工作。

首先,使用微博官方的API對微博進行抓取,進行分類標註。然後,對微博文字進行預處理,主要包括去掉無意義,對微博文字沒有影響的詞語。其次,使用SVM演算法對文字進行初步的篩選,主要是去除特別明顯的廣告等無關性的微博。最後使用樸素貝葉斯對微博進行情感分析,將微博分為積極、消極、客觀三類,同時使用AdaBoost演算法對樸素貝葉斯演算法進行加強。

這些帶有情感資訊的微博是非常寶貴的資源,通過情感分析可以獲取網民的此時的心情,對某個事件或事物的看法,可以挖掘其潛在的商業價值,還能對社會的穩定做出一定的貢獻。

關鍵詞:情感分析; AdaBoost; 樸素貝葉斯; 文字分類; 資料探勘


參考文件和完整的文件和原始碼下載地址:

https://www.write-bug.com/article/1735.html