Python 文字挖掘：使用機器學習方法進行情感分析（一、特徵提取和選擇）

阿新 • • 發佈：2019-01-12

def create_word_bigram_scores():

posdata = pickle.load(open('D:/code/sentiment_test/pos_review.pkl','r')) negdata = pickle.load(open('D:/code/sentiment_test/neg_review.pkl','r')) posWords = list(itertools.chain(*posdata)) negWords = list(itertools.chain(*negdata)) bigram_finder = BigramCollocationFinder.from_words(posWords) bigram_finder = BigramCollocationFinder.from_words(negWords) posBigrams = bigram_finder.nbest(BigramAssocMeasures.chi_sq, 5000) negBigrams = bigram_finder.nbest(BigramAssocMeasures.chi_sq, 5000) pos = posWords + posBigrams #詞和雙詞搭配 neg = negWords + negBigrams word_fd = FreqDist() cond_word_fd = ConditionalFreqDist() for word in pos: word_fd.inc(word) cond_word_fd['pos'].inc(word) for word in neg: word_fd.inc(word) cond_word_fd['neg'].inc(word) pos_word_count = cond_word_fd['pos'].N() neg_word_count = cond_word_fd['neg'].N() total_word_count = pos_word_count + neg_word_count word_scores = {} for word, freq in word_fd.iteritems(): pos_score = BigramAssocMeasures.chi_sq(cond_word_fd['pos'][word], (freq, pos_word_count), total_word_count) neg_score = BigramAssocMeasures.chi_sq(cond_word_fd['neg'][word], (freq, neg_word_count), total_word_count) word_scores[word] = pos_score + neg_score return word_scores

Python 文字挖掘：使用機器學習方法進行情感分析（一、特徵提取和選擇）

Python 文字挖掘：使用機器學習方法進行情感分析（一、特徵提取和選擇）

基於機器學習的NLP情感分析（二）---- 分類問題

Python 文字挖掘：使用gensim進行文字相似度計算

新聞上的文字分類：機器學習大亂鬥王嶽王院長王嶽王院長 5 個月前目標從頭開始實踐中文短文字分類，記錄一下實驗流程與遇到的坑運用多種機器學習（深度學習 + 傳統機器學習）方法比較短文字分類處

自然語言處理系列-2-文字分類-傳統機器學習方法

Python 文字挖掘：jieba中文分詞和詞性標註

機器學習演算法的Python實現 (1)：logistics迴歸與線性判別分析（LDA）

搜狐新聞文字分類：機器學習大亂鬥

Python 新手實戰之機器學習實現簡單驗證碼識別(一)：用PIL簡單繪製驗證碼

第11章：使用Apriori演算法進行關聯分析（從頻繁項集中挖掘關聯規則）

未明學院活動：機器學習熱門專案開始報名，一次收穫資料探勘&機器學習技能、行業專案經歷！

科學蹭熱點：用python獲取熱門微博評論並進行情感分析

Python機器學習依賴庫的安裝（numpy、scipy、sklearn）

機器學習如何進行誤差分析

讀書筆記：機器學習實戰(5)——章6的支援向量機程式碼和個人理解與註釋

少說話多寫程式碼之Python學習032——迴圈語句02（如何迭代-排序和反轉）

如何使用python對資料夾中的檔案進行批量改名（增、刪、改字串欄位）

機器學習實戰--酒店情感分析分類

第11章：使用Apriori演算法進行關聯分析（計算頻繁項集）

機器學習中常見問題彙總（一）

Python 文字挖掘：使用機器學習方法進行情感分析（一、特徵提取和選擇）

相關推薦