2.樸素貝葉斯演算法

阿新 • • 發佈：2018-12-16

樸素貝葉斯程式碼（原理很簡單）直接上程式碼

import numpy as np 
from collections import Counter,defaultdict

class Nbayes:
		def __init__(self):
			self.p_prior={}
			self.p_condiction={}
		def fit(self,x_train,y_train):
			#首先求出y_train的長度
			N=len(y_train)#N=y_train.shape[0]
			c_y=Counter(y_train)
			for key,var in c_y.items():
				self.p_prior[key]=var/N#求出各個y所佔的概率
			#接下來求條件概率
			for d in range(x.train.shape[0]):
				xd_y=default(int)
				vector=x_train[:,d]
				for x,y in zip(vextor,y_train):
					xd_y[(x,y)]+=1
					for key,var in xd_y.items():
						self.p_condiction[(d,key[0],key[1])]=var/c_y(key[1])
		return 
		#寫測試
		def predict(self,x_test):
			p=defaultdict()
			for y,y1 in self.p_prior.items():
				temp=y1
				for d,xd in enumerate(x):#列舉型別
						temp*=slef.p_condiction[(d,xd,y)] # 分母P(X)相同，故直接儲存聯合概率分佈即可
				p[y]=temp
		return max(p,key=p.get)
		

if __name__ == '__main__':
    data = np.array([[1, 0, -1], [1, 1, -1], [1, 1, 1], [1, 0, 1],
                     [1, 0, -1], [2, 0, -1], [2, 1, -1], [2, 1, 1],
                     [2, 2, 1], [2, 2, 1], [3, 2, 1], [3, 1, 1],
                     [3, 1, 1], [3, 2, 1], [3, 2, -1]])
    X_data = data[:, :-1]
    y_data = data[:, -1]
    clf = NBayes()
    clf.fit(X_data, y_data)
    print(clf.p_prior, '\n')##每個特徵的概率
    print(clf.p_condition,'\n')
    print(clf.predict(np.array([2, 0])))

寫完了，這就是朴樹貝葉斯

2.樸素貝葉斯演算法

樸素貝葉斯程式碼（原理很簡單）直接上程式碼 import numpy as np from collections import Counter,defaultdict class Nbayes: def __init__(self): self

樸素貝葉斯演算法之python實現　統計學習方法例4.2實戰

　本人在自學李航老師的統計學習方法，在學習樸素貝葉斯章節時，其中概念非常好理解，但是準備想把課本中的例題實戰一下時卻犯了難，有點無從下手的感覺，主要是因為怎麼去合理的去寫，提高程式碼的適應性以及重複利用率。　在網上找了蠻多部落格，大部分都是是判斷情感詞等，其中有篇部落

機器學習筆記（2）——使用樸素貝葉斯演算法過濾（中英文）垃圾郵件

在上一篇文章《使用樸素貝葉斯演算法對文件分類詳解》中，我們實現了用樸素貝葉斯演算法對簡單文件的分類，今天我們將利用此分類器來過濾垃圾郵件。 1. 準備資料——文字切分之前演算法中輸入的文件格式為單詞向量，例如['my', 'dog', 'has', 'flea', 'p

小白python學習——機器學習篇——樸素貝葉斯演算法

一.大概思路： 1.找出資料集合，所有一個單詞的集合，不重複，各個文件。 2.把每個文件換成0,1模型，出現的是1，就可以得到矩陣長度一樣的各個文件。 3.計算出3個概率，一是侮辱性的文件概率，二是侮辱性文件中各個詞出現的概率，三是非侮辱性文件中各個詞出現的概率。 4.二、三計算方法

樸素貝葉斯演算法原理

（作者：陳玓玏） 1. 損失函式假設我們使用0-1損失函式，函式表示式如下： Y Y Y為真實

樸素貝葉斯演算法應用——垃圾簡訊分類

理解貝葉斯公式其實就只要掌握：1、條件概率的定義；2、乘法原理 P (

機器學習——樸素貝葉斯演算法

概率定義為一件事情發生的可能性概率分為聯合概率和條件概率聯合概率:包含多個條件，且所有條件同時成立的概率記作:P(A,B) P(A,B)=P(A)P(B) 條件概率:就是事件A在另外一個事件B已經發生的條件概率記作:P(A|B)

機器學習實踐（九）—sklearn之樸素貝葉斯演算法

一、樸素貝葉斯演算法什麼是樸素貝葉斯分類方法屬於哪個類別概率大，就判斷屬於哪個類別概率基礎概率定義為一件事情發生的可能性 P(X) : 取值在[0, 1] 聯合概率、條件概率與相互獨立

樸素貝葉斯演算法優化與 sklearn 實現

1. 引言上一篇日誌中，我們主要介紹了貝葉斯演算法，並提供了 python 實踐：樸素貝葉斯演算法的推導與實踐但執行上一篇日誌中的示例，我們發現出現了下面的結果： ['love', 'my', 'dalmation'] 屬於非侮辱類 ['stu

樸素貝葉斯演算法的推導與實踐

1. 概述在此前的文章中，我們介紹了用於分類的演算法： k 近鄰演算法決策樹的構建演算法 – ID3 與 C4.5 演算法但是，有時我們無法非常明確地得到分類，例如當資料量非常大時，計算每個樣本與預測樣本之間的距

機器學習——樸素貝葉斯演算法Python實現

簡介這裡參考《統計學習方法》李航編進行學習總結。詳細演算法介紹參見書籍，這裡只說明關鍵內容。即條件獨立下：p{X=x|Y=y}=p{X1=x1|Y=y} * p{X2=x2|Y=y} *...* p{Xn=xn|Y=y} （4.4）等價於p{Y=ck|X=x

第3章樸素貝葉斯演算法（二演算法實戰）

3.6樸素貝葉斯實踐 3.6.1樸素貝葉斯之微博評論篩選以微博評論為例。為了不影響微博的發展，我們要遮蔽低俗的言論，所以要構建一個快速過濾器，如果某條評論使用了負面或者侮辱性等低俗的語言，那麼就將該留言標誌為內容不當。過濾這類內容是一個很常見的需求。對此問題建

機器學習樸素貝葉斯演算法

樸素貝葉斯屬於監督學習的生成模型，實現簡單，沒有迭代，學習效率高，在大樣本量下會有較好表現。但因為假設太強——特徵條件獨立，在輸入向量的特徵條件有關聯的場景下，並不適用。樸素貝葉斯演算法：主要思路是通過聯合概率建模，運用貝葉斯定理求解後驗概率;將後驗概率最大者對應的類別作

【ML學習筆記】樸素貝葉斯演算法的demo（機器學習實戰例子）

礙於這學期課程的緊迫，現在需要儘快從課本上掌握一些ML演算法，我本不想經過danger zone，現在看來卻只能儘快進入danger zone，數學理論上的缺陷只能後面找時間彌補了。如果你在讀這篇文章，希望你不要走像我一樣的道路，此舉實在是出於無奈，儘量不要去做一個心

樸素貝葉斯演算法的python實現

import numpy as np import re #詞表到向量的轉換函式 def loadDataSet(): postingList = [['my', 'dog', 'has', 'flea', 'problems', 'help', 'please']

樸素貝葉斯演算法-My way of ML7

預備知識聯合概率：包含多個條件，所有條件同時成立概率P（A，B）=P（A）P（B）條件概率：事件A發生在事件B發生的條件之下的概率。所有的特徵值無關的時候才能適用條件概率樸素貝葉斯的前提是：特徵條件獨立，哈哈，這也是她被叫做樸素的原因，因為特徵之間很難獨

資料探勘領域十大經典演算法之—樸素貝葉斯演算法（超詳細附程式碼）

簡介 NaïveBayes演算法，又叫樸素貝葉斯演算法，樸素：特徵條件獨立；貝葉斯：基於貝葉斯定理。屬於監督學習的生成模型，實現簡單，沒有迭代，並有堅實的數學理論（即貝葉斯定理）作為支撐。在大量樣本下會有較好的表現，不適用於輸入向量的特徵條件有關聯的場景。基本思想 (1)

機器學習之樸素貝葉斯演算法與程式碼實現

樸素貝葉斯演算法與程式碼實現演算法原理樸素貝葉斯是經典的機器學習演算法之一，也是為數不多的基於概率論的分類演算法。樸素貝葉斯原理簡單，也很容易實現，多用於文字分類，比如垃圾郵件過濾。該演算法的優點在於簡單易懂、學習效率高、在某些領

機器學習實戰讀書筆記（四）：樸素貝葉斯演算法

樸素貝葉斯優點: 在資料較少的情況下仍然有效可以處理多類別問題缺點：對輸入的資料的準備方式較為敏感適用資料型別：標稱型資料 p1(x,y)>p2(x,y) 那麼類別是1 p2(x,y)>p1(x,y) 那麼類別是2 貝葉斯決策的核心是選擇具有最高概率的決策

Python實現樸素貝葉斯演算法 --- 過濾垃圾郵件

# -*- coding:utf-8 -*- import numpy as np import random import re __author__ = 'yangxin' """ 過濾垃圾郵件 """ class FilterSpam(object): #

2.樸素貝葉斯演算法

相關推薦