樸素貝葉斯法分類器的Python3 實現

阿新 • • 發佈：2019-01-11

本篇文章是我在讀了李航的<統計學習方法>後手寫的演算法實現之一
原理請參考統計學習方法第四章樸素貝葉斯法-李航

程式碼如下:

# - * - coding: utf - 8 -*-
#
# 作者：田豐
# 郵箱：[email protected]
# 撰寫時間：2017年4月26日
# Python版本：3.6.1
# CSDN：http://blog.csdn.net/fontthrone
#
# 下一行為符號計算所匯入的包
# from fractions import Fraction

class NaiveBayesMethod:
    '''
    NaiveBayesMethod 的內部計算方式現在為數值計算,
    符號計算的程式碼已經註釋,如果需要請手動修改

    樸素貝葉斯法分類器 當lam=1 時,類分類方式為為貝葉斯估計
    實現了拉普拉斯平滑,以此避免出現要計算的概率為0的情況,以免計算錯誤的累積
    具體原理請參考李航的<統計學習方法>第四章
    lam = 0 時 類分類方式為為極大似然值估計
    ''' 


    def __init__(self, inputArray, lam):
        self.input = inputArray
        self.lam = lam
        self.__lenInput = len(self.input)
        self.__y = self.input[self.__lenInput - 1]
        self.__onlyy = self.__only(self.__y)
        self.__county = self.__countList(self.__onlyy)

    # 計算列表總樣本數 return int 

    def __countList(self, list):
        count = {}
        for item in list:
            count[item] = count.get(item, 0) + 1
        return len(count)

    # 檢查某列表中時候含有某個元素
    def __findy(self, list, y):
        result = True
        for i in range(0, len(list)):
            if list[i] == y:
                result = False 

        return result

    # 返回列表種類
    def __only(self, list):
        onlyy = []
        for i in range(0, len(list)):
            if self.__findy(onlyy, list[i]):
                onlyy.append(list[i])
        return onlyy

    # 統計列表中某元素的個數
    def __countKind(self, list, element):
        return list.count(element)

    #  通過元素值返回位置索引
    def __findOnlyElement(self, list, x):
        return self.__only(list).index(x)

    # 先驗概率
    def __py(self, x):
        # return Fraction(self.__countKind(self.__y, x) + self.lam, len(self.__y) + self.__county * self.lam)
        return (self.__countKind(self.__y, x) + self.lam) / (len(self.__y) + self.__county * self.lam)

    # 返回p(x=?)
    def __probabilityX(self, list, x):
        # return Fraction(self.__countKind(list, x) + self.lam, len(list) + self.__countList(list) * self.lam)
        return (self.__countKind(list, x) + self.lam) / (len(list) + self.__countList(list) * self.lam)

    def __probabilityYX(self, list, x, yy):
        xx = self.__findOnlyElement(list, x)
        yindex = self.__findOnlyElement(self.__y, yy)
        fz = 0
        onlyx = self.__only(list)
        onlyy = self.__only(self.__y)
        # 獲取 p(y=?|x1=?) 的分子
        for i in range(0, len(list)):
            if list[i] == onlyx[xx] and self.__y[i] == onlyy[yindex]:
                fz += 1
        # return Fraction(fz + self.lam, self.__countKind(list, onlyx[xx]) + self.__countList(list) * self.lam)
        return (fz + self.lam) / (self.__countKind(list, onlyx[xx]) + self.__countList(list) * self.lam)

    def fl(self, x, y):
        ps = []
        for i in range(0, len(self.__onlyy)):
            p1 = self.__probabilityX(self.input[0], x) * self.__probabilityYX(self.input[0], x,
                                                                              1) * self.__probabilityX(
                self.input[1], y) * self.__probabilityYX(self.input[1], y, self.__onlyy[i]) / self.__py(1)
            ps.append(p1)
        return self.__onlyy[ps.index(max(ps))]


# 測試NaiveBayesMethod
input = [[1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3],
         [1, 2, 2, 1, 1, 1, 2, 2, 3, 3, 3, 2, 2, 3, 3],
         [-1, -1, 1, 1, -1, -1, -1, 1, 1, 1, 1, 1, 1, 1, -1]]
test = NaiveBayesMethod(input, 1)
print(test.fl(2, 1))
test.lam = 0
print(test.fl(2, 1))

輸出結果如下:
-1
-1

樸素貝葉斯法分類器的Python3 實現

本篇文章是我在讀了李航的<統計學習方法>後手寫的演算法實現之一原理請參考統計學習方法第四章樸素貝葉斯法-李航程式碼如下: # - * - coding: utf - 8 -*- # # 作者：田豐 # 郵箱：[email pr

【演算法】樸素貝葉斯法之分類演算法

樸素貝葉斯法之分類演算法說明本文只是對於樸素貝葉斯法的其中的一個分類演算法的學習。參考來源《統計學習方法》。一、輸入訓練資料 T={(x1,y1),(x2,y2),...(

樸素貝葉斯法

獨立貝葉斯估計樸素貝葉斯概率概率分布輸入 12px 似然得出樸素貝葉斯法基於 1.貝葉斯定理 2.特征條件獨立假設用於分類的特征在類（y）確定的情況下是條件獨立的輸入：過程： 1.學習先驗概率 2.學習條件概率分布（條件獨立性假設）其中：

第四章樸素貝葉斯法----生成模型

4.1樸素貝葉斯的學習與分類 4.1.1基本方法聯合概率分佈P(X,Y)，獨立同步產生先驗概率分佈P(Y=ck)，k=1,2,…K 條件概率分佈P(X=x|Y=ck)=P(X1=x1,X2=x2,|Y=ck),k=1,2…K，（具有指數級的引數）因此對概率分佈做獨立同分布假設： P(X

【統計學習方法-李航-筆記總結】四、樸素貝葉斯法

本文是李航老師《統計學習方法》第四章的筆記，歡迎大佬巨佬們交流。主要參考部落格： https://blog.csdn.net/zcg1942/article/details/81205770 https://blog.csdn.net/wds2006sdo/article/detail

統計學習筆記4—樸素貝葉斯法

第四章樸素貝葉斯法 4.1樸素貝葉斯法的學習與分類 4.1.1基本方法樸素貝葉斯法通過訓練資料集學習聯合概率分佈。利用先驗概率分佈和條件概率分佈求得聯合概率分佈：條件概率引數是指數級，太複雜—條件獨立性假設：用於分類的特徵在類確定的條件下是獨立的。

李航統計學習方法之樸素貝葉斯法（含python及tensorflow實現）

樸素貝葉斯法樸素貝葉斯法數學表示式後驗概率最大化的含義樸素貝葉斯是一個生成模型。有一個強假設：條件獨立性。我們先看下樸素貝葉斯法的思想，然後看下條件獨立性具體數學表示式是什麼樣的。

統計學習方法ｃ++實現之三　樸素貝葉斯法

樸素貝葉斯法前言樸素貝葉斯法是基於貝葉斯定理與特徵條件獨立假設的分類方法，這與我們生活中判斷一件事情的邏輯有點類似，樸素貝葉斯法的核心是引數的估計，在這之前，先來看一下如何用樸素貝葉斯法分類。程式碼地址https://github.com/bBobxx/statistical-learning,歡

《統計學習方法》-樸素貝葉斯法筆記和python原始碼

樸素貝葉斯法樸素貝葉斯法是基於貝葉斯定理與特徵條件獨立假設的分類方法。對於給定的訓練資料集，首先基於特徵條件獨立假設學習輸入/輸出的聯合概率分佈；然後基於此模型，對給定的輸入x，利用貝葉斯定理求出後驗概率最大的輸出y。換句話說，在已知條件概率和先驗概率的情況下（即，在事

貝葉斯法分類和最大似然

Bayes貝葉斯一、Bayes小故事貝葉斯(約1701-1761) Thomas Bayes，英國數學家。約1701年出生於倫敦，做過神甫。1742年成為英國皇家學會會員。1761年

機器學習入門之《統計學習方法》筆記——樸素貝葉斯法

樸素貝葉斯(naive Bayes)法是基於貝葉斯定理與特徵條件獨立假設的分類方法。目錄樸素貝葉斯法設輸入空間X⊆RnX⊆Rn 為nn 維向量的集合，輸出空間為類標記集合Y={c1,c2,...,cK}Y={c1,c2,...,

機器學習之樸素貝葉斯(NB)分類演算法與Python實現

樸素貝葉斯（Naive Bayesian）是最為廣泛使用的分類方法，它以概率論為基礎，是基於貝葉斯定理和特徵條件獨立假設的分類方法。一、概述 1.1 簡介樸素貝葉斯（Naive Bayesian）是基於貝葉斯定理和特徵條件獨立假

統計學習方法樸素貝葉斯法(附簡單模型程式碼)

樸素貝葉斯（naïve Bayes）法是基於貝葉斯定理與特徵條件獨立假設的分類方法。對於給定的訓練資料集，首先基於特徵條件獨立假設學習輸入/輸出的聯合概率分佈；然後基於此模型，對給定的輸入x，利用貝葉斯定理求出後驗概率最大的輸出y。樸素貝葉斯法實現簡單，學習與預測的效率都很高，是一種

統計學習筆記（四）樸素貝葉斯法

樸素貝葉斯法 4.1 naive Bayes的學習與分類 4.1.1 基本方法設輸入空間為n維向量的集合X⊆Rn，輸出空間為類標記的集合Y={c1,c2,...,cK}。輸入為特徵向量x∈X，輸出為類標記y∈Y。X是定義在輸入空間上的隨機變數，Y

統計學習筆記（4）——樸素貝葉斯法

樸素貝葉斯法是基於貝葉斯定理與特徵條件獨立假設的分類方法。簡單來說，樸素貝葉斯分類器假設樣本每個特徵與其他特徵都不相關。舉個例子，如果一種水果具有紅，圓，直徑大概4英寸等特徵，該水果可以被判定為是蘋果。儘管這些特徵相互依賴或者有些特徵由其他特徵決定，然而樸素貝葉斯分類器認

統計學習方法—樸素貝葉斯法（學習筆記）

相關概念貝葉斯定理是關於隨機事件AA和BB的條件概率的一則定理，P(A∣B)P(A∣B)是在B發生的情況下A發生的可能。貝葉斯公式P(Bi∣A)=P(Bi)P(A∣Bi)∑nj=1P(Bj)P(A∣Bj)P(Bi∣A)=P(Bi)P(A∣Bi)∑j=1nP(

機器學習入門之樸素貝葉斯法

樸素貝葉斯法樸素貝葉斯法是基於貝葉斯定理和特徵條件獨立假設分類方法。對於給定訓練集，首先基於特徵條件獨立性的假設，學習輸入/輸出聯合概率（計算出先驗概率和條件概率，然後求出聯合概率）。然後基於此模型，給定輸入x，利用貝葉斯概率定理求出最大的後驗概率作為輸出y

機器學習筆記（六）——樸素貝葉斯法的引數估計

一、極大似然估計在上一筆記中，經過推導，得到了樸素貝葉斯分類器的表示形式： y=argmaxckP(Y=ck)∏jP(X(j)=x(j)|Y=ck)(1) 也就是說，樸素貝葉斯方法的學習是對概率P(Y=ck)和P(X(j)=x(j)|Y=ck)的

樸素貝葉斯法及其R實現

1. 樸素貝葉斯基本方法 1.1 貝葉斯分類法基本公式： P(Y=ck|X=x)=P(Y=ck)ΠjP(X(j)=x(j)|Y=ck)∑k(P(Y=ck)ΠjP(Xj=xj|Y=ck)),k=1,2,⋯,K 樸素貝葉斯分類器可以表示為 y=f(x)=ar

統計學習方法 4-樸素貝葉斯法

樸素貝葉斯法的學習與分類基本方法樸素貝葉斯法通過訓練資料集學習聯合概率分佈P(X,Y)。具體地，學習以下先驗概率分佈及條件概率分佈。先驗概率分佈：P(Y=ck),k=1,2,⋯,K 條件概率分佈:P(X=x|Y=ck)=P(X(1)=x(1),⋯,

樸素貝葉斯法分類器的Python3 實現

相關推薦