Python實現HMM（隱馬爾可夫模型）

阿新 • • 發佈：2019-01-17

前幾天用MATLAB實現了HMM的程式碼，這次用python寫了一遍，依據仍然是李航博士的《統計學習方法》

由於第一次用python，所以程式碼可能會有許多缺陷，但是所有程式碼都用書中的例題進行了測試，結果正確。

這裡想說一下python，在編寫HMM過程中參看了之前寫的MATLAB程式，發現他們有太多相似的地方，用到了numpy庫，在python程式碼過程中最讓我頭疼的是陣列角標，和MATLAB矩陣角標從1開始不同，numpy庫陣列角標都是從0開始，而且陣列的維數也需要謹慎，一不小心就會出現too many indices for array的錯誤。程式中最後是維特比演算法，在執行過程中出現了__main__:190: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future的警告，還沒有去掉這個警告，查了一下說不影響結果，後面會去解決這個問題，下面貼出我的程式碼

# -*- coding: utf-8 -*-
"""
Created on Thu Feb 16 19:28:39 2017
2017-4-2
    ForwardBackwardAlg函式功能：實現前向演算法
    理論依據：李航《統計學習方法》
2017-4-5
    修改了ForwardBackwardAlg函式名稱為ForwardAlgo以及輸出的alpha陣列形式
    完成了BackwardAlgo函式功能：後向演算法
    以及函式FBAlgoAppli：計算在觀測序列和模型引數確定的情況下，
    某一個隱含狀態對應相應的觀測狀態的概率
2017-4-6
    完成BaumWelchAlgo函式一次迭代
2017-4-7
    實現維特比演算法
@author: sgp
"""

import numpy as np

#輸入格式如下：
#A = np.array([[.5,.2,.3],[.3,.5,.2],[.2,.3,.5]])
#B = np.array([[.5,.5],[.4,.6],[.7,.3]])
#Pi = np.array([[.2,.4,.4]])
#O = np.array([[1,2,1]])

#應用ndarray在陣列之間進行相互運算時，一定要確保陣列維數相同！
#比如：
#In[93]:m = np.array([1,2,3,4])
#In[94]:m
#Out[94]: array([1, 2, 3, 4])
#In[95]:m.shape
#Out[95]: (4,)
#這裡表示的是一維陣列
#In[96]:m = np.array([[1,2,3,4]])
#In[97]:m
#Out[97]: array([[1, 2, 3, 4]])
#In[98]:m.shape
#Out[98]: (1, 4)
#而這裡表示的就是二維陣列
#注意In[93]和In[96]的區別,多一對中括號！！

#N = A.shape[0]為陣列A的行數， H = O.shape[1]為陣列O的列數
#在下列各函式中，alpha陣列和beta陣列均為N*H二維陣列，也就是橫向座標是時間，縱向是狀態

def ForwardAlgo(A,B,Pi,O):
    N = A.shape[0]#陣列A的行數
    M = A.shape[1]#陣列A的列數
    H = O.shape[1]#陣列O的列數

    sum_alpha_1 = np.zeros((M,N))
    alpha = np.zeros((N,H))
    r = np.zeros((1,N))
    alpha_1 = np.multiply(Pi[0,:], B[:,O[0,0]-1])
    
    alpha[:,0] = np.array(alpha_1).reshape(1,N)#alpha_1是一維陣列，在使用np.multiply的時候需要升級到二維陣列。#錯誤是IndexError: too many indices for array

    for h in range(1,H):
        for i in range(N):
            for j in range(M):
                sum_alpha_1[i,j] = alpha[j,h-1] * A[j,i]
            r = sum_alpha_1.sum(1).reshape(1,N)#同理，將陣列升級為二維陣列
            alpha[i,h] = r[0,i] * B[i,O[0,h]-1]
    #print("alpha矩陣: \n %r" % alpha)    
    p = alpha.sum(0).reshape(1,H)
    P = p[0,H-1]
    #print("觀測概率: \n %r" % P)
    #return alpha
    return alpha, P
    
def BackwardAlgo(A,B,Pi,O):
    N = A.shape[0]#陣列A的行數
    M = A.shape[1]#陣列A的列數
    H = O.shape[1]#陣列O的列數
    
    #beta = np.zeros((N,H))
    sum_beta = np.zeros((1,N))
    beta = np.zeros((N,H))
    beta[:,H-1] = 1
    p_beta = np.zeros((1,N))
    
    for h in range(H-1,0,-1):
        for i in range(N):
            for j in range(M):
                sum_beta[0,j] = A[i,j] * B[j,O[0,h]-1] * beta[j,h]
            beta[i,h-1] = sum_beta.sum(1)
    #print("beta矩陣: \n %r" % beta)
    for i in range(N):
        p_beta[0,i] = Pi[0,i] * B[i,O[0,0]-1] * beta[i,0]
    p = p_beta.sum(1).reshape(1,1)
    #print("觀測概率: \n %r" % p[0,0])
    return beta, p[0,0]
  
def FBAlgoAppli(A,B,Pi,O,I):
    #計算在觀測序列和模型引數確定的情況下，某一個隱含狀態對應相應的觀測狀態的概率
    #例題參考李航《統計學習方法》P189習題10.2
    #輸入格式：
    #I為二維陣列，存放所求概率P(it = qi,O|lambda)中it和qi的角標t和i，即P=[t,i]
    alpha,p1 = ForwardAlgo(A,B,Pi,O)
    beta,p2 = BackwardAlgo(A,B,Pi,O)
    p = alpha[I[0,1]-1,I[0,0]-1] * beta[I[0,1]-1,I[0,0]-1] / p1
    return p
    
def GetGamma(A,B,Pi,O):
    N = A.shape[0]#陣列A的行數
    H = O.shape[1]#陣列O的列數
    Gamma = np.zeros((N,H))
    alpha,p1 = ForwardAlgo(A,B,Pi,O)
    beta,p2 = BackwardAlgo(A,B,Pi,O)
    for h in range(H):
        for i in range(N):
            Gamma[i,h] = alpha[i,h] * beta[i,h] / p1
    return Gamma
    
def GetXi(A,B,Pi,O):
    N = A.shape[0]#陣列A的行數
    M = A.shape[1]#陣列A的列數
    H = O.shape[1]#陣列O的列數
    Xi = np.zeros((H-1,N,M))
    alpha,p1 = ForwardAlgo(A,B,Pi,O)
    beta,p2 = BackwardAlgo(A,B,Pi,O)
    for h in range(H-1):
        for i in range(N):
            for j in range(M):
                Xi[h,i,j] = alpha[i,h] * A[i,j] * B[j,O[0,h+1]-1] * beta[j,h+1] / p1
    #print("Xi矩陣: \n %r" % Xi)
    return Xi
    
def BaumWelchAlgo(A,B,Pi,O):
    N = A.shape[0]#陣列A的行數
    M = A.shape[1]#陣列A的列數
    Y = B.shape[1]#陣列B的列數
    H = O.shape[1]#陣列O的列數
    c = 0
    Gamma = GetGamma(A,B,Pi,O)
    Xi = GetXi(A,B,Pi,O)
    Xi_1 = Xi.sum(0)
    a = np.zeros((N,M))
    b = np.zeros((M,Y))
    pi = np.zeros((1,N))
    a_1 = np.subtract(Gamma.sum(1),Gamma[:,H-1]).reshape(1,N)
    for i in range(N):
        for j in range(M):
            a[i,j] = Xi_1[i,j] / a_1[0,i]
    #print(a)
    for y in range(Y):
        for j in range(M):
            for h in range(H):
                if O[0,h]-1 == y:
                    c = c + Gamma[j,h]
            gamma = Gamma.sum(1).reshape(1,N)
            b[j,y] = c / gamma[0,j]
            c = 0
    #print(b)
    for i in range(N):
        pi[0,i] = Gamma[i,0]
    #print(pi)
    return a,b,pi
    
def BaumWelchAlgo_n(A,B,Pi,O,n):#計算迭代次數為n的BaumWelch演算法
    for i in range(n):
        A,B,Pi = BaumWelchAlgo(A,B,Pi,O)
    return A,B,Pi
    
def viterbi(A,B,Pi,O):
    N = A.shape[0]#陣列A的行數
    M = A.shape[1]#陣列A的列數
    H = O.shape[1]#陣列O的列數
    Delta = np.zeros((M,H))
    Psi = np.zeros((M,H))
    Delta_1 = np.zeros((N,1))
    I = np.zeros((1,H))
    
    for i in range(N):
        Delta[i,0] = Pi[0,i] * B[i,O[0,0]-1]
        
    for h in range(1,H):
        for j in range(M):
            for i in range(N):
                Delta_1[i,0] = Delta[i,h-1] * A[i,j] * B[j,O[0,h]-1]
            Delta[j,h] = np.amax(Delta_1)
            Psi[j,h] = np.argmax(Delta_1)+1
    print("Delta矩陣: \n %r" % Delta)
    print("Psi矩陣: \n %r" % Psi)
    P_best = np.amax(Delta[:,H-1])
    psi = np.argmax(Delta[:,H-1])
    I[0,H-1] = psi + 1
    for h in range(H-1,0,-1):
        I[0,h-1] = Psi[I[0,h]-1,h]
    print("最優路徑概率: \n %r" % P_best)
    print("最優路徑: \n %r" % I)

其實程式碼就是翻譯的公式，李航博士的書中有比較詳細的推理過程，或者去找一些專業的論文文獻進一步瞭解，這裡僅僅是實現了最簡單的應用，其應用例項如下：

輸入資料格式：

In[117]:A
Out[117]:
array([[ 0.5, 0.2, 0.3],
[ 0.3, 0.5, 0.2],
[ 0.2, 0.3, 0.5]])

In[118]:B
Out[118]:
array([[ 0.5, 0.5],
[ 0.4, 0.6],
[ 0.7, 0.3]])

In[119]:Pi
Out[119]: array([[ 0.2, 0.4, 0.4]])

In[120]:O
Out[120]: array([[1, 2, 1]])

輸出結果為：

In[101]:alpha,p = ForwardAlgo(A,B,Pi,O)

In[102]:alpha
Out[102]:
array([[ 0.1 , 0.077 , 0.04187 ],
[ 0.16 , 0.1104 , 0.035512],
[ 0.28 , 0.0606 , 0.052836]])

In[103]:p
Out[103]: 0.130218

In[104]:beta,p1 = BackwardAlgo(A,B,Pi,O)

In[105]:beta
Out[105]:
array([[ 0.2451, 0.54 , 1. ],
[ 0.2622, 0.49 , 1. ],
[ 0.2277, 0.57 , 1. ]])

In[106]:p1
Out[106]: 0.130218

In[107]:gamma = GetGamma(A,B,Pi,O)

In[108]:gamma
Out[108]:
array([[ 0.18822283, 0.31931069, 0.32153773],
[ 0.32216744, 0.41542644, 0.27271191],
[ 0.48960973, 0.26526287, 0.40575036]])

In[109]:xi = GetXi(A,B,Pi,O)

In[110]:xi
Out[110]:
array([[[ 0.1036723 , 0.04515505, 0.03939548],
[ 0.09952541, 0.18062019, 0.04202184],
[ 0.11611298, 0.1896512 , 0.18384555]],

[[ 0.14782903, 0.04730529, 0.12417638],
[ 0.12717136, 0.16956181, 0.11869327],
[ 0.04653735, 0.05584481, 0.16288071]]])

In[111]:a,b,pi = BaumWelchAlgo_n(A,B,Pi,O,5)

In[112]:a
Out[112]:
array([[ 0.43972438, 0.15395857, 0.40631705],
[ 0.309058 , 0.45055446, 0.24038754],
[ 0.3757005 , 0.50361975, 0.12067975]])

In[113]:b
Out[113]:
array([[ 0.50277235, 0.49722765],
[ 0.49524289, 0.50475711],
[ 0.91925551, 0.08074449]])

In[114]:pi
Out[114]: array([[ 0.08435301, 0.18040718, 0.73523981]])

In[115]:viterbi(A,B,Pi,O)
Delta矩陣:
array([[ 0.1 , 0.028 , 0.00756],
[ 0.16 , 0.0504 , 0.01008],
[ 0.28 , 0.042 , 0.0147 ]])
Psi矩陣:
array([[ 0., 3., 2.],
[ 0., 3., 2.],
[ 0., 3., 3.]])
最優路徑概率:
0.014699999999999998
最優路徑:
array([[ 3., 3., 3.]])
__main__:192: VisibleDeprecationWarning: using a non-integer number instead of an integer will result in an error in the future

Python實現HMM（隱馬爾可夫模型）

Python實現HMM（隱馬爾可夫模型）

快速通俗理解HMM（隱馬爾可夫模型）

一文搞懂HMM（隱馬爾可夫模型）

HMM（隱馬爾科夫模型）

基於HMM（隱馬爾科夫鏈）和DNN的歌聲合成系統成果樣本

隱馬爾可夫模型（《統計學習方法》、python實現）

ML--HMM(隱馬爾可夫模型及python的實現2)

隱馬爾可夫模型（HMM）和 jieba分詞原始碼的理解

隱馬爾可夫模型（HMM）及Viterbi演算法

ml課程：概率圖模型—貝葉斯網路、隱馬爾可夫模型相關（含程式碼實現）

HMM隱馬爾可夫模型（HMM）攻略

隱馬爾可夫模型（Hidden Markov Model, HMM)

統計學習方法_隱馬爾可夫模型HMM實現

隱馬爾可夫模型（HMM）和Viterbi演算法

隱馬爾可夫模型（HMM）詳解

隱馬爾可夫模型HMM（二）概率計算問題

隱馬爾可夫模型（HMM）攻略

隱馬爾可夫模型（HMM）

HMM隱馬爾可夫模型來龍去脈（一）

HMM隱馬爾可夫模型來龍去脈（二）

Python實現HMM（隱馬爾可夫模型）

相關推薦