隐马尔可夫模型（七）——隐马尔可夫模型的学习问题(前向后向算法）（转载）

首页 > 代码库 > 隐马尔可夫模型（七）——隐马尔可夫模型的学习问题(前向后向算法）（转载）

隐马尔可夫模型（七）——隐马尔可夫模型的学习问题(前向后向算法）（转载）

2024-08-29 05:36:03 220人阅读

隐马尔可夫模型的学习问题：给定一个输出序列O=O₁O₂...O_T,如何调节模型μ=(A,B,π）的参数，使得P(O|M)最大。

最大似然估计是一种解决方法，如果产生的状态序列为Q=q₁q₂...q_T,根据最大似然估计，可以通过以下公式推算：

π_i‘ = δ（q₁,s_i)

a_ij‘ = Q中从状态q_i转移到q_j的次数/Q中从状态q_i转移到另一状态（包括q_j)的次数

技术分享

b_j(k)‘ = Q中从状态q_j发出符号V_k的次数/ Q中到达状态q_j的次数

技术分享

δ（x,y)为克罗奈克函数，当x=y时，δ（x,y)=1；否则，δ（x,y)=0

但是注意，在实际中，状态Q=q₁q₂...q_T是观察不到的（隐变量），因此上述的这种求法是有问题的。幸好希望最大化，可以用于含有隐变量的统计模型的参数最大似然估计。基本思想是初始时，随机的给模型参数赋值，但是要遵循模型对参数的限制，例如，从一个状态发出的所有状态转移概率之和为1，得到模型μ₀。然后根据μ₀中的具体值，带入下式，可以得到u₁.依次往下迭代，直到收敛于最大似然估计值。这种迭代爬山算法可以局部使P(O|μ）最大。称为Baum-Welch算法或前向后向算法。

给定HMM的参数μ和观察序列O=O₁O₂...O_T,在时间t位于状态s_i,在时间t+1位于状态s_j的概率为ξ_t(i,j)=P(q_t=s_i,q_t+1=s_j|O,μ），公式推导如下：

技术分享 ................(1)