ASR 隐马尔可夫模型（HMM）

Nyako ·

更新时间:2024-11-15

· 976 次阅读

前言

马尔可夫模型（HMM）是表达常用的数学模型，相关概念在随机过程中能学到。在语音识别（ASR）中，是基础且重要的模型之一。本篇文章主要介绍：

HMM 概念前向和后向算法维特比算法 隐马尔可夫模型（HMM） 简单理解HMM

数据科学中，预测是一个经久不衰的问题。以常见的时间为序数据为例，数据科学家期望对过去（t0t_{0}t0时刻）和当前（tNt_{N}tN时刻）数据的观察( Time )，实现预测未来（tN+1t_{N+1}tN+1时刻）的值，HMM也是为了干这类事情而生的统计模型。

做个不恰当但有意思的比喻，假设数据科学家是算命先生，观察到的数据是求富贵顾客的生辰八字、面相等等。中式算命先生掏出周易算本（统计模型），输入观察数据，得出结果——顾客会富贵。这么个过程就是数据科学常干的事，HMM也是为了干类似的事情而生的统计模型（想象成周易算本）。
分享其它博主拿HMM干的事：
1、预测女朋友心情

现在回到HMM，实际HMM或者其它统计学方法能干的不止这些，包括分类、数据压缩等都是常见任务。通过概率的表达，HMM大多用于时间序列的模型，预测天气、股票等。HMM的主要机理由内部状态节点实现，包含各节点之间的转移概况，以及各状态与实际观测结果之间的观测概率。或者，换个方式理解转移概率和观测概率，转移概率代表数据变化主要趋势，观测概率包含可能的观测与主趋势差异。通过不断输入观测数据的训练，最终转移概率能把握数据随时间的主要变化规律，从而实现下一时刻的预测。因为模型内部的状态是不可观测，所以是“隐”（Hidden）。

HMM三大基本问题：
概率计算问题：已知模型参数和观测值，计算观测值的概率；预测问题：已知模型和观测值，计算观测值概率最大时，随时间变化的状态路径；学习问题：已经观测值，估计使观测值概率最大的模型。 图解HMM流程
先介绍盒子和球的例子：假设有三个盒子，盒子里都有红球和白球，每次观测选取一个盒子取一个球。根据以上介绍，HMM模型参数在例子中表示如下表

模型参数参数值概率表达意义

状态集合【1号盒子，2号盒子，3号盒子】 HMM的状态节点

状态转移概率 A=[a12a22a32a12a22a32a13a23a33] A = \begin{bmatrix} a_{12} & a_{22} & a_{32} \\ a_{12} & a_{22} & a_{32} \\ a_{13} & a_{23} & a_{33} \end{bmatrix} A=⎣⎡a12a12a13a22a22a23a32a32a33⎦⎤ 1、2、3对应盒子号 aij=P(Statet+1=Statej∥Statet=Statei)a_{ij}=P(State_{t+1}=State_{j} \| State_{t}=State_{i})aij=P(Statet+1=Statej∥Statet=Statei) 当前时刻（ttt）到下一时刻（t+1t+1t+1）时的状态转移概率

状态初始概率 π=[π1,π2,π3]\pi=[\pi_{1},\pi_{2},\pi_{3}]π=[π1,π2,π3] πi=P(Statet=0=Statei) \pi_{i}=P(State_{t=0}=State_{i}) πi=P(Statet=0=Statei) 初始时刻，取到各个状态的概率

观测集合【红，黄】 viv_{i}vi 所有可能的观测结果

状态观测概率 B=[b1Redb1Yellowb2Redb2Yellowb3Redb3Yellow] B = \begin{bmatrix} b_{1Red} & b_{1Yellow} \\ b_{2Red} & b_{2Yellow} \\ b_{3Red} & b_{3Yellow} \end{bmatrix} B=⎣⎡b1Redb2Redb3Redb1Yellowb2Yellowb3Yellow⎦⎤ Red、Yellow对应球颜色 bij=P(Ot=vj∥Statet=Statei)b_{ij}=P(O_{t}=v_{j}\|State_{t}=State_{i})bij=P(Ot=vj∥Statet=Statei) 每个状态的前提下，观测到每个结果的概率

观测值 O=[Red,Red,Yellow] O = [Red, Red,Yellow]O=[Red,Red,Yellow] 时间序列，记录多次观测到的结果

HMM模型示意图如下：

注意：a11a_{11}a11等，是当前时刻（ttt）到下一时刻（t+1t+1t+1）时的状态转移（此刻1中拿球，下一刻还是1中拿球）概率。b1Redb_{1Red}b1Red等，是状态1观察为红（盒子1中拿出红球）的概率。

现在，假设HMM模型已知（如例子中展示的），包含状态转移概率矩阵A、状态观察概率B、状态初始概率π\piπ，组合成的模型记作H=(A,B,π)H=(A,B,\pi)H=(A,B,π)。现在求取到观测值O=[Red,Yellow,Red]O=[Red,Yellow,Red]O=[Red,Yellow,Red]的概率P(O∣H)P(O|H)P(O∣H)。

粗暴的求解思路：
找出可形成观测值O的所有情况，即每个时刻得到观察值的所有可能状态序列。或者说，每次取球时，从盒子取到该观察球色的所有可能性，记作III。计算每种情况的概率，P(O,Ii∣H)P(O,I_{i}|H)P(O,Ii∣H) 所有情况概率求和得到最终观察值的概率，P(O∣H)=∑i=1IP(O,Ii∣H)P(O|H)=\sum_{i=1}^{I}P(O,I_{i}|H)P(O∣H)=∑i=1IP(O,Ii∣H)
粗暴求解思路需要找到所有可能情况，复杂度是O(TNT)O(TN^{T})O(TNT)，显然复杂度严重影响方法的实现与应用。为此，常使用的算法是前向算法与后向算法，讲复杂度降至O(TN^{2})。

作者：Charles Tu

马尔可夫 hmm 模型

模型参数	参数值	概率表达	意义
状态集合	【1号盒子，2号盒子，3号盒子】		HMM的状态节点
状态转移概率	A=[a12a22a32a12a22a32a13a23a33] A = \begin{bmatrix} a_{12} & a_{22} & a_{32} \\ a_{12} & a_{22} & a_{32} \\ a_{13} & a_{23} & a_{33} \end{bmatrix} A=⎣⎡a12a12a13a22a22a23a32a32a33⎦⎤ 1、2、3对应盒子号	aij=P(Statet+1=Statej∥Statet=Statei)a_{ij}=P(State_{t+1}=State_{j} \\| State_{t}=State_{i})aij=P(Statet+1=Statej∥Statet=Statei)	当前时刻（ttt）到下一时刻（t+1t+1t+1）时的状态转移概率
状态初始概率	π=[π1,π2,π3]\pi=[\pi_{1},\pi_{2},\pi_{3}]π=[π1,π2,π3]	πi=P(Statet=0=Statei) \pi_{i}=P(State_{t=0}=State_{i}) πi=P(Statet=0=Statei)	初始时刻，取到各个状态的概率
观测集合	【红，黄】	viv_{i}vi	所有可能的观测结果
状态观测概率	B=[b1Redb1Yellowb2Redb2Yellowb3Redb3Yellow] B = \begin{bmatrix} b_{1Red} & b_{1Yellow} \\ b_{2Red} & b_{2Yellow} \\ b_{3Red} & b_{3Yellow} \end{bmatrix} B=⎣⎡b1Redb2Redb3Redb1Yellowb2Yellowb3Yellow⎦⎤ Red、Yellow对应球颜色	bij=P(Ot=vj∥Statet=Statei)b_{ij}=P(O_{t}=v_{j}\\|State_{t}=State_{i})bij=P(Ot=vj∥Statet=Statei)	每个状态的前提下，观测到每个结果的概率
观测值	O=[Red,Red,Yellow] O = [Red, Red,Yellow]O=[Red,Red,Yellow]		时间序列，记录多次观测到的结果

1024 个赞

编辑举报

需要登录后方可回复, 如果你还没有账号请注册新账号

相关文章

Go语言中结构体方法副本传参与指针传参的区别介绍

Rebecca 2021-05-19

817

CentOS8中的nmcli使用详解

Letitia 2021-03-06

974

tomcat组件图解一个web服务器的架构演化史

Phyllis 2020-03-26

598

深度学习Tensorflow 2.4 完成迁移学习和模型微调

Tani 2023-01-06

1085

Android进阶之从IO到NIO的模型机制演进

Kathy 2023-02-01

1279

pytorch实现模型剪枝的操作方法

Sabah 2023-02-26

256

模型训练时GPU利用率太低的原因及解决

Winola 2023-02-26

499

JavaScript中颜色模型的基础知识与应用详解

Qamar 2023-02-26

1859

pytorch网络模型构建场景的问题介绍

Tia 2023-03-11

227

详解通过OSI七层模型打开计算机网络大门

Pandora 2023-03-27

867

python多进程中的生产者和消费者模型详解

Fawn 2023-03-27

342

Python生产者与消费者模型中的优势介绍

Rose 2023-03-27

891

详解Three.js 场景中如何彻底删除模型和性能优化

Tia 2023-04-18

1310

基于Pydantic封装的通用模型在API请求验证中的应用详解

Dulcea 2023-05-02

336

Flutter 模型动态化赋值研究分析

Kirima 2023-05-12

1159

Docker AIGC等大模型深度学习环境搭建步骤最新详细版

Jacinda 2023-05-13

1807

Tensorflow训练模型默认占满所有GPU的解决方案

Bella 2023-05-13

714

利用Pytorch实现ResNet网络构建及模型训练

Tanisha 2023-05-27

1264

DenseNet121模型实现26个英文字母识别任务

Pandora 2023-07-01

1833

linux环境部署清华大学大模型最新版chatglm2-6b图文教程

Carly 2023-07-20

547

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。
软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座