Chap6_隐马尔科夫模型
- ①语音识别的本质是通讯
- 雅各布森的通信六要素:

通信六要素
- 所以我们更需要使用通信编码和解码的思路来解决通信问题。
- ②信息S1,S2,S3,…在传输后变成接收的信号O1,O2,O3,…的可能性
- 这个部分就是编码的正确性度量。
- 最终可以表示为:

简化的概率计算
- ③什么是马尔科夫链?
- 每一个时刻的状态之和上一个状态有关。
每一个状态只和前面一个有关,比如从状态3到状态4,不论在此之前是如何进入到状态3的(是从状态2进入,还是在状态3本身转了几个圈子),这个概率都是0.3。
- 类比到NLP,就有两个马尔科夫过程,一个是从前一个信息到这个信息,一个是从当前信息到下一个编码。
- 马尔科夫链的本质就是条件概率。
如果某个时刻t的状态St是m2,则下一个时刻的状态St+1=m3的概率(可能性)是60%。如果用数符号表示是P(St+1=m3|St=m2)=0.6。类似的,有P(St+1=m4|St=m2)=0.4。

马尔科夫链示意图
- ④马尔科夫链是时间序列
- 马尔科夫链的不同之处在于,它不是一个可见的字符串,而是一个需要反复去推演得到的时间序列,区别在于语料库上。
隐马尔可夫模型是上述马尔可夫链的一个扩展:任一时刻t的状S_t是不可见的。
- ⑤链条的合并计算
- 最后能够得到这个结果,5.5的上半部分是生成概率,下半部分是转移概率。其实就是把5.3的右边变成了5.4:

总概率的分解

转移概率和生成概率
- ⑥拓展的学习
- 这里的拓展需要一个训练算法(鲍姆–韦尔奇算法)和使用时的解码算法(维特比算法),解决时间序列的生成以及转移概率的计算。(这部分在书中有更明确的论述,可以等使用的来看)
127人阅读
大豆黄豆黄对本书的所有笔记 · · · · · ·
-
Chap3_统计语言模型
①如何判断一个句子是合法的 既然我们没有设置语法规则,那计算机就需要计算这个句子出现的可...
-
Chap4_谈谈分词
①中文需要分词 因为英文的单词之间有空格,但是中文没有。 查字典:从头到尾扫描字符串,以...
-
Chap6_隐马尔科夫模型
> 查看全部5篇
说明 · · · · · ·
表示其中内容是对原文的摘抄