第45页 谈谈中文分词
Msglue对本书的所有笔记 · · · · · ·
-
第32页 统计语言模型 2 延伸阅读:统计语言模型的工程诀窍 2.1 高阶语言模型
马尔科夫假设:假定文本中的每个词Wi和前面N-1个词有关,而与更前面的词无关,这样当前词Wi的...
-
第34页 Ch3 统计语言模型 2 延伸阅读:统计语言模型的工程诀窍 2.2 模型的训练、零概率问题和平滑方法
古德和图灵还给出了一个很漂亮的重新估算概率的公式,这个公式后来被称为古德-图灵估计(Good...
-
第45页 谈谈中文分词
-
第46页 淡淡中文分词 2 延伸阅读:工程上的细节问题 2.1分词的一致性
当统计语言模型被广泛应用后,不同的分词器产生的结果的差异要远远小于不同人看法之间的差异...
> 查看全部5篇
说明 · · · · · ·
表示其中内容是对原文的摘抄