第73页 2
NADPH
读过 依存语法的理论与实践
- 章节名:2
- 页码:第73页
这边一大段话到底是冯志伟写的还是刘海涛写的?本书于所附文章前加了一句“下面一段话,是我们对配价在拟构的基于依存语法体系的自然语言处理体系中作用的理解,且作为本章的结语”不过我没看到有注释说是冯志伟写的。不过不管是谁写的,这一段总结得挺好的。 附 配价语法:价的实现过程 冯志伟 在基于配价模式的自然语言处理体系里,词库中的词是以游离状态存在的,这些游离的词本身带有一种与其它词结合的能力,这种能力在词处于孤立状态时,虽然是潜在的,但是客观存在的。一旦受到激励,即接受到理解或生成的指令的时候,作为大脑或计算机的智能体(Intelligent agent)便从词库中复制涉及到的词汇的副本进入一个临时工作区,这些原本处于游离状态的词进入工作区后,开始试图与别的词进行结合,这是一个将潜力显现的过程。 价的实现过程由于生成和识别的不同而略有不同。 在生成时,智能体根据预先的计划在词库中选取可表示生成核心内容的词语(一般是动词),动词的出现构成了整个句子的基本框架,智能体随后可依据这个框架有针对性的从词库中选取其它词,此时选取的指标仍然是词的结合能力。 在识别时,有两种方法可用,一种是待输入的全部词语都进入工作区后,将它们具有的各种信息依据词库中对应的项一一赋予,然后开始寻亲组合活动(可以采用动词制导策略),如果这些词语可以组成一个有机的整体,则识别成功;另外一种方法是从收到第一个输入的词开始,马上就从词库中提取相关信息,在随后的读取过程中,都采用边读入边分析的策略,这样输入结束之日,也就是结果显现之时。如果采用的是被赋予了概率的配价模式,系统可以生成不同分值的理解结果,当然也可以利用概率作为分析过程中的一种实时的消歧手段。 词库里的有关词汇结合能力的知识,可以通过手工或自动的方式从文本和语言实际运用中提取出来。词的配价是一种(可以)从过去或已有经验中学来的东西,这样依据配价来理解或生成语言的过程是一种基于经验的方法。 在生成语句时,游离状态的词在临时工作区依据自身的价能力,结合为一个有机的整体后,它是一个二维或三维的结构,受人类器官的限制,需要将二维或三维的结构转变为线性的一维序列,需要利用一些约束条件来完成,这些约束条件因语言的不同而有差别,这些限制可以是词法的、句法的、语义的和语用的。 在分析时,虽然线性约束条件在检测句法的合格性方面有些用处,但由于分析和理解的结果是一种二维的表示,所以词的配价起的作用更大,这样做的结果,有可能将某些不太符合句法的输入也能让计算机进行正确的理解,这对于提高系统的鲁棒性会有一定的好处,因此,基于配价的依存分析策略是一种语义制导的面向分析和理解的方法。例如,“我看书”,“书我看”,“看书我”,“书看我”等按照词的价(语义结合能力)组合,都可判定或理解为“我看书”,而在考虑线性顺序约束条件后,那些不符合句法的输入就被剔除了。这样就可以构造出一种根据约束条件多少来衡量理解程度的系统。 需要注意的是,如果在一个连续的或大于句子的语篇中,处于某个句子中的词的配价(空位)在与其它词结合时,如果通过上下文可以容易地得出实现配价的填充成分,那么按照交际有效性的原则,一般可以省略这些成分。这种情形,常常出现于日常会话等场景中。此时,不能说这些含有省略成分的句子不是合格的句子。借用Tesnière的小戏比喻,可将这种省略成分现象称为配价实现中的“连续剧”效应。因此,在研究和确定配价时,应该以脱离语境的简单句为主要对象。
说明 · · · · · ·
表示其中内容是对原文的摘抄