读书笔记之---知识获取
这篇书评可能有关键情节透露
从知识来源来看,知识获取的主要途径主要有以下几种:知识工程师以会谈的形式从专家那里获取知识、从文本中抽取知识、从数据库中发现知识、从网页上获取知识以及从图表中获取知识等等,而从知识获取过程的自动化程度来看,知识获取可分为完全手工获取、半自动知识获取、自动知识获取。从知识获取的模式来看,有基于知识表示的知识获取与基于模型的知识获取。
基于表示的知识获取与基于模型的知识获取
基于知识表示的知识获取是指首先确定一种知识表示方法,然后根据这种表示的要求(例如框架中的槽)逐项获取具体的知识,这种方法所获取的知识粒度较细,如知识编辑的方法就是基于表示的知识获取。而基于模型的知识获取则事先建立一个知识模型,知识获取是在模型的指导下进行。例如,一个基于诊断模型的知识获取系统会向用户提出诸如症状、假设、分类、先验概率等问题。而一个基于规划模型的知识获取系统则会向用户提出诸如目标、子目标、限制约束、组合方法等种种问题。这种知识获取的方法好处很多,例如,它可以使一个不了解计算机的领域专家感到很亲切,以适合于他职业用语的方式传授知识。
如后面我们会介绍到基于本体的知识获取,在这种方法中,领域本体就是知识获取模型的核心。事实上,任何机器学习方法,总是或多或少地以某种知识模型基础的。
自动(半自动)知识获取与非自动知识获取
1. 非自动知识获取
非自动知识获取是一种使用较普遍的面向专家的知识获取方式。如前所述,在非自动知识获取中,领域专家一般不熟悉知识处理,不能强求他们把自己的知识按专家系统的要求进行知识抽取和转换。另外,专家系统的设计和建造者虽然熟悉知识处理技术,但却不掌握专家的知识。因此,需要两者之间有一个专家,他既懂得如何与领域专家打交道,能从领域专家及有关文献中抽取专家系统所需的知识,又熟悉知识处理,能把获得的知识用合适的知识表示模式或语言表示出来,这样的中介专家就称为知识工程师。实际上知识工程师的工作大多由专家系统的设计和建造者担任。
专家系统MYCIN的知识获取就是按上述方法完成的,它对非自动知识获取方法的研究和发展起到了非常重要的作用。
2. 自动知识获取
自动知识获取是指系统自身具有获取知识的能力,它不仅可以直接与领域专家对话,从专家提供的原始信息中学习知识,而且还能从系统自身的运行中总结、归纳出新的知识、发现知识可能存在的错误。为达到这一目的,自动知识获取至少应具备以下能力:
(1) 具备识别语音、文字、图像的能力;
(2) 具备理解、分析和归纳的能力;
(3) 具备从实践中学习的能力。
总之,在自动知识获取系统中,原来需要知识工程师做的事情都由系统来完成。自动知识获取是一种理想的知识获取方式,它的实现涉及人工智能的众多研究领域,如模式识别、自然语言理解、机器学习等,对硬件也有较高的要求。
3. 半自动知识获取。
由于上面所述的这些人工智能研究领域自身也只是处在发展的初期阶段,所以知识的自动获取还不可能完全实现。而非自动知识获取已被证明是一件非常费时费力的工作。因此,人们提出了一种折衷方案,在非自动知识获取的基础上增加部分学习功能,或在机器学习的过程中加入人工干预。这样的系统称为半自动知识获取系统。在不同的系统中,知识获取的“半自动”程度也不同。目前大多数的知识获取系统都是这种方式。
面向各种知识源的知识获取
(1) 面向专家的知识获取
以往的知识获取主要是面向专家的,知识获取的目的也是为了建造专家系统。所获取的知识主要是专家的经验及问题求解方法。知识获取主要是由知识工程师手工整理专家知识来完成。
(2) 面向文本的知识获取
由于建造各种基于知识的系统的需要,大量的领域知识需要获取,仅从专家那里获取知识已不能满足需要,而约90%的领域知识可以直接从文本(包括书本、文献等)中获取。因此,面向文本的知识获取成为当前知识获取的主流。知识获取方法也要灵活得多,有手工获取、半自动获取及有限的自动获取等方法。在第四章中将专门介绍。
(3) 面向数据库的知识获取
数据库中蕴含有大量规律性的知识,面向数据库的知识获取主要是获取规则性的知识。面向数据库的知识获取主要得益于知识发现(在数据库中也称数据挖掘)技术的进展,如关联规则挖掘、粗集理论、机器学习、人工神经网络等技术都为数据库中的知识发现提供了可能。由于各种商业需求,面向数据库的知识获取已成为研究的热点。
(4) 面向Internet的知识获取
Internet可谓是信息最丰富,最容易得到的知识源。Internet上有大量的专业技术文献、各种Web文本、图片、语音、视频等资源。从Internet上获取知识主要是依靠信息检索技术对各种各样的信息进行分类、提取,最后再用学习算法从这些信息中抽取知识。目前,从Internet上获取知识也是炙手可热的研究领域。
(5) 面向其它知识源的知识获取
除上述几种主流的获取方法以外,还有基于例子学习的知识获取、从图表中获取知识、从语音、图像、视频等媒体中获取知识等,这里不再一一介绍。
知识获取是一个很重要的研究领域,各种各样的知识获取技术的出现足以说明这一点,在接下来的两章中,我们将对面向专家的知识获取与面向文本的知识获取作一个详细的介绍