知识表示与处理课堂笔记


[TOC]

知识表示与处理概述

为什么我们需要知识表示与处理技术?

归纳推理分析人工智能技术(机器学习)的本质局限。

科学的酒徒:一个晚上他喝的苏格兰威士忌和汽水,第二个晚上喝的是波旁威士忌和汽水,接下来的几个晚上是白兰地和汽水,然后是朗姆酒和汽水,然后是杜松子酒和汽水。他喝醉的原因是什么呢?一次又一次地喝醉之后,他发誓再也不喝汽水了!

问题根源真正相关的因素没有被确定和检查,如酒精。若酒精被确定以上所有场合的共同因素,就很可能快速将汽水排除出去。

​ 需要常识性知识:威士忌、白兰地和兰姆酒等都是酒,都有酒精。

​ 归纳方法是极好的,仅当它们试图证实(或证伪)的假说确实正确地识别出因果相关的事态的时候,才能产生可靠的结果

​ 仅当那个假说已经被假定为论证中的前提的时候,归纳方法才允许把这些结果演绎出来。

​ 归纳法的本质:不是发现的通路,也不是证明的规则,而是检验假说的工具

​ 因此,可靠、可信和可解释性的人工智能需要知识处理(对知识进行表示和推理)的技术和方法,以支持演绎性推理。

知识工程基本概念与技术

  • 知识工程

知识表示与处理涉及的学科方向是知识工程

知识工程是一门新兴的工程技术学科。它是社会科学与自然科学的相互交叉和科学技术与工程技术的相互渗透的产物。知识工程是运用现代科学技术手段高效率、大容量的获得知识、信息的技术。-百度百科

Knowledge engineering (KE) refers to all technical, scientific and social aspects involved in building, maintaining and using knowledge-based systems.

Knowledge engineering is a field of artificial intelligence (AI) that tries to emulate the judgment and behavior of a human expert in a given field.

  • 概念

Concepts are the fundamental building blocks of our thoughts and beliefs. They play an important role in all aspects of cognition.

概念是人类在认识过程中,从感性认识上升到理性认识,把所感知的事物的共同本质特点抽象出来,加以概括,是自我认知意识的一种表达,形成概念式思维惯性。是人类所认知的思维体系中最基本的构筑单位

概念具有两个基本特征,即概念的内涵外延

在这里插入图片描述

  • 本体论

Ontology is the philosophical study of the nature of being, becoming, existence, or reality, as well as the basic categories of being and their relations.

本体论是对存在或现实的本质,以及存在的基本范畴及其关系的哲学研究。

有的哲学家,如柏拉图学派认为:任何一个名词都对应着一个实际存在

人工智能领域的学者开始将本体论的观念应用在知识表示上,即借由本体论中的基本元素:概念及概念间的关连,作为描述真实世界的知识模型。W3C组织定义了多种本体论相关语言,如RDF、DAML+OIL、OWL等。

在这里插入图片描述

  • 知识库

A knowledge base (KB) is a technology used to store complex structured and unstructured information used by a computer system. The initial use of the term was in connection with expert systems which were the first knowledge-based systems.

专家系统设计所应用的规则集合,包含规则所联系的事实及数据,它们的全体构成知识库。

l知识库相对于数据库而言,其中存储的是知识,而不是数据。

  • 基于知识的系统(Knowledge-based system, KBS)

A knowledge-based system (KBS) is a computer program that reasons and uses a knowledge base to solve complex problems.

A knowledge based system has three types of sub-systems: a knowledge base, an user interface and an inference engine.

Another advancement was the development of special purpose automated reasoning systems called classifiers.

  • 专家系统(Expert System)

In artificial intelligence, an expert system is a computer system that emulates the decision-making ability of a human expert.

Expert systems are designed to solve complex problems by reasoning through bodies of knowledge, represented mainly as if–then rules rather than through conventional procedural code.

Expert systems were introduced by the Stanford Heuristic Programming Project led by Edward Feigenbaum, who is sometimes termed the “father of expert systems

Classical expert systems: diagnosing infectious diseases (MYCIN) and identifying unknown organic molecules (DENDRAL)

  • 知识表示(Knowledge representation)

把知识载体中的知识因子与知识关联起来,便于人们识别和理解知识。

对知识的一种描述,或者说是对知识的一组约定,一种计算机可以接受的用于描述知识的数据结构

某种意义上讲,表示可视为数据结构及其处理机制的综合

表示= 数据结构+处理机制

  • 知识表示

知识表示方法: 约定了知识表示的一系列规则

逻辑表示法,如偶数的数学定义。

产生式表示法,又称规则表示法

框架(frame)表示法

面向对象的表示方法

语义网表示法

本体表示法

描述逻辑(description logics)

  • 知识获取

早期:从领域专家的交互中获取知识的过程和技术

现在:把问题求解的专门知识从专家头脑或者其他知识源(如书本、文献)中提取出来,并将之转换为计算机内部表示的过程。

包括三种不同的获取方式:

  1. 人工知识获取
  2. 半自动知识获取
  3. 自动知识获取
  • 知识推理

通常从已知的知识出发,通过一系列逻辑思考找出蕴含的知识或者事实,或者归纳出新的知识,这个过程称为推理。

知识表示及方法

知识表示概述

概念:将知识载体中的知识因子知识本身关联起来,便于人们识别和理解知识。

  • 知识表示时客观事物的机器标识(A KR is a Surrogate)

即知识表示需要首先定义客观实体的机器指代指称

  • 知识表示是一组本体约定概念模型

即知识表示还需要定义用于描述客观事物的概念和类别体系。

  • 知识表示是支持智能推理的理论基础

即知识表示还需要提供机器推理的模型与方法。

  • 知识表示是用于高效计算的数据结构

即知识表示也是一种用于高效计算的数据结构。

  • 知识表示是人可理解的机器语言

即知识表示还必须接近于人的认知,是人可以理解的机器语言

  • 知识表示是客观事物的机器标识

即机器表示需要首先定义客观实体的机器指代或指称。

在这里插入图片描述

经典知识表示方法

  • 逻辑与知识表示
  • 框架与面向对象表示法
  • 语义网络
  • 产生式规则与专家系统

逻辑与知识表示

亚里士多德——逻辑学之父——“三段论”

命题逻辑
  • 命题逻辑是应用一套形式化规则对以符号表示的描述性陈述进行推理的系统。

  • 在命题逻辑中,一个或真或假的描述性陈述被称为原子命题,对原子命题内部结构不做任何解析。

  • 若干原子命题可通过逻辑运算符来构成复合命题。

在这里插入图片描述

(蕴含式只有当前真后假时结果为假。)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

谓词逻辑

在这里插入图片描述

框架与面向对象表示法

是以框架理论为基础的一种结构化知识表示方法,它适用于表示多种类型的知识。

1975年美国麻省理工学院明斯基 (Minsky) 在论文“A framework for representing knowledge”中提出了框架理论,引起了人工智能学者的重视。他是针对人们在理解情景、故事时提出的心理学模型,论述的思想方法不是具体实现。

Brachman (1979) 详细阐述了框架理论观点,并提出了解决方案。

lPatrick Hayes (1979) 的框架逻辑(The Logic of Frames)进一步讨论了框架理论,声称“大部分框架只是部分一阶逻辑的一种新语法”。

定义

框架是由若干个结点和关系(统称为槽)构成的网络。是语义网络的一般化形式的一种结构。同语义网络没有本质的区别。如将语义网络结点间弧上的标注也放到槽内就成了框架表示形式。

表示形式:

框架名(frame)、槽名(slot)、侧面、值组成。

在这里插入图片描述

​ 一个框架由若干个被称为“槽”的结果组成,每一个槽又可根据实际情况划分为若干个“侧面”

​ 一个槽用于描述所论述对象某一方面的属性。一个侧面用于描述相应属性的一个方面。

​ 槽和侧面所具有的属性值分别被称为槽值和侧面值。

在这里插入图片描述

特点:

(1)继承性

是框架的一个很重要的性质,下层框架可以从上层框架继承某些属性或值,也可以进行补充和修改。通过减少重复及冗余信息存储,节省了存储空间。

(2)结构化

框架表示法是一种结构化的知识表示方法,适用于表达结构性的知识,概念、对象等知识。不但能表示知识的内部结构,还能表达知识之间的联系框架还可以表示行为(动作),有些过程性事件或情节也可用框架网络来表示,是一种表达能很强的知识表示方法。

在这里插入图片描述

​ 框架表示法-推理方法

  1. 继承

    在框架网络中,各框架之间通过ISA链(槽)构成半序的继承关系。在填槽过程中,如果没有特别的说明,子框架的槽值将继承父框架相应的槽值,称为默认推理

  2. 匹配

    由框架所构成的知识库,根据已知的信息,通过与知识库中预先存储的框架进行匹配,找出一个或几个与该信息所提供的情况最合适的预选框架,形成初步假设,然后再在该框架引导下,收集进一步信息。按照某种评价规则,对预选的框架进行评价,以决定最后接收或放弃预选的框架,即在框架引导下的推理

​ 不足之处:缺乏形式论和严格的形式化表示,没有明确的推理机制保证问题求解的可行性。同时,如果框架系统中各个数据结构不一致就会影响系统的清晰性,造成推理的困难。

描述逻辑

语义网

语义网络表示法

​ 语义网络是一种用实体及其语义关系来表达知识的有向图

​ 一个语义网络主要包括了两个部分:实体,以及实体之间的关系。

​ 从结构上来看,语义网络一般由一些最基本的语义单元组成。这些最基本的语义单元被称为语义基元。可用三元组来表示(节点1,节点2,语义关系)。

​ 语义网络有很多变种,但是都具有表示个体对象、对象类别以及对象间关系的能力。

​ 一个典型的图形符号表示在椭圆或方框内显示对象或类别的名称,并用有标记的弧连接它们

在这里插入图片描述

语义网络可以表示实时性的知识

在这里插入图片描述

在这里插入图片描述

​ 该语义网络表示了猎狗是一种狗,且进一步指出狗是一种动物,并且分别指出他们所具有的属性。

​ 语义网络可以描述事物间多种复杂的语义关系:类属关系;包含关系;属性关系;位置关系等。

类属关系是指具有共同属性的不同事物间的分类关系、成员关系或实例关系,类属关系的一个最主要特征是属性的继承性,处在具体层的结点可以继承抽象层结点的所有属性(is-a;a kind of; a member of; instance of)。

属性关系一般是指事物和其属性之间的关系。一个类的对象一般都有一个以上的属性,而每个属性又有一个值。属性和值组合成特性(Have;Can)。

包含关系是指具有组织或结构特征的“部分与整体”之间的关系。它和类属关系的最主要的区别就是包含关系一般不具备属性的继承性(Part of)。

语义网表示法

image-20210923172304694

个体和个体之间的链接不同于类型和类型之间的链接以及个体和类型之间的链接。

在这里插入图片描述

句子“John gives a book to Mary”

用谓词表示:

​ Give (John,Mary,Book)

二元谓词表示:

​ ISA(G1,Giving-Events)

​ Giver (G1,John)

​ Receiptors(G1,Mary)

​ Object (G1,Book1)

​ ISA(Book1,Book)

语义网表示法

  • 用语义网表示知识的问题求解系统主要有两大部分组成,一部分是由语义网络构成的知识库,另一部分是用于问题求解的推理机制。语义网络的推理过程主要有两种,一种是继承,另一种是匹配,与框架表示法类似。
  • “缺省继承”:某些情况下,当我们对事物所作的假设具有相当大的真实性,但又不是十分有把握时,最好对所作假设加上“可能”这样的字眼。这种类型的值被放入槽的DEFAULT(缺省)侧面中。只要不与现有的事实相冲突,就默认这个值为该事物的值。

继承推理

  1. 建立一个结点表,用来存放待求解结点和所有以ISA,AKO等继承弧与此结点相连的那些结点。在初始情况下,表中只有待求解结点。
  2. 检查表中的第一个结点是否有继承弧。如果有,就把该弧所指的所有结点放入结点表的末尾,记录这些结点的所有属性,并从结点表中删除第一个结点。如果没有,从结点表中删除第一个结点,。
  3. 重复 2.,知道结点表为空。此时记录下来的所有属性都是待求结点继承来的属性。

在这里插入图片描述

如图所示,求出鸟(待求节点)可以(can)进行的活动(除会飞之外)

  1. 将鸟(待求节点)加入结点表
  2. 检查第一个结点(鸟)的继承弧,将继承弧所指的结点(动物)加入结点表,删除第一个结点(鸟)
  3. 检查第一个结点(动物)的继承弧,不存在继承弧,删除第一个结点(动物),并记录第一个结点(动物)can对应的属性(运动,吃)。

故鸟can运动和吃

语义网络的优点:

  • 结构性。与框架法一样,语义网络也是一种结构化的知识表示方法
  • 联想性
  • 自然性
  • 非严格性

不足之处:

  • 推理规则不十分明了。
  • 表达范围有限,一旦结点个数太多,网络结构复杂,推理就难进行。

知识存储与管理

产生式规则与专家系统

产生式规则

  • 来源: “产生式”这一术语是在1943年由美国数学家波斯特首先提出的。波斯特根据替换规则提出了一种被称为Post机的计算模型,该模型使用了串替代规则,串替代规则在迭代过程中会匹配替代,产生出新的规则。因此模型中的每条规则称为产生式。

  • 概念:产生式是模拟人类求解问题的思维方式的一种方法。产生式在一定程度上与人类获取过程性知识、求解过程性问题的思维方式一致,因此可以用来解释、推导、解决一些过程性相关的问题。

  • 基本类型:

    陈述性表示:是关于事物及其关系的知识,或者说是关于“是什么”的知识

    过程性表示:是关于完成某项任务的行为或操作步骤的知识,或者是关于“如何做”的知识。

  • 一般形式:

    产生式规则一般是由条件和动作组成的指令,即所谓的 条件-活动规则(C-A规则),可记为C->A,即“如果C,那么A”(IF C THEN A)C是产生式的前提(或称为前件),用于指出该产生式可用的条件。A是一组结论或操作(或称为后件),用于指出当C指示的条件成立时,应当获得的结论或者应当执行的操作。

  • 产生式规则

例如:

IF某动物有羽毛THEN它是鸟类

IF心中有信念THEN人生有方向

IF蓬生麻中THEN不扶自直

又有时为表达更丰富的内涵,前件和后件会采用多种逻辑表达式来构成,例如:

IF NOT周末 THEN 上课学习

IF 天气晴朗AND有闲暇THEN出去郊游

IF 国庆放假THEN旅游OR 在家阅读

  • 产生式规则与逻辑蕴含式

逻辑蕴含式表示的知识只能是精确的,产生式表示的知识可以是不确定。(因为逻辑蕴含式是一个逻辑表达式,其逻辑值只有真和假)

逻辑蕴含式的匹配一定要求是精确的,而产生式的匹配可以是不确定的。(因为产生式的前提条件和结论都可以是不确定的,因此其匹配也可以是不确定的)

产生式规则与逻辑蕴含式非常相似,但产生式规则比逻辑蕴含式表达能力更强,产生式规则不仅表达蕴含关系,还描述事物之间的一种对应关系,其前件、后件都可以包括更多复杂的构成,包括各种操作、规则、变换等。

  • 产生式系统:相互协作、推理更新的产生式规则集合及其推理机制等形成产生式系统。

  • 组成:

    数据库

    产生式规则库

    控制系统

在这里插入图片描述

1. 综合数据库 (Global Database)

•又称为事实库工作区黑板等;

•是一个用于存放问题求解过程中各种当前信息的数据结构,如问题的初始状态、事实或证据、中间推理结论和最后结果等,其中的数据是产生式规则的处理对象。

•数据库中的数据根据应用主题的问题不同,可以是常量、变量、谓词、表结构、图像等等。

2. 产生式规则库 (Production Rule Base)

•又称为产生式规则集,用于描述相应领域知识的产生式规则集合,由领域规则组成,在机器中以某种动态数据结构进行组织。

•产生式规则库的设计与组织是产生式系统的重要问题,在建立产生式规则库时,应该注意:

(1)有效表达领域的过程性知识;

(2)对知识进行合理的组织和管理

在这里插入图片描述

3. 控制系统 (Control System)

又称为推理机,是一个解释程序,负责整个产生式系统的运行,用来控制和协调产生式规则库及综合数据库的运行,包含推理方式控制策略。主要工作包括:

(1) 按一定的策略从产生式规则库中选择规则,与综合数据库中已知事实进行匹配。

(2) 匹配成果的规则可能不止一条,这称为发生了冲突,此时控制系统必须调用相应的解决冲突策略进行消解,以便从中选出一条执行。

(3) 在执行某一规则时,如果规则的右部是一个或多个结论,则把这些结论加入综合数据库中;如果规则的右部是一个或多个操作,则执行这些操作。

(4) 对于不确定知识,在执行每条规则时,还需要按一定的算法计算结论的不确定性。

(5) 随时掌握结束产生式系统运行的时机,以便在适当的时候停止系统的运行。

  • 控制策略

产生式系统的控制策略是指系统的推理,可分为正向推理和反向推理两个基本方式。

  • 正向推理:是指正向使用规则的推理过程,是从初始状态(初始事实/数据)到目标状态(目标条件)的状态图的搜索过程,又称为数据驱动推理。

    算法:

    •第一步,初始化综合数据库,将初始事实数据加入综合数据库中。

    •第二步,用综合数据库中的事实/数据匹配目标条件,若目标条件满足,则推理成功,结束。

    •第三步,用产生式规则库规则的前提匹配综合数据库中的事实数据,将匹配成果的规则组成冲突规则集。

    •第四步,如果冲突规则集为空,则运行失败,退出。

    •第五步,利用某种冲突消除策略,从冲突规则集中选取一条规则,将其结论加入综合数据库,或者执行其动作,撤销冲突规则集,转到第二步。

  • 反向推理:是指从目标出发,反向使用规则进行推理,向初始事实和数据方向前进。它是从目标状态(目标条件)到初始状态(初始事实/数据)的与或图解搜索过程,又称为目标驱动推理。

    算法:

    •第一步,初始化综合数据库,将初始事实数据置入综合数据库,将目标条件放入目标链。

    •第二步,如果目标链为空,则推理结束,推理成功。

    •第三步,取出目标链中的第一目标,用综合数据库中的事实/数据同其匹配,若匹配成功,转到第二步。

    •第四步,用产生式规则库中各规则的结论同该目标匹配,若匹配成功,则将第一个匹配成功且未使用过测规则的前提作为新的目标,并取代原来的父目标而加入目标链,转到第三步。

    •第五步,若该目标是初始目标,则推理失败,退出。

    •第六步,将该目标的父目标移回目标链,取代该目标及其兄弟目标,转到第三步。

规则匹配

规则匹配是产生式系统推理的核心技术。

产生式规则:一般由条件和动作组成(也常称为前件和后件)

  • 前件通常由若干条件元素组合而成
  • 后件是在前件条件元素集合都满足的情况下所采取的动作
  • 事实:指断言一个语言变量的值或多个语言变量间的关系的陈述句,语言变量的值或语言变量间的关系可以是一个词,也可以是数字,还可以是对象。也常称为工作内容存元素
  • 一般使用三元组(对象,属性,值)或(关系,对象1,对象2)来表示事实,其中对象是语言变量,若考虑不确定性,可用四元组表示(增加可信度)
  • 例:(钢笔,颜色,黑色);(放置……上边,钢笔,桌子,82%)

将事实与产生式规则的前件进行匹配,看试试是否满足产生式规则的条件集合,从而选择应采取的动作,这个过程便是规则匹配

这需要将领域已建立的所有产生式规则的前件与事实断言逐一匹配,并测试计算规则是否将被激活。

Rete算法是一个用来实现产生式规则模式匹配的高效算法。Rete是拉丁文,意为Net(网络),顾名思义,Rete算法与网络有关。

Rete算法基础在于Rete网络(也称为鉴别网络),利用鉴别网络进行规则匹配,称为模式匹配

鉴别网络

鉴别网络(Rete网络)是一个“事实可以在其中流动”的图

Rete网络的节点可以分为四类:

  • 根节点(Root Node):虚拟节点,构建Rete网络的入口

  • 类型节点(Type Node):存储事实的各种类型,各事实从对应的类型节点进入Rete网络

  • Alpha节点(α Node, 1-input节点),组成了Alpha网络。有Alpha存储区和一个输入口

  • Beta节点(β Node, 2-input节点),组成了Beta网络。有left存储区(Beta存储区)和right存储区(Alpha存储区),及左右两个输入口

存储区存储的最小单位是工作内存元素(WME)

WME是为事实建立的元素,适用于和非根节点代表的模式进行匹配的元素

Token是WME的列表,包含一个或多个WME,用于Beta节点的左侧输入

事实可以作为Beta节点的右侧输入,也可以作为Alpla节点的输入。

每个非根节点都代表产生式左部的一个模式,从根节点到终节点的路径表示产生式的左部

Rate算法

1.创建根

2.加入规则1(Alpha节点从1开始,Beta节点从2开始)

①取出模式1,检查模式中的参数类型,如果是新类型,则加入一个类型节点。

②检查模式1对应的Alpha节点是否已存在,如果存在,则记录节点位置;如果没有,则将模式1作为一个Alpha节点加入网络中。同时,根据Alpha节点的模型建立Alpha内存表。

③重复步骤②直到所有的模式处理完毕。

④组合Beta节点,按照如下方式:

•Beta(2)左输入节点为Alpha(1),右输入节点为Alpha(2);

•Beta(i)左输入节点为Beta(i-1),右输入节点为Alpha(i),i>2

并将两个父节点的内存表内联成自己的内存表。

⑤重复步骤④直到所有的Beta节点处理完毕。

⑥将动作(THEN部分)封装成叶节点(Action节点),作为Beta(n)的输出节点。

3.重复步骤2直到所有规则处理完毕

在这里插入图片描述

l推理引擎在进行模式匹配时,先对事实进行断言,为每个事实建立WME,然后将WME从Rete鉴别网络的根节点开始匹配。WME传递到的节点类型不同,采取的算法也不同。下面对Alpha节点和Beta节点处理WME的不同情况进行分开讨论

1.如果WME的类型和根节点的后继节点Type Node(Alpha节点的一种)所指定的类型相同,则将该事实保存在该Type Node节点对应的Alpha存储区中,该WME被传到后继节点继续匹配;否则,放弃该WME的后续匹配。

2.如果WME被传递到Alpha节点,则检测WME是否和该节点对应的模式匹配,若匹配,则将该事实保存在该Alpha节点对应的存储区中,该WME被传递到后续节点继续匹配;否则,放弃该WME的后续匹配。

3.如果WME被传递到Beta节点的右端,则加入该Beta节点的右存储区,并和左存储区中的Token进行匹配(匹配动作根据Beta节点的类型进行,如连接、投影),若匹配成功,则将该WME加入Token中,然后将Token传递到下一个节点;否则,放弃该WME的后续匹配。

4.如果Token被传递到Beta节点的左端,则会加入该Beta节点的左存储区,并和右存储区中的WME进行匹配(匹配动作根据Beta节点的类型进行,如连接、投影),匹配成功,则该Token会封装匹配到的WME,形成新的Token,传递到下一个节点;否则,放弃该Token的后续匹配。

5.如果WME被传递到Beta节点的左端,将WME封装成仅有一个WME元素的WME列表,作为Token,然后按照步骤4的方法进行匹配。

6.如果Token传递到终节点,则和该根节点对应的规则被激活,建立相应的Activation,并存储到Agenda中,等待激发。

7.如果WME被传递到终节点,将WME封装成仅有一个WME元素的WME列表,作为Token,然后按照步骤6的方法进行匹配。

Rete算法的以下两个特点使其优于传统的模式匹配算法

1.状态保存

事实集合每次变化时,其匹配后的状态都被保存在Alpha节点和Beta节点中。在下一次事实集合发生变化时,绝大多数的结果都不需要变化,Rete算法通过保存操作过程中的状态,避免了大量的重复计算。Rete算法主要是为那些事实集合变化不大的系统设计的,当每次事实集合的变化非常大时,Rete的状态保存算法效果并不理想。

2.节点共享

不同规则之间含有相同的模式,从而可以共享同一个节点。Rete网络的各部分包含各种不同的节点共享。

产生式规则专家系统
  1. 概念

专家系统是一种具有智能的计算机系统,它应用人工智能技术和计算机技术,内部含有大量的某个领域专家水平的知识与经验,能够利用该领域人类专家的知识和解决问题的方法来进行推理和判断,模拟人类专家的决策过程,为该领域提供专家级的服务,能够部分或全部代替领域专家,解决本领域的高难度问题。

  1. 产生式规则专家系统

在这里插入图片描述

基本结构

  • 人机接口

  • 推理机

  • 知识库及其管理系统

  • 数据库及其管理系统

  • 知识获取机构

  • 解释机构

MYCIN专家系统:

由3个子系统和2个库组成,被知识工程师视为“专家系统的设计规范”。现在的许多专家系统都是以MYCIN系统为代表的基于规则的专家系统,应用在农业、银行业、保险业、咨询与审计行业以及商业企业中。

在这里插入图片描述

描述逻辑

描述逻辑的概念

描述逻辑的发展历史

描述逻辑的构成

描述逻辑语言

描述逻辑的推理

描述逻辑概念

​ 描述逻辑是一种知识化表示的形式化语言,是一阶逻辑的可判定子集

​ 最显著的优点是具有推理机制,能实现知识之间的自动推理,因此,近年来描述逻辑成为人工智能界的研究热点问题。

描述逻辑的研究历史

1980年-1990年:主要涉及系统的实现,如 KL-ONE(Branchman)

1990-1995:开发的基于表(tableau)的算法,并实现了第一批基于该算法的系统。

1995-2000:对各种表示能力强的DLs,开发了许多优化的tableau算法,如FACT,RACE,DLP系统等。

描述逻辑的构成

由以下四个部分构成:

描述语言

术语公理

断言事实

推理机制

描述逻辑语言

描述逻辑语言包含三个部分:

概念

角色

构造算子

在这里插入图片描述

Dls最基本的描述语言,包括基本概念,角色,并通过扩展不同的构造算子形成复合概念

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

描述逻辑推理

描述逻辑的主要推理任务是:

包含:通过比较定义检查一个类别是否是另一个类别的子集。

分类:检查一个对象是否属于一个类。

一致性:某些系统也包括类别定义的,隶属标准在逻辑上是否可满足。

如:

计算本体类层次关系,检查概念一致性

计算本体内部关系和隐含关系的合理性

语义网

基本概念

是WWW的延伸 语义网不是独立的Web网络,而是以现有的以HTML网页为核心的Web为基础的,是现有WWW的信息扩展;

是语义版本的WWW:语义网是在现有的WWW的基础上,增加了对Web内容的语义解析,希望形成语义化的表示和表达,以促进计算机对WWW网页内容的理解和利用;

现有WWW与Semantic Web,就如若自然语言逻辑与命题逻辑相比谓词逻辑。

语义网的目标是:为Web上的信息提供具有计算机可以理解的语义,从而实现智能Agent对网页的有效访问、处理和知识关联等需求,满足基于知识的智能应用目标。

语义网体系框架

在这里插入图片描述

XML的设计宗旨是传输数据,而非显示数据。

XML标签没有被预定义。

XML被设计为具有自我描述性。

XML是W3C的推荐标准。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

RDF资源描述框架

在这里插入图片描述

在这里插入图片描述

知识图谱

知识图谱概念及定义

​ 知识图谱是理解事物及其关系的一个系统,该系统一般以图的方式进行表达。

​ 知识图谱本质上是一种语义网络。其结点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系。

代表性知识图谱

UMLS

UMLS(unified Medical Language System)

知识图谱关键技术

主要关键技术:

  • 知识表示:RDF、OWL和Description Logics
  • 知识获取(Knowledge acqusition):信息抽取
  • 知识推理:知识补全
  • 知识融合:本体对齐、实体对齐(Entity Alignment)、实体链接(Entit Linking)
  • 知识存储
  • 知识应用:智能问答,语义检索和知识推理等

知识融合:将多源异构知识图谱进行融合,集成构建更大规模的知识图谱,实现更强的语义互操作性。主要的方法包括:

本体对齐(Ontology Alignment)

实体对齐(Entity Alignment)

实体链接(Entity Linking)

知识融合技术:知识融合技术是解决知识异构性的核心技术,其目标是实现多个知识图谱的合并处理。知识图谱在知识表示语言、概念模型结构及其术语等方面的差异,造成了知识图谱的异构性。包括本体匹配(本体映射、本体对齐)实体对齐(实例匹配、实体消解)两种技术。

知识融合技术-本体匹配

  • 知识融合技术是解决知识异构性的核心技术,其目标是实现多个知识图谱的合并处理。

  • 知识图谱在知识表示语言、概念模型结构及其术语等方面的差异,造成了知识图谱的异构性。

  • 包括本体匹配(本体映射、本体对齐)和实体对齐(实例匹配、实体消解)两种技术。

image-20211008151017817

  • 本体匹配旨在发现源本体和目标本体之间的映射单元的集合,可分为两种方法:

    基于术语匹配的本体融合方法:通过比较本体的标签、名称等文本之间的相似性,实现本体的对齐,可分为基于字符串(编辑距离、汉明距离和子串相似性等)和基于语言的方法(如语法,形态等,以及外部字典如Wordnet)

    编辑距离:采用动态规划方法实现源字符串到目标字符串的搜索。

Silk和OpenEA,EAKit等。

知识获取技术

  • 早期:从领域专家的交互中获取知识的过程和技术(人工知识获取)
  • 现在:把问题求解的专门知识从专家头脑或者其他知识源(如书本、文献)中提取出来,并将之转换为计算机内部表示的过程(自动知识获取)
  • 包括三种不同的获取方式
    • 人工知识获取
    • 半自动知识获取(信息抽取/数据挖掘)
    • 自动知识获取(信息抽取/数据挖掘)

在这里插入图片描述

命名实体抽取(NER)


文章作者: XX
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 XX !
  目录