《知识图谱:概念与技术》前言
内容架构
全书共五篇,由16章构成,力求涵盖知识图谱相关的基本概念与关键技术。
第1篇 基础篇
包含前两章。第1章介绍知识图谱的基本概念、历史沿革、研究意义、应用价值等。第2章介绍知识图谱所必需的基础知识,主要介绍与知识图谱密切相关的知识表示、机器学习、自然语言处理的基本概念。
第2篇 构建篇
介绍知识图谱的构建。大规模高质量知识图谱的构建是整个知识图谱技术落地的核心,因此也是整本书的重点。本篇的核心是第3章与第4章。在这两章中,我们介绍了知识图谱中知识获取的两个核心问题。其中一个是点的识别与建立,知识图谱中的点可以是词汇与实体,因此第3章重点介绍了词汇挖掘与实体识别。有了知识图谱中的点之后,建立点之间的关系是知识图谱构建的核心问题。为此,第4章主要介绍了关系抽取(从文本中获取关系实例)。
在此基础上,第2篇进一步对两类重要的知识图谱,即概念图谱(第5章)与百科图谱(第6章)的构建展开了具体介绍。这两类知识图谱在知识图谱技术发展历程中有着突出地位,有很多实际应用。最后,第2篇再对其中的两个专题:众包构建(第7章)与质量控制(第8章)展开介绍。当前的知识图谱构建还离不开人,如何把人力用好是第7章的主题。质量控制是知识图谱构建的核心,第8章从质量视角再次盘点整个知识图谱构建的全流程。
可以看出,我们在构建部分浓墨重彩,从构建的关键环节(词汇挖掘、实体识别、关系抽取)、两类重要知识图谱的构建,以及构建的两个专题等三个切面对知识图谱构建进行了全方位的论述。其目的在于向读者立体式地呈现知识图谱构建的完整体系。这也从一个侧面说明了知识图谱知识体系的庞杂。
第3篇 管理篇
介绍知识图谱的建模与存储(第9章)、查询与检索(第10章)以及图数据管理系统(第11章)。这一篇旨在从数据管理的角度系统阐述知识图谱如何建模、如何存储、如何查询、如何检索,以及如何实现系统性的高效管理。
第4篇 应用篇
把知识图谱构建好、管理好的目的还是为了应用好。第4篇对于基于知识图谱的应用技术展开介绍,包括搜索与推荐(第13章)、自然语言问答(第14章)。这些应用本质上都依赖基于知识图谱的自然语言理解,因此这一专题也单独成章(第12章)。
第5篇 实践篇
知识图谱实践有哪些基本原则和最佳实践(第15章),以及在知识图谱应用过程中还存在哪些挑战(第16章),都会在这一篇中回答。
肖仰华
2019年11月10日
《知识图谱:方法、实践与应用》前言
本书主要内容
本书共包括9章,主要内容如下:
第1章主要介绍知识图谱的基本概念、历史渊源、典型的知识图谱项目、技术要素以及核心应用价值。
第2章围绕知识表示与建模,首先介绍传统人工智能领域的典型知识表示方法,如谓词逻辑、描述逻辑、框架系统等,接下来重点介绍RDF、OWL等互联网时代的知识表示框架,此外还介绍知识图谱的向量表示方法等。最后以Protégé为例介绍知识建模的具体实践过程。
第3章围绕知识存储,首先介绍知识图谱存储的主要特点和难点,然后介绍几种常用的知识图谱存储索引及存储技术,并对原生图数据库的技术原理进行简要介绍。此外,还概要介绍常用的图数据库,并以Apache Jena和gStore为例介绍知识图谱存储的具体实践过程。
第4章围绕知识抽取与知识挖掘,首先介绍从不同来源获取知识图谱数据的常用方法,然后重点围绕实体抽取、关系抽取和事件抽取等,对从文本中获取知识图谱数据的方法展开了较为具体的介绍。最后以DeepDive开源工具为例介绍关系抽取的具体实践过程。
第5章围绕知识图谱的融合,分别对概念层的融合和实体层的融合展开介绍,包括本体映射、语义映射技术、实体对齐、实体链接等。最后以LIMES开源工具为例介绍实体融合的具体实践过程。
第6章围绕知识图谱推理,首先介绍推理的基本概念,然后分别从基于演绎逻辑的知识图谱推理和基于归纳的知识图谱推理,对常用的知识图谱推理技术进行介绍。最后以Apache Jena和Drools等开源工具为例介绍知识图谱推理的具体实践过程。
第7章和第8章分别围绕语义搜索和知识问答展开,介绍语义索引、基于知识图谱的问答等系列技术,并以gAnswer等开源工具为例,介绍基于知识图谱实现精准搜索和问答的具体实践过程。
第9章为应用案例章节,作者挑选了电商、图情、生活娱乐、企业商业、创投、中医临床领域和金融证券行业7个应用案例,对知识图谱技术在不同领域的实现过程和应用方法展开介绍。
作者
2019年7月