面向大规模知识库的引文推荐技术 pdf下载pdf下载

面向大规模知识库的引文推荐技术百度网盘pdf下载

作者:
简介:本篇提供书籍《面向大规模知识库的引文推荐技术》百度网盘pdf下载
出版社:高等教育出版社京东自营官方旗舰店
出版时间:2019-10
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

内容简介

  《面向大规模知识库的引文推荐技术》是“十三五”国家重点图书规划“大数据科学”丛书著作。
  知识库不仅已经成为人们日常搜索知识的主要平台,而且为许多应用研究提供知识来源。近年来,大规模知识库引文推荐技术逐渐成为大数据知识工程的研究热点之一。《面向大规模知识库的引文推荐技术》主要针对大规模知识库引文推荐技术进行探讨。全书共7章,内容包括:绪论、实体-引文相关性分类技术、基于实体突发特征的文本表示模型、实体-引文类别依赖的混合模型、融入偏好信息的分类模型、实体-引文联合的深度网络分类模型和引文推荐冷启动问题。该书可作为大数据、知识工程研究人员的参考书或作为研究生大数据知识工程课程参考书使用。
  “大数据科学”丛书涉及大数据理论、技术、产业和管理的方方面面,旨在帮助国内相关领域的学者、产业界人士了解世界大数据研究和应用的前沿进展,也可以作为教学之用。

内页插图

目录

第1章 绪论
1.1 大规模知识库引文推荐产生的背景
1.2 大规模知识库
1. 2.1 知识的概念与分类
1.2.2 知识表示
1.2.3 知识库及知识库系统
1.2.4 大规模知识库的定义
1.2.5 大规模知识库案例
1.2.6 大知识工程
1.3 大规模知识库引文推荐技术的相关研究现状及趋势
1.3.1 在线知识库累积引文推荐
1.3.2 命名实体链接
1.3.3 命名实体分类
1.3.4 突发特征挖掘
1.3.5 信息推荐
1.4 引文表示方法
1.4.1 特征表示法
1.4.2 主题模型法
1.4.3 分布式表示法
1.5 大规模知识库引文推荐存在的问题与发展

第2章 实体-引文相关性分类技术
2.1 在线百科知识库累积引文推荐及处理流程
2.2 实体-引文相关性分析
2.3 累积引文推荐数据集
2.3.1 目标实体集合
2.3.2 文档集合
2.3.3 标注情况
2.4 工作数据集
2.4.1 别名扩展
2.4.2 查询扩展
2.5 特征选择
2.5.1 语义特征
2.5.2 时序特征
2.6 实体-引文相关性分类模型
2.6.1 查询扩展
2.6.2 分类方法
2.6.3 排序学习
2.7 累积引文相关性分析验证
2.7.1 任务场景
2.7.2 评价指标
2.7.3 文档过滤性能
2.7.4 相关性模型评价
2.8 特征分析
2.9 本章小结

第3章 基于实体突发特征的文本表示模型
3.1 引言
3.2 突发检测方法的相关工作
3.3 基于实体突发特征的文本表示
3.3.1 实体突发特征检测算法
……
第4章 实体-引文类别依赖的混合模型
第5章 融人偏好信息的分类模型
第6章 实体-引文联合的深度网络分类模型
第7章 引文推荐冷启动问题
附录扩展SMO算法核心源代码
参考文献
名词索引

前言/序言

  大规模知识库,如维基百科(Wikipedia)、百度百科,对知识的整理和应用具有重大意义。人类进入大数据智能时代,大规模知识库不仅成为人们日常搜索知识的主要平台,而且还为许多应用提供知识来源。相对知识库实体的数量,知识库编辑人员严重偏少,导致大规模知识库中的实体内容严重滞后。据统计,维基百科知识库编辑者更新其中实体内容的时间平均滞后356天。2012年国际文本检索大会发起了知识库累积引文推荐评测任务,随后大规模知识库引文推荐技术逐渐成为大数据知识工程的研究热点之一,吸引众多国际知名IT公司、研究机构和大学参与研究。
  本书围绕知识库更新问题,收集和整理了最近5年相关的最新研究成果,其中大部分内容是作者本人和作者所在研究团队的成果,重点提出了:①TREC-KBA-2012、TREC-KBA-2013和TREC-KBA-2014三个公开的大规模短文本数据集的处理方法;②融入偏好信息的实体-文本相关性分类模型;③实体-引文隐类别依赖的判别混合模型;④实体-引文联合深度网络的分类模型;⑤知识库冷启动的引文推荐方法。
  本书共7章,其中:
  第1章绪论 介绍引文推荐的背景、大规模知识库、文本表示,以及大规模知识库累积引文推荐的挑战和发展趋势。
  第2章实体一引文相关性分类技术 给出大规模知识库累积引文推荐的处理流程框架及其使用的公开数据集,随后给出实体引文的相关性分析模型,以及模型使用的特征。
  第3章基于实体突发特征的文本表示模型 介绍融入实体突发特征的实体一引文表示模型,以及对该模型的验证。
  第4章实体-引文类别依赖的混合模型 介绍融入实体和引文类别信息的判别混合模型,以及此模型在3个公开数据集的测试和分析结果。
  第5章融入偏好信息的分类模型 介绍利用偏好信息提升经典支持向量机分类能力的PSVM模型。
  第6章实体-引文联合的深度网络分类模型 介绍利用嵌入(Embedding)
  第7章引文推荐冷启动问题 介绍大规模知识库实体冷启动的引文推荐方法。
  感谢北京理工大学计算机学院、延安大学给予的支持。本书得到国家自然科学基金(80866038)、延安大学博士启动基金项目(YDBK2018-09)、陕西省教育厅专项计划项目(18JK0876)的资助。
  大规模知识库更新研究及技术发展迅速,对许多问题的研究有待进一步深入,一些有价值的新内容也未能收入本书,再加上作者的知识水平和研究能力有限,书中难免存在许多不足之处,敬请读者批评指正。