书籍详情
《动态知识发现与三支决策--基于优势粗糙集视角》[22M]百度网盘|亲测有效|pdf下载
  • 动态知识发现与三支决策--基于优势粗糙集视角

  • 出版社:科学出版社旗舰店
  • 出版时间:2017-06
  • 热度:12666
  • 上架时间:2024-06-30 09:38:03
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍



商品参数

动态知识发现与三支决策--基于优势粗糙集视角
曾用价 60.00
出版社 科学出版社
版次 1
出版时间 2017年06月
开本 16
著编译者 陈红梅,李少勇,罗川,李天瑞      .
页数 156
ISBN编码 9787030530585


内容介绍

  本书针对大数据的动态性,面向三支决策的知识维护,运用粒计算的思想,以经典优势粗糙集及其扩展模型为研究对象,借助增量学习方式和多核并行计算策略,构建大数据分析与挖掘的方法,力图展现优势粗糙集和三支决策视角下大数据分析处理与知识发现的*新进展。

目录

目录
丛书序

前言
第1章 绪论 1
1.1 基于粗糙集的大数据分析 1
1.2 三支决策及其动态知识发现 2
1.3 优势关系粗糙集及其知识发现 4
1.4 本章小结 5
第2章 预备知识 6
2.1 经典粗糙集模型 6
2.1.1 信息系统 6
2.1.2 等价类 7
2.1.3 近似集 7
2.2 优势关系粗糙集模型 8
2.2.1 有序决策系统 8
2.2.2 近似集 9
2.3 集值优势关系粗糙集模型 11
2.3.1 集值有序决策系统 11
2.3.2 析取和合取优势关系 12
2.3.3 近似集 12
2.4 优势特性关系粗糙集模型 13
2.4.1 不完备有序决策系统 13
2.4.2 优势特性关系及关系矩阵 13
2.4.3 近似集 16
2.5 复合粗糙集模型 18
2.5.1 复合关系 18
2.5.2 近似集 19
2.6 不完备决策系统的知识粒度和信息熵 21
2.6.1 知识粒度及性质 21
2.6.2 粗糙熵及性质 22?
2.7 本章小结 23
第3章 优势关系粗糙集模型近似集动态更新方法 24
3.1 对象集变化时近似集动态更新 25
3.1.1 添加对象时近似集动态更新 25
3.1.2 删除对象时近似集动态更新 29
3.2 算例 32
3.3 算法设计与分析 35
3.4 实验评估与性能分析 36
3.5 本章小结 40
第4章 集值优势关系粗糙集模型近似集动态更新方法 41
4.1 面向属性集更新的动态粗糙集模型 42
4.1.1 基于矩阵运算的近似集构造方法 42
4.1.2 添加属性时近似集动态更新 46
4.1.3 删除属性时近似集动态更新 47
4.2 算法设计与分析 48
4.3 算例 53
4.4 实验方案与性能分析 56
4.4.1 实验方案 56
4.4.2 性能分析 57
4.5 本章小结 60
第5章 不完备信息系统中优势关系粗糙集模型近似集动态更新方法 61
5.1 属性值粗化细化背景及定义 61
5.1.1 属性值粗化细化的背景 61
5.1.2 属性值粗化细化的定义 63
5.2 属性值细化时近似集的动态更新原理及算法 65
5.2.1 属性值细化时近似集的动态更新原理 65
5.2.2 属性值细化时近似集的动态更新算法 73
5.3 属性值粗化时近似集的动态更新原理及算法 81
5.3.1 属性值粗化时近似集的动态更新原理 81
5.3.2 属性值粗化时近似集的动态更新算法 86
5.4 算例 91
5.5 算法复杂度分析 92
5.6 实验方案及性能分析 92
5.6.1 实验方案 93
5.6.2 性能分析 94
5.7 本章小结 99
第6章 复合关系粗糙集模型近似集动态维护方法 100
6.1 复合关系粗糙集模型近似集动态更新 100
6.1.1 添加对象时近似集动态更新 100
6.1.2 删除对象时近似集动态更新 105
6.2 算例 108
6.3 算法设计与分析 111
6.4 实验方案与性能分析 113
6.5 本章小结 116
第7章 优势关系粗糙集方法近似集并行计算算法研究 118
7.1 属性集变化时近似集的并行计算原理 118
7.2 算例 120
7.3 算法设计与分析 125
7.4 实验方案与性能分析 128
7.5 本章小结 130
参考文献 131

在线试读

第1章 绪论
  1.1 基于粗糙集的大数据分析
  近年来,随着信息技术的迅猛发展,计算机应用融入人们生活的方方面面,数据采集的可能性和驱动性不断攀升,大数据应运而生。大数据具有Volume(海量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)等特点。一方面,信息不确定性的激增,使得智能信息分析处理的方法和原理的有效性变得尤为重要;另一方面,如何将智能信息处理的方法应用于大数据环境,是一个新的挑战。粗糙集理论是进行不确定信息分析的重要数学方法之一,它采用近似的原理,基于粒化的思想,对不确定信息进行分析,从而对决策分析与知识发现提供支持。粒化的思想、近似的原理在处理大数据中具有独特的优势,学者们对如何有效地将粗糙集理论应用于大数据的知识挖掘进行了有益的探索和研究,给出了可行的解决方案,为大数据的分析提供了行之有效的方案。针对大数据的动态性,构建增量学习模型,充分利用已有信息,是解决大数据动态特征的可行思路。针对大数据的体量大,采用分而治之、并行计算的方法,是现代计算分析的必由之路。针对大数据数据类型复杂、关系类型多等特点,研究复杂数据的分析处理模型迫在眉睫。大数据的出现,不仅是挑战,也是不确定信息分析理论发展的重要机遇,两者的发展相辅相成。在粗糙集理论中,针对大数据的动态性、多样性、体量大等特征,学者们进行了大量的研究,取得了丰硕的成果[1]。
  分布式计算、并行计算在一定程度上满足了人们对大规模数据处理的技术需求,是解决大数据挖掘问题的重要途径。如何对基于粗糙集理论的数据挖掘和知识发现算法进行并行优化引起了许多学者的研究兴趣。杨明等提出了一种基于水平分布的多决策表全局属性核求解方法,为分布式环境下的多决策表属性核求解提供了一条有效途径[2]。Yang等设计了一种基于MapReduce的属性约简并行算法[3]。基于分辨矩阵,Liu等设计了一种并行化决策规则挖掘的增量算法[4]。Zhang等提出了基于粗糙集理论的并行知识发现方法[5],结合Hadoop云计算平台中MapReduce并行计算框架,分析了信息系统中条件划分和决策分类的并行计算方法,提出了一种基于MapReduce的粗糙近似集并行求解算法[6],并在Twister、Phoenix、Hadoop等不同MapReduce平台下比较了它的性能[7]。考虑到大数据的动态性特征,Zhang等进一步将增量学习方法和并行计算策略相结合,提出了一种云计算环境中粗糙近似集的并行增量求解算法[8]和不完备决策信息系统中并行增量计算近似集的算法[9]。钱进等通过引入信息系统中可辨识和不可辨识对象对的概念,设计了一种基于MapReduce计算框架的等价类并行求解算法,并提出了基于数据并行的知识约简算法[10]。通过分析基于正域、差别矩阵和信息熵的启发式知识约简中的可并行化操作,钱进等进一步利用MapReduce并行计算框架提出了一种新的知识约简算法[11]。Qian等讨论了不同粒度层次下分层决策表之间的关系,并分别提出了MapReduce并行计算环境下基于属性重要度和不可辨识矩阵的属性约简并行求解算法[12,13]。徐菲菲等针对大数据环境中数据的分布式存储架构,将近似约简概念引入到基于属性依赖度和基于互信息的区间值启发式约简方法中,并提出了基于多决策表的区间值全局近似约简方法,极大地降低了大数据分析的难度[14]。Li等进一步在多核集群计算环境中提出了优势粗糙集模型中近似集的并行计算方法[15]。Zhang等提出了复合关系粗糙集中基于GPU的近似集并行计算方法[16]。
  在粗糙集中构建增量学习的方法以有效地解决动态数据的维护问题得到了学者们的关注[17]。李天瑞等指出动态数据主要有三种更新方式,分别为:①数据对象的动态插入和删除;②属性特征的动态增加和移除;③数据取值的动态更新和修改,并给出了动态维护知识的系列方法[1]。Liang等研究了当对象集加入论域中信息熵的动态更新原理,进而给出了动态更新约简的算法[18]。Wang等分别研究了对象集增加和属性集增加时信息熵增量更新原理,进而给出了约简动态维护算法[19,20]。Shu等研究了不完备决策信息系统中当增加一个对象时约简的更新方法[21,22]。Yang等研究了当对象增加时模糊粗糙集、变精度粗糙集模型中约简的动态维护[23,24]。Sang等提出了基于局部粗糙集和动态粒度的原理动态维护决策粗糙集模型下属性约简的方法[25.27]。Raza等提出了在粗糙集中运用增量依赖类来更新属性约简[28]。Fan等提出了增加对象时规则的动态诱导算法[29]。
  从上述分析可以看出,寻找有效的途径来改善基于粒计算与粗糙集理论的知识获取模型及算法,使之可以更好地解决大数据环境中数据的体量大、动态性问题,已成为当前一项紧迫而又重要的课题。
  1.2 三支决策及其动态知识发现
  在大数据中,数据的时变性变大,信息的不确定性激增,有意义的精确描述与决策难度增加,非此即彼的二支决策对于不确定信息不能给出有效的决策。在管理科学、决策理论以及日常生活中,人们常常用到三支决策的方法而不是非此即彼的二支决策,如医疗诊断、论文及项目评审、风险评估、垃圾网页判断、分类聚类等领域。基于决策粗糙集模型,Yao提出了三支决策理论,并将三支决策推广为一般化理论[31,30]。在不同应用中,通过不同的准则对对象进行评价,确定其是否属于?接受、拒绝或延迟区域,从而给出不同的决策[32,33]。
  三支决策的理论一经提出就得到了众多学者的广泛关注,在三支决策应用和三支决策模型推广方面都取得了很多成果。Li等在决策粗糙集模型下将三支决策应用于风险决策中[33]。Savchenko等将序列三支决策理论和粒计算应用于物体识别[34]。Zhang等将三支决策方法应用于推荐算法[35]。Qi等研究了经典三支决策和概念格之间的联系[36]。Peters等提出了近似三支决策并应用于社会网络研究中[37]。Li等将三支决策应用于软件缺陷的检测[38]。Liang等在决策粗糙集中运用语言评价建立三支决策理论并应用于群决策[39]。Dutta等将三支决策应用于闭合供应链中的供应及反馈[40]。Chen等在邻域粗糙集的约简中考虑三支决策[41]。Yu等将三支决策理论应用于增量聚类[42]。Li等在不完备的形式背景的约简和近似概念构造中运用三支决策理论[43]。Hu等研究了三支决策中的三个基本要素:决策度量、决策条件和评价函数,并建立了多粒度下的三支决策空间和三支决策[44],进一步研究了三支决策空间的集成[45]。Deng等提出了模糊集下的决策三支近似集[46]。Zhao等提出了四种基于不同参数概率的模糊粗糙集模型和概率区间模糊粗糙集模型,并基于贝叶斯理论将三支决策理论应用于不同概率模糊粗糙集的参数确定[47]。Liang等探讨了如何从直觉模糊粗糙集中诱导三支决策的方法[48;49]。Li等提出通过不同粒度构建三支认知概念格的方法[50]。
  粗糙集理论是不确定信息分析的一种有效理论,它运用近似的原理,用确定的信息去描述不确定的概念。上、下近似算子是粗糙集理论的主要算子。基于上、下近似算子将论域划分为三个区域:正域、负域和边界域。姚一豫教授提出的三支决策理论,对粗糙集中的正域、负域和边界域的决策语义给出了合理解释:即从正域中诱导出接受规则,从负域中诱导出拒绝规则,而从边界域中诱导出延迟规则。这些规则集能有效地指导决策,即三支决策。随着数据的动态演化,构成信息系统的各个因素亦随之变化,即属性集变化、对象集变化和属性值变化,因而信息系统的粒度结构将发生变化,进而导致近似集发生变化。近似集的变化和信息系统中三个区域的变化,以及三支决策的变化是对应的。近似集的动态维护实际上是对三支决策的动态维护。近年来,近似集的动态维护得到了更多人们的重视,涌现出许多成果。
  Chen等分析了对象增加和属性值变化时粒度的变化对近似集的影响,并给出了高效更新近似集的方法[51]。Zhang等提出了邻域粗糙集模型中对象增加时近似集动态更新的方法[52],并利用云计算中的MapReduce技术,提出了对象集变化时动态更新经典粗糙集模型中近似集的并行算法[6]。Luo等讨论了在集值有序信息系统中近似集动态更新的增量方法[53]。Liu等在变精度粗糙集模型中定义了覆盖矩阵和精度矩阵,提出了随着对象迁入移出时获取感兴趣知识的增量算法[54]。Li等分析了属性变化时上边界和下边界的变化,提出了增加多个属性时近似集动态更?新的有效方法[55]。Cheng提出了在粗糙模糊集中当多个属性增加和删除时增量更新近似集的方法,有效地利用边界域增量更新近似集和利用截集近似集和粗糙模糊集近似集的关系来增量更新近似集[56]。在集值信息系统中,Zhang等提出了基于矩阵方法的近似集计算,并通过矩阵的增量更新完成近似集的动态维护[57]。Li等研究了优势关系粗糙集模型中泛化决策在属性动态变化时的更新原理,从而提出了基于优势关系矩阵的更新近似集方法[58]。Cui针对不完备信息系统中的非对称相似关系粗糙集,提出了基于上下边界的近似集更新原理和方法[59]。在集值序信息系统中,Luo等研究了属性集泛化时,基于矩阵的近似集快速更新算法[60]。Chen等研究了当属性值粗化细化时,粒度的动态变化,提出了经典粗糙集模型、不完备信息系统和优势关系粗糙集模型中动态更新近似集的方法[61.63]。王磊研究了信息系统中等价类和近似集的布尔矩阵表示和计算方法,提出了对象集、属性集和属性值分别动态变化时变精度粗糙集模型中上、下近似集的增量更新矩阵方法[64]。
  以上研究成果表明,针对数据动态变化情形,考虑不同粗糙集模型的特点,借助多粒度多层次学习的框架,构建不同的数据表示方法和增量学习策略,人们在不同粗糙集模型下近似集增量更新算法的研究工作中已取得了众多成果,但还有待于在实际应用中进一步验证和推广。同时,可以看出近似集动态维护为三支决策理论及应用发展提供了有力的支持。
  1.3 优势关系粗糙集及其知识发现
  在多属性多准则决策中属性值具有偏序关系,如信用评价、风险估计和可行性学习等决策问题[65.69]。经典粗糙集模型中对象之间的等价关系没有考虑属性值之间的偏序关系,因此Greco等提出了基于优势关系的粗糙集模型(Dominance-based Rough Set Approach,DRSA)以适应多属性多准则决策中的应用[69],并将其推广到模糊粗糙集中,提出了基于优势关系的模糊粗糙集[70]。近年来,优势关系粗糙集模型的扩展、应用和动态知识发现等方面的研究都得到了广泛的关注。
  Chakhar等将优势关系粗糙集模型应用于群决策中[65]。Inuiguchi等提出了变精度优势关系粗糙集模型[71]。Qian等研究了区间值信息系统和集值信息系统中的偏序关系,建立了这两种信息系统中基于偏序关系的粗糙集模型[72,73]。针对优势关系粗糙集模型中数据的缺失,Yang等定义了相似优势关系,随之给出了保持两种不同定义的相似优势关系的约简方法[74]。Yang等将偏序关系推广到区间值信息系统中,讨论了区间值系统中的三种数据丢失情况和数据补齐的方法,在此基础上进行规则的抽取[75]。Hu等提出了模糊优势关系粗糙集模型[76]。Kotlowski等研究了随机优势关系粗糙集模型[77]。Huang等在区间模糊信息系统中定义了梯度优势区间值关系,并研究了该模型下的两种约简方法[78]。骆公志和杨晓江定义?了不完备信息系统中的限制优势关系[79]。Zhang等通过直觉模糊加法算子定义了广义优势关系和广义优势粗糙集模型[27],并研究了该广义优势粗糙集模型下的启发式约简方法。Du等研究了条件准则具有偏序关系而决策类不仅是模糊而且具有偏序的有序模糊决策系统中优势关系粗糙集模型[26]。
  综上所述,人们在优势粗糙集模型及其知识发现方面的研究工作中已取得了一定的成果[80.82]。但在实际大数据环境中如何有效地应用优势关系粗糙集模型进行科学的三支决策是值得未来继续探讨的重要课题。
  1.4 本章小结
  大数据体量大、动态性强、不确定性和多源异构等特点使得传统数据挖掘技术从大数据中获取有价值知识面临着一系列的巨大挑战。粒计算是一种基于信息粒化的大规模复杂问题求解范式,粗糙集是不确定信息近似处理的一种重要粒计算模型,而三支决策是基于符合人类认知的一种决策模式。本章综述了当前大数据挖掘的研究现状,回顾了粒计算、粗糙集和三支决策理论发展动态,并系统分析、归纳了粒计算和粗糙集以及三支决策应用于海量、动态、复杂数据挖掘与分析的相关研究工作。?
  第2章 预备知识
  本章将介绍本书涉及的经典粗糙集模型、扩展粗糙集模型、属性约简以及粒度度量等基本概念。
  2.1 经典粗糙集模型
  知识的定义在认识论中依然是一个争论不止的问题。粗糙集理论的观点认为“知识就是一种对对象进行分类的能力”,也就是说,知识是与真实或抽象世界的不同分类模式密切相关的。为了便于理解本书的研究工作,在本节中简要介绍粗糙集理论的基本概念[83,84]。
  2.1.1 信息系统
  定义2.1.1 一个信息系统可以表示为S=(U;A;V;f)。其中:
  (1) 是一个非空有限对象集,称为论域。
  (2) 是一个非空有限属性集,C表示包含的所有条件属性组成的集合,称为条件属性集;D是决策属性集。
  (3) 是属性的值域集,Vai是属性ai的值域。
  (4) fa是属性ai的信息函数
  论域U中任何一个子集X*U,称为U的一个概念。空集也是一个概念,称为空概念。论域U中的任何子集族(概念族)称为关于U的抽象知识,简称知识。论域中的每一个概念(子集)是一个知识粒。
  例2.1.1 给出一套玩具积木的论域U={x1;x2;;x6},设这些积木有不同的颜色(红色、黄色和蓝色)、不同的形状(方形、圆形和三角形)以及不同的体积(大和小),具体信息见表2-1。
  根据颜色分类:红色={x1;x3};黄色={x5;x6};蓝色={x2;x4}。
  根据形状分类:方形={x2;x6};圆形={x1;x5};三角形={x3;x4}。
  根据体积分类:大={x2;x3;x5};小={x1;x4;x6}。
  这三种分类方法应用了三种知识。按照每种知识划分得到的等价类就是这种知识的知识粒。