:智能数据挖掘面向不确定数据的频繁模式于晓梅,王红 pdf下载pdf下载

:智能数据挖掘面向不确定数据的频繁模式于晓梅,王红百度网盘pdf下载

作者:
简介:本篇提供书籍《:智能数据挖掘面向不确定数据的频繁模式于晓梅,王红》百度网盘pdf下载
出版社:万泽惠远图书专营店
出版时间:2018-07
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

基本信息

书名:智能数据挖掘 面向不确定数据的频繁模式

定价:49.00元

作者:于晓梅,王红

出版社:清华大学出版社

出版日期:2018-07-01

ISBN:9787302499855

字数:180000

页码:162

版次:1

装帧:平装

开本:16开

商品重量:0.4kg

编辑推荐


内容提要


本书全面总结了不确定数据环境下频繁模式挖掘领域的主要研究成果,从数据模型、问题定义、常用算法等方面系统介绍不确定频繁项集挖掘、不确定序列模式挖掘、不确定频繁子图模式挖掘、不确定高效用项集挖掘和不确定加权频繁项集挖掘技术。重点针对两类典型的不确定数据,即概率数据和容错数据,进行概率频繁模式挖掘和近似频繁模式挖掘的研究,并应用于传统中医药数据环境下,从主观不确定性和客观不确定性两个方面提出相应的解决方案,实现基于不确定数据的高效频繁模式挖掘,并通过实验验证了它们的有效性和实用性。
本书主要面向对数据挖掘和机器学习感兴趣的科研人员和学生,特别适合从事不确定数据挖掘、频繁模式挖掘和关联规则发现以及相关研究领域的广大科技工作者和研究人员使用,也可以作为数据挖掘和机器学习相关课程的教学参考书。

目录


作者介绍


文摘


《智能数据挖掘 面向不确定数据的频繁模式》:
  第5章基于粗糙集理论的近似频繁模式挖掘
  数据的不确定性通常分为两种情况: 主观原因引入的数据不确定性和客观原因导致的数据不确定性。对应的分别是概率数据和容错数据。前两章主要针对概率数据库进行不确定频繁项集挖掘方法的研究。重点介绍了基于支持度的双向排序策略,并将该策略嵌入两种基于概率频度的不确定频繁项集挖掘算法,分别用于概率数据库中实施概率频繁项集的挖掘和近似挖掘任务。本章研究面向容错数据的近似频繁模式挖掘方法。5.1节首先介绍容错数据库中的频繁模式挖掘理论以及粗糙集理论在容错数据挖掘中的应用,5.2节提出面向容错数据的近似频繁模式挖掘方法,5.3节介绍该方法在模拟数据集上的实验情况和在传统中医药数据集上的应用,5.4节对本章进行总结。
  5.1容错数据中的频繁模式挖掘理论〖1〗5.1.1容错数据模型实际应用中,许多源数据本身已经包含错误和不确定性,由于研究人员无法具体识别哪些数据是错误的,致使后续的分析处理操作只能在包含错误的数据中进行。在频繁模式挖掘领域,这样的数据被称为容错数据。容错数据通常使用二进制矩阵的形式来描述(如表5.1所示)。其中,1表示该事务中包含当前项目,而0则意味着当前项目并没有出现在指定事务中。这一项目值的缺失可能是由于噪声等不确定因素造成的,也可能该缺失值正是反映了实际应用的真实数据分布。
  目前,针对容错数据的频繁模式挖掘研究通常称为近似频繁模式挖掘或容错频繁模式挖掘。
  5.1.2容错数据的挑战
  数据挖掘的目的是发现数据中隐藏的新颖的具有实际应用价值的知识,然而,现有的/智能数据挖掘——面向不确定数据的频繁模式第5章基于粗糙集理论的近似频繁模式挖掘/传统挖掘算法在处理大量的不数据时存在着明显缺陷。庆幸的是,近似频繁模式挖掘方法为解决这一问题提供了新的思路。本章主要关注近似频繁模式挖掘方法用于处理容错数据时面临的挖掘效率低下,挖掘结果无法直接贡献于实际应用等问题。
  当前,现实应用中采集到的数据大多是不的,数据的不特征表现为不完整性、不一致性、不确定性等形式,这影响了挖掘效率的提高,损害了挖掘结果的可靠性及可用性。具体表现如下。
  1. 大数据量的影响
  几乎所有算法的运行效率在时间、空间占用上对数据量都是敏感的,同样,数据挖掘技术的实现效率与待处理的数据量也存在着密切关系。随着信息技术的迅猛发展,需要处理的数据量日益庞大,面对这一新的挑战,新兴技术不断涌现。例如,候选项消除算法使用启发式方法合并同一个等价类中的属性,获得可能的长频繁模式,然后在精简后的搜索空间执行挖掘任务,从而提高了挖掘效率。
  

序言