书籍详情
《数据流挖掘与在线学习算法》[47M]百度网盘|亲测有效|pdf下载
  • 数据流挖掘与在线学习算法

  • 出版社:中国电力出版社京东自营官方旗舰店
  • 出版时间:2022-09
  • 热度:10847
  • 上架时间:2024-06-30 09:38:03
  • 价格:0.0
书籍下载
书籍预览
免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

编辑推荐

(1)内容全面、案例丰富,对各种在线学习算法的背景、相关工作、模型定义、算法设计思想、以及实验方案与结果分析等,都有完整的阐述。
(2)聚焦大数据分析核心问题,详细介绍与分析了多种典型的在线学习模型与算法,采用的实验平台开源、简单易用。每章后面都设计了可操作性的课程实验,并在图书的附录部分提供课程实验参考报告和其他教学与科研资料。

内容简介

  《数据流挖掘与在线学习算法》是一本关于数据流挖掘与在线学习算法的著作,该书全面、系统阐述了数据流机器学习的模型、算法、平台与实例。
  《数据流挖掘与在线学习算法》共10章,分为4个部分:第1部分包括首章-第3章,介绍数据流机器学习基础知识;第2部分(第4-6章)介绍基于频繁模式的数据挖掘与在线学习算法:第3部分是基于模型的在线学习算法,包括第7章在线稀疏学习模型和第8章在线低秩表示模型;第4部分(第9、10章)介绍基于实例的数据流概念演变检测和在线学习算法。对每种典型在线学习算法的背景、模型定义、算法设计思想以及相关实验分析等,书中都有都完整的阐述。同时,也详细分析了一些与在线学习密切相关的离线数据挖掘和机器学习算法与应用。
  《数据流挖掘与在线学习算法》的实验平台开源、简单易用。每章后面都设计了操作性强的课程实验。在图书“下载专区”目录下,免费提供了《数据流挖掘与在线学习算法》代码和相关教学配套资源的在线浏览与下载。
  《数据流挖掘与在线学习算法》适合作为高等学校数据科学与大数据应用、智能科学与技术、人工智能等专业本科生和研究生的教材与教学参考书,也可供研究数据流挖掘与在线学习算法的科技人员阅读和使用。

作者简介

李志杰,男,博士,副教授,硕士研究生导师,中国通信学会高级会员。主要研究方向为大数据在线学习,主持湖南省自然科学基金面上项目 1项;作为第1作者在《计算机研究与发展》、《计算机科学与探索》、ICDM、IJCNN等国内外期刊和学术会议发表论文10多篇,EI收录7篇。主讲《大数据基础》、《大数据实时分析》、《离线大数据分析》等课程;主持湖南省普通高校教学改革项目 1 项,湖南理工学院教研教改项目 1 项。兼任中国通信学会第一届云计算与大数据应用委员会委员、《计算机学报》学术刊物审稿人。

内页插图

目录

前言

第1章 数据流机器学习
1.1 大数据的两种计算模式
1.1.1 大数据离线分析
1.1.2 批量处理方法
1.1.3 大数据实时分析
1.1.4 在线学习方法
1.2 离线分析平台Wreka
1.2.1 数据挖掘和机器学习
1.2.2 图形用户界面
1.2.3 ARFF格式与示例数据集
1.2.4 预处理过滤器
1.2.5 属性选择
1.2.6 可视化
1.3 数据流挖掘
1.3.1 数据流挖掘循环过程
1.3.2 分类器评估
1.3.3 分类方法
1.3.4 回归
1.3.5 聚类
1.3.6 频繁模式挖掘
1.4 数据流变化处理方法
1.4.1 数据流分布统计测试
1.4.2 概念漂移数据流产生
1.4.3 漂移评估与探测
1.4.4 自适应滑动窗口
1.4.5 数据流特征高维问题
1.4.6 噪音数据流处理
1.5 大规模在线分析平台MOA
1.5.1 图形用户界面
1.5.2 命令行操作
1.5.3 数据源和数据流生成器
课程实验1 实验平台安装与操作
1.6.1 实验目的
1.6.2 实验环境
1.6.3 安装平台
1.6.4 平台操作
参考文献

第2章 MOA平台机器学习实例
2.1 MOA分类
2.1.1 MOA分类器
2.1.2 朴素贝叶斯增量分类器
2.1.3 Hoeffding自适应窗口树
2.1.4 MOA分类实战操作
2.2 集成分类实例
2.2.1 装袋算法
2.2.2 提升算法
2.2.3 随机森林算法
2.2.4 MOA集成实战操作
2.3 MOA聚类
2.3.1 MOA聚类设置
2.3.2 DBSCAN密度聚类
2.3.3 Den-Stream数据流聚类
2.3.4 MOA聚类实战操作
2.4 频繁闭合项集挖掘算法
2.4.1 MOA扩展包
2.4.2 MOA加载配置IncMine扩展包
2.4.3 Java调用IncMine对象和选项
2.4.4 Eclipse环境下开发IncMine代码
课程实验2数据分类
……

第3章 数据流在线学习模型与典型算法
第4章 离线挖掘频繁闭合项集
第5章 频繁子序列与基因表达数据双向聚类
第6章 数据流显露模式与贝叶斯分类
第7章 在线特征稀疏学习
第8章 低秩表示在线学习
第9章 可变数据流重复类与新类检测
第10章 KNN自适应存储处理异质概念漂移

前言/序言

  流数据是大数据的重要来源,在线学习算法作为一种增量式的机器学习技术,是数据流挖掘的有效工具。早期的统计机器学习算法批量训练整个数据集,显然不能适应流数据的动态学习场景。在线学习范式的出现,给大数据时代的机器学习带来了深刻的影响。统计机器学习算法的“增量化”,大体上有基于模型的在线学习、基于频繁模式的在线学习和基于实例的在线学习等方式。基于模型的在线学习包括在线稀疏学习模型(第7章)、在线低秩表示模型(第8章)等。基于模式的机器学习算法包括批量挖掘频繁模式算法(第4章和第5章)、批次更新的流模式挖掘算法(第6章)等。基于实例的在线学习算法包括基于实例块的概念演变检测(第9章)、自适应存储K近邻算法(第10章)等。书中归纳总结了在线学习模型与算法基础知识,完整阐述了每种典型在线学习算法的背景、模型定义、算法设计思想、相关实验分析等。从这个意义上说,本书是一部数据流挖掘与在线学习算法的专著。
  细心的读者可以看到,图书内容为教学做了精心安排。使用机器学习对数据进行分析,目前已成为计算机学科的基础内容。近几年全国众多各层次高校陆续开设了数据科学与大数据应用、人工智能、智能科学与技术等新工科专业,还有不少高校在软件工程、计算机科学与技术等专业里增设了机器学习、数据挖掘等数据分析类课程。笔者自2016年承担了“大数据基础”“大数据实时分析”“离线大数据分析”三门课程的主讲教学任务,迄今已为四届本科学生完整上完这三门大数据分析类课程。教学实践中,深切体会到选用合适的新工科课程教材的艰难与重要。促使笔者自己动手写一本教科书的主因是2022年下学期的学生只开设一门“大数据分析技术”课程,原来分开三门课程尚且难以选到勉强适用的教材(主要是英文的),踌躇后决定融合三门课程的科研与教学实践经验,以笔者自己的视角来展现大数据分析技术,唯望抛砖引玉,为初学者略尽绵薄之力。