本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
(1)内容全面、案例丰富,对各种在线学习算法的背景、相关工作、模型定义、算法设计思想、以及实验方案与结果分析等,都有完整的阐述。
(2)聚焦大数据分析核心问题,详细介绍与分析了多种典型的在线学习模型与算法,采用的实验平台开源、简单易用。每章后面都设计了可操作性的课程实验,并在图书的附录部分提供课程实验参考报告和其他教学与科研资料。
《数据流挖掘与在线学习算法》是一本关于数据流挖掘与在线学习算法的著作,该书全面、系统阐述了数据流机器学习的模型、算法、平台与实例。
《数据流挖掘与在线学习算法》共10章,分为4个部分:第1部分包括首章-第3章,介绍数据流机器学习基础知识;第2部分(第4-6章)介绍基于频繁模式的数据挖掘与在线学习算法:第3部分是基于模型的在线学习算法,包括第7章在线稀疏学习模型和第8章在线低秩表示模型;第4部分(第9、10章)介绍基于实例的数据流概念演变检测和在线学习算法。对每种典型在线学习算法的背景、模型定义、算法设计思想以及相关实验分析等,书中都有都完整的阐述。同时,也详细分析了一些与在线学习密切相关的离线数据挖掘和机器学习算法与应用。
《数据流挖掘与在线学习算法》的实验平台开源、简单易用。每章后面都设计了操作性强的课程实验。在图书“下载专区”目录下,免费提供了《数据流挖掘与在线学习算法》代码和相关教学配套资源的在线浏览与下载。
《数据流挖掘与在线学习算法》适合作为高等学校数据科学与大数据应用、智能科学与技术、人工智能等专业本科生和研究生的教材与教学参考书,也可供研究数据流挖掘与在线学习算法的科技人员阅读和使用。
李志杰,男,博士,副教授,硕士研究生导师,中国通信学会高级会员。主要研究方向为大数据在线学习,主持湖南省自然科学基金面上项目 1项;作为第1作者在《计算机研究与发展》、《计算机科学与探索》、ICDM、IJCNN等国内外期刊和学术会议发表论文10多篇,EI收录7篇。主讲《大数据基础》、《大数据实时分析》、《离线大数据分析》等课程;主持湖南省普通高校教学改革项目 1 项,湖南理工学院教研教改项目 1 项。兼任中国通信学会第一届云计算与大数据应用委员会委员、《计算机学报》学术刊物审稿人。
流数据是大数据的重要来源,在线学习算法作为一种增量式的机器学习技术,是数据流挖掘的有效工具。早期的统计机器学习算法批量训练整个数据集,显然不能适应流数据的动态学习场景。在线学习范式的出现,给大数据时代的机器学习带来了深刻的影响。统计机器学习算法的“增量化”,大体上有基于模型的在线学习、基于频繁模式的在线学习和基于实例的在线学习等方式。基于模型的在线学习包括在线稀疏学习模型(第7章)、在线低秩表示模型(第8章)等。基于模式的机器学习算法包括批量挖掘频繁模式算法(第4章和第5章)、批次更新的流模式挖掘算法(第6章)等。基于实例的在线学习算法包括基于实例块的概念演变检测(第9章)、自适应存储K近邻算法(第10章)等。书中归纳总结了在线学习模型与算法基础知识,完整阐述了每种典型在线学习算法的背景、模型定义、算法设计思想、相关实验分析等。从这个意义上说,本书是一部数据流挖掘与在线学习算法的专著。
细心的读者可以看到,图书内容为教学做了精心安排。使用机器学习对数据进行分析,目前已成为计算机学科的基础内容。近几年全国众多各层次高校陆续开设了数据科学与大数据应用、人工智能、智能科学与技术等新工科专业,还有不少高校在软件工程、计算机科学与技术等专业里增设了机器学习、数据挖掘等数据分析类课程。笔者自2016年承担了“大数据基础”“大数据实时分析”“离线大数据分析”三门课程的主讲教学任务,迄今已为四届本科学生完整上完这三门大数据分析类课程。教学实践中,深切体会到选用合适的新工科课程教材的艰难与重要。促使笔者自己动手写一本教科书的主因是2022年下学期的学生只开设一门“大数据分析技术”课程,原来分开三门课程尚且难以选到勉强适用的教材(主要是英文的),踌躇后决定融合三门课程的科研与教学实践经验,以笔者自己的视角来展现大数据分析技术,唯望抛砖引玉,为初学者略尽绵薄之力。