Python商业数据挖掘 pdf下载

出版社清华大学出版社

出版年 2021-11

页数 390页

装帧精装

评分 8.5(豆瓣)

⏰ 限时特惠 00:00:00

活动结束后恢复原价

纸质书参考价 ¥23

电子版限时价 ¥5.99 省 18 元

选择版本

基础版

PDF文件

¥4

内容简介

本篇主要提供Python商业数据挖掘电子书的pdf版本下载，本电子书下载方式为百度网盘方式，点击以上按钮下单完成后即会通过邮件和网页的方式发货，有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

通过学习《Python商业数据挖掘(第6版)》，读者将掌握使用Python实现数据挖掘的各种方法，并深入理解在将这些方法应用于数据挖掘的过程中存在的商业问题和机遇。

内容简介

本书前5版好评如潮，作为第6版，本书首次使用了Python语言。本书除了介绍用于统计和机器学习等领域的预测、分类、可视化、降维、推荐系统、聚类、文本挖掘、网络分析等方法之外，内容还包括：

● 新加入的合著者Peter Gedeck拥有使用Python讲解商业分析课程的丰富经验以及将机器学习应用于新药发现过程的专业技能。在本书中，他十分乐于将这些经验和技能与读者分享。

● 讨论数据挖掘中的伦理问题。

● 根据教师和学生的反馈意见对内容做了更新。

● 通过多个案例展示数据挖掘技术的实际应用。

● 每章后面的习题有助于读者评估和加深对该章内容的理解。

● 在线支持网站提供了数据集、教学资料、习题答案、PPT教案和案例解决方案。

作者简介

Galit Shmueli博士自2004年以来，一直在美国马里兰大学、statistics.com统计网站、印度商学院设计并指导数据挖掘课程。Shmueli的研究领域包括信息系统的统计方法和数据挖掘，她以研究和擅长讲授商业分析而闻名，并发表了100多篇文章。

Peter C. Bruce是statistics.com统计网站的统计教育研究院的主席和创办人，他发表了多篇学术论文，还开发了Resampling Stats软件。

Peter Gedeck博士是Collabrative Drug Discovery公司的高级数据科学家，他为这家公司开发了一款基于云的软件来管理新药发现过程中用到的海量数据，他还在statistics.com统计网站上教授数据挖掘课程。

Nitin R. Patel博士是位于马萨诸塞州剑桥市的Cytel公司的共同创始人和董事，是美国统计协会会员，同时还是麻省理工学院和哈佛大学的客座教授。

前言/序言

前言

本书最早出版于2007年年初，已被众多学生、从业人员和任课老师采用，包括我本人，在过去15 年里，在线授课和面对面授课都以本书为重要参考书。本书的第1 版是基于Excel 加载项(加载程序是Analytic Solver Data Mining，早先的名称是XLMiner)的，此后不断推出JMP 版本、R 版本和现在的Python 版本，并推出了本书的合作站点——www.dataminingbook.com。

新推出的Python 版本使用了免费开源的Python 程序设计语言。本书提供了Python 程序的输出结果以及生成这些结果的代码，也包含相关程序包和函数的使用说明，其中的核心是scikit-learn 包。不同于计算机科学教材或统计学教材，本书的重点在于数据挖掘的基本概念以及如何用Python 实现相关算法。我们假设读者基本熟悉Python 语言。

对于新推出的Python 版本，增加了另一位共同作者——Peter Gedeck，他在商业领域里具有丰富的数据科学经验。除了提供Python 代码和输出结果外，本书也增加了最新内容和反馈意见。这些意见来自教授MBA 课程、MS 课程、本科生课程、文凭课程和经理人培训课程的老师及学生。最重要的是，本书首次引入了有关数据伦理的内容(详见2.9 节)。

本书还包含原书第3 版新增的如下内容：

● 社交网络分析

● 文本挖掘

● 集成方法

● 增益模型协同过滤

自第2 版开始(基于Analytic Solver)，以本书为教材的课程大量增加。最初，本书主要用于一学期的MBA 选修课，现在已被用在许多商业分析学位课的教学大纲里和证书课程的教学计划里。从本科生教学计划到研究生和经理人培训计划，这些项目里的课程、时间长短不一，深浅不同。在很多情形

下，本书可用在多门课程里。本书的设计思想是继续支持通用的“预测分析”或“数据挖掘”课程，但是也支持专用的商业分析教学大纲。

在专用的商业分析教学大纲中，以下课程曾使用本书。

● 预测分析——监督学习：在专用的商业分析项目里，对于预测分析主题，通常包括一系列课程。第一门课程包括本书的第Ⅰ部分至第Ⅳ部分内容。教授这门课程的老师通常根据课时适当地选择第Ⅳ部分的内容。在这类课程中，建议包括第13 章的集成学习和第Ⅶ部分的数据分析。

● 预测分析——无监督学习：本课程介绍数据探索和可视化、降维、挖掘关系和聚类(第Ⅲ部分和第Ⅴ部分)。如果这门课程也按照“预测分析——监督学习”课程的教学计划，那么有必要分析综合应用无监督学习和监督学习的例子和方法。

● 预测分析：专门用于时间序列预测的课程需要用到第Ⅵ部分的内容。

● 高级分析：本课程综合了全部的预测分析内容(包括监督学习和无监督学习)。这门课程的重点应放在第Ⅶ部分。这部分包含了社交网络分析和文本挖掘。有的老师也会在这类课程中选择第21 章中的案例。

在以上所有课程中，我们强烈建议增加课程设计项目，要求学生自己收集数据，或利用老师提供的数据(例如，现在有很多供数据挖掘使用的数据集)。根据我们和其他老师的经验，这些项目可让学生巩固所学的知识，并且能给学生提供一个机会，以便更好地理解数据挖掘的强大功能以及在挖掘过程中遇到的问题。

——Galit Shmueli、Peter C. Bruce、Peter Gedeck 和Nitin R. Patel

2019 年

查看全部↓

Python商业数据挖掘 pdf下载

选择版本

内容简介

产品特色

编辑推荐

内容简介

作者简介

目录

前言/序言

相关推荐

电池的计算机辅助工程

人人会建的大数据可视化大屏

新型数据库系统：原理、架构与实践

非线性系统的全局能控性