本篇主要提供数据科学概念与实践维贾伊·库图,巴电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
基本信息
书名:数据科学概念与实践(原书第2版)
定价:119元
作者:[美]维贾伊·库图(VijayKotu),巴拉·德斯潘德(Ba
出版社:机械工业出版社
出版日期:2020-09-01
ISBN:9787111663041
字数:
页码:372
版次:2
装帧:平装
开本:16开
商品重量:
编辑推荐
内容提要
数据科学已经成为从数据中提取价值的基本工具,任何企业都可以将数据收集、存储和处理作为其业务的一部分。本书搭建了一个易于理解的概念框架,帮助读者掌握数据科学的基础知识,并在学习理论的过程中同步使用RapidMiner平台进行实践。书中将分享实用的数据分析方法,讨论如何揭示隐藏的模式和关系,无论你是新手还是专家,都能借助这些方法做出更好的决策和预测。本书非常适合商务用户、数据分析师、商务分析师、工程师和分析专家以及任何与数据打交道的人。
目录
赞誉 n
译者序 n
序言 n
前言 n
致谢 n
作者简介 n
章 简介 1 n
1.1 AI、机器学习和数据科学 2 n
1.2 什么是数据科学 3 n
1.2.1 提取有意义的模式 3 n
1.2.2 构建表示模型 3 n
1.2.3 统计、机器学习和计算的结合 4 n
1.2.4 学习算法 4 n
1.2.5 相关领域 4 n
1.3 数据科学的案例 5 n
1.3.1 体量 5 n
1.3.2 维度 5 n
1.3.3 复杂问题 6 n
1.4 数据科学的分类 6 n
1.5 数据科学的算法 7 n
1.6 本书路线图 8 n
1.6.1 数据科学入门 8 n
1.6.2 练习使用RapidMiner 8 n
1.6.3 核心算法 9 n
参考文献 11 n
第2章 数据科学过程 12 n
2.1 先验知识 13 n
2.1.1 目标 13 n
2.1.2 主题范围 14 n
2.1.3 数据 14 n
2.1.4 因果关系与相关性 15 n
2.2 数据准备 15 n
2.2.1 数据探索 15 n
2.2.2 数据质量 16 n
2.2.3 缺失值 16 n
2.2.4 数据类型和转换 16 n
2.2.5 转换 17 n
2.2.6 异常值 17 n
2.2.7 特征选择 17 n
2.2.8 数据采样 17 n
2.3 建模 18 n
2.3.1 训练数据集和测试数据集 18 n
2.3.2 学习算法 19 n
2.3.3 模型评估 20 n
2.3.4 集成模型 20 n
2.4 应用 21 n
2.4.1 生产准备 21 n
2.4.2 技术整合 21 n
2.4.3 响应时间 21 n
2.4.4 模型刷新 22 n
2.4.5 同化 22 n
2.5 知识 22 n
参考文献 23 n
第3章 数据探索 24 n
3.1 数据探索的目标 24 n
3.2 数据集 25 n
3.3 描述性统计 26 n
3.3.1 单变量探索 27 n
3.3.2 多变量探索 28 n
3.4 数据可视化 30 n
3.4.1 单变量的可视化 31 n
3.4.2 多变量的可视化 34 n
3.4.3 可视化高维数据 38 n
3.5 数据探索的路线图 40 n
参考文献 41 n
第4章 分类 42 n
4.1 决策树 42 n
4.1.1 工作原理 42 n
4.1.2 实现过程 47 n
4.1.3 小结 55 n
4.2 规则归纳 56 n
4.2.1 工作原理 58 n
4.2.2 实现过程 60 n
4.2.3 小结 63 n
4.3 k-NN(k-近邻) 63 n
4.3.1 工作原理 64 n
4.3.2 实现过程 69 n
4.3.3 小结 71 n
4.4 朴素贝叶斯 71 n
4.4.1 工作原理 72 n
4.4.2 实现过程 77 n
4.4.3 小结 79 n
4.5 人工神经网络 80 n
4.5.1 工作原理 82 n
4.5.2 实现过程 84 n
4.5.3 小结 86 n
4.6 支持向量机 87 n
4.6.1 工作原理 89 n
4.6.2 实现过程 91 n
4.6.3 小结 95 n
4.7 集成学习 95 n
4.7.1 工作原理 97 n
4.7.2 实现过程 98 n
4.7.3 小结 105 n
参考文献 105 n
第5章 回归方法 107 n
5.1 线性回归 107 n
5.1.1 工作原理 108 n
5.1.2 实现过程 112 n
5.1.3 检查点 117 n
5.2 逻辑回归 120 n
5.2.1 工作原理 122 n
5.2.2 实现过程 124 n
5.2.3 总结要点 127 n
5.3 总结 127 n
参考文献 127 n
第6章 关联分析 128 n
6.1 挖掘关联规则 129 n
6.1.1 项集 130 n
6.1.2 规则生成 132 n
6.2 Apriori算法 133 n
6.3 频繁模式增长算法 136 n
6.3.1 工作原理 136 n
6.3.2 实现过程 138 n
6.4 总结 141 n
参考文献 141 n
第7章 聚类 142 n
7.1 k-means聚类 145 n
7.1.1 工作原理 147 n
7.1.2 实现过程 149 n
7.2 DBSCAN聚类 153 n
7.2.1 工作原理 153 n
7.2.2 实现过程 155 n
7.3 自组织映射 158 n
7.3.1 工作原理 159 n
7.3.2 实现过程 161 n
参考文献 166 n
第8章 模型评估 168 n
8.1 混淆矩阵 169 n
8.2 ROC和AUC 170 n
8.3 提升曲线 172 n
8.4 实现过程 174 n
8.5 总结 177 n
参考文献 178 n
第9章 文本挖掘 179 n
9.1 工作原理 180 n
9.1.1 词频–逆文档频率 180 n
9.1.2 词语 181 n
9.2 实现过程 184 n
9.2.1 实现1:关键词聚类 184 n
9.2.2 实现2:预测博客作者的性别 187 n
9.3 总结 193 n
参考文献 194 n
0章 深度学习 195 n
10.1 AI冬天 197 n
10.1.1 AI冬天:20世纪70年代 197 n
10.1.2 冬季解冻:20世纪80年代 198 n
10.1.3 人工智能的春夏:2006年至今 200 n
10.2 工作原理 201 n
10.2.1 神经网络的回归模型 201 n
10.2.2 梯度下降法 202 n
10.2.3 需要反向传播 204 n
10.2.4 分类超过2个:softmax 205 n
10.2.5 卷积神经网络 207 n
10.2.6 密集层 211 n
10.2.7 失活层 211 n
10.2.8 循环神经网络 212 n
10.2.9 自动编码器 213 n
10.2.10 相关AI模型 213 n
10.3 实现过程 214 n
10.4 总结 217 n
参考文献 218 n
1章 推荐引擎 219 n
11.1 推荐引擎的概念 221 n
11.2 协同过滤 225 n
11.2.1 基于邻域的方法 226 n
11.2.2 矩阵分解 233 n
11.3 基于内容的过滤 238 n
11.3.1 用户画像的计算 239 n
11.3.2 有监督学习方法 245 n
11.4 混合推荐器 249 n
11.5 总结 250 n
参考文献 251 n
2章 时间序列预测 253 n
12.1 时间序列分解 256 n
12.1.1 经典分解 258 n
12.1.2 实现过程 258 n
12.2 基于平滑的方法 260 n
12.2.1 简单预测方法 260 n
12.2.2 指数平滑 261 n
12.2.3 实现过程 263 n
12.3 基于回归的方法 264 n
12.3.1 回归 265 n
12.3.2 周期性回归 266 n
12.3.3 集成移动平均自回归模型 268 n
12.3.4 周期性ARIMA 272 n
12.4 机器学习方法 274 n
12.4.1 窗口化 275 n
12.4.2 神经网络自回归 280 n
12.
作者介绍
序言