精通数据科学算法戴维·纳蒂加(DavidNatingg pdf下载pdf下载

精通数据科学算法戴维·纳蒂加(DavidNatingg百度网盘pdf下载

作者:
简介:本篇提供书籍《精通数据科学算法戴维·纳蒂加(DavidNatingg》百度网盘pdf下载
出版社:辽海出版社图书专营店
出版时间:2019-05
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

   图书基本信息
图书名称   精通数据科学算法(异步图书出品)
作者   [英]戴维·纳蒂加(DavidNatingga),封强,赵运
定价   59元
出版社   人民邮电出版社
ISBN   9787115498168
出版日期   2019-05-01
字数   
页码   164
版次   
装帧   平装
开本   16开
商品重量   

   内容提要
数据科学(Data Science)是从数据中提取知识的技术,是一门有关机器学习、统计学与数据挖掘的交叉学科。数据科学包含了多种领域的不同元素,包括信号处理、数学、概率模型技术和理论、计算机编程、统计学等。n
本书讲解了7种重要的数据分析方法,它们分别是k 近邻算法、朴素贝叶斯算法、决策树、森林、k-means聚类、回归分析以及时间序列分析。全书共7章,每一章都以一个简单的例子开始,先讲解算法的基本概念与知识,然后通过对案例进行扩展以讲解一些特殊的分析算法。这种方式有益于读者深刻理解算法。n
本书适合数据分析人员、机器学习领域的从业人员以及对算法感兴趣的读者阅读。

   目录
第 1 章 用k 近邻算法解决分类问题n
1.1 Mary对温度的感觉n
1.2 实现k 近邻算法n
1.3 意大利地区的示例——选择k值n
1.4 房屋所有权——数据转换n
1.5 文本分类——使用非欧几里德距离n
1.6 文本分类——更高维度的k-NNn
1.7 小结n
1.8 习题n
第 2 章 朴素贝叶斯n
2.1 医疗检查——贝叶斯定理的基本应用n
2.2 贝叶斯定理的证明及其扩展n
2.3 西洋棋游戏——独立事件n
2.4 朴素贝叶斯分类器的实现n
2.5 西洋棋游戏——相关事件n
2.6 性别分类——基于连续变量的贝叶斯定理n
2.7 小结n
2.8 习题n
第 3 章 决策树n
3.1 游泳偏好——用决策树表示数据n
3.2 信息论 044n
3.3 ID3算法——构造决策树 047n
3.4 用决策树进行分类 054n
3.5 小结 060n
3.6 习题 060n
第 4 章 森林 064n
4.1 森林算法概述 064n
4.2 游泳偏好——森林分析法 065n
4.3 森林算法的实现 071n
4.4 下棋实例 075n
4.5 购物分析——克服数据的不一致性以及n
度量置信水平 082n
4.6 小结 084n
4.7 习题 084n
第 5 章 k-means聚类 089n
5.1 家庭收入——聚类为k个簇 089n
5.2 性别分类——聚类分类 092n
5.3 k-means聚类算法的实现 095n
5.4 房产所有权示例——选择簇的数量 099n
5.5 小结 105n
5.6 习题 105n
第 6 章 回归分析 114n
6.1 华氏温度和摄氏温度的转换——基于完整数据的线性回归 114n
6.2 根据身高预测体重——基于实际数据的线性回归 117n
6.3 梯度下降算法及实现 118n
6.4 根据距离预测飞行时长 122n
6.5 弹道飞行分析——非线性模型 123n
6.6 小 结 125n
6.7 习 题 125n
第 7 章 时间序列分析 130n
7.1 商业利润——趋势分析 130n
7.2 电子商店的销售额——季节性分析 132n
7.3 小 结 140n
7.4 习 题 140n
附录 A 统计 145n
A.1 基本概念 145n
A.2 贝叶斯推理 146n
A.3 分 布 146n
A.4 交叉验证 147n
A.5 A/B 测 试 148n
附录 B R参考 149n
B.1 介 绍 149n
B.2 数据类型 150n
B.3 线性回归 152n
附录 C Python参考 154n
C.1 介 绍 154n
C.2 数据类型 155n
C.3 控 制 流 159n
附录 D 数据科学中的算法和方语 163

   作者介绍
Dávid Natingga于2014年毕业于伦敦帝国理工学院的计算与人工智能专业,并获工程硕士学位。2011年,他在印度班加罗尔的Infosys实验室工作,研究机器学习算法的优化。2012~2013年,他在美国帕罗奥图的Palantir技术公司从事大数据算法的开发工作。2014年,作为英国伦敦Pact Coffee公司的数据科学家,他设计了一种基于顾客口味偏好和咖啡结构的推荐算法。2017年,他在荷兰阿姆斯特丹的TomTom工作,处理导航平台的地图数据。n
他是英国利兹大学计算理论专业的博士研究生,研究纯数学如何推进人工智能。2016年,他在日本高等科学技术学院当了8个月的访问学者。

   编辑推荐
机器学习的应用是高度自度化且自动修正的。学习到的数据越多,机器学习应用需要的人工干预越少。为了解决现实世界中复杂的数据问题,科学家们开发出专门的机器学习算法来解决这些问题。数据科学正是通过算法和统计分析来帮助读者从现有数据中获取新知识的。 n

本书将解决如何高效地进行数据分类及预测的问题。本书主要讲解7种数据科学算法,有k 近邻算法、朴素贝叶斯算法、决策树、森林,k-means聚类、回归分析和时间序列分析。 此外,你还会掌握如何对数据进行预聚类,以便针对大型数据集进行优化和分类。 后,你将了解如何根据数据集中的现有趋势来预测数据。本书的各章还有配套的练习题,以帮助你夯实内容,扩展相关知识。n

读完本书后,你将了解如何选择机器学习算法进行聚类、分类或回归,并知道选择哪种算法来解决实际问题。 n
n

本书主要包括以下内容: n
如何使用朴素贝叶斯、决策树和森林进行分类并准确地解决复杂问题; n
正确识别数据科学问题并使用回归分析和时间序列分析设计合适的预测解决方案;n
如何使用 k-means算法对数据进行聚类;n
如何使用Python和R语言有效地实现算法。