机器学习与人工智能：从理论到实践 pdf下载

出版社机械工业出版社自营官方旗舰店

出版年 2021-08

页数 390页

装帧精装

评分 9.0(豆瓣)

⏰ 限时特惠 00:00:00

活动结束后恢复原价

纸质书参考价 ¥23

电子版限时价 ¥5.99 省 18 元

选择版本

基础版

PDF文件

¥4

内容简介

本篇主要提供机器学习与人工智能：从理论到实践电子书的pdf版本下载，本电子书下载方式为百度网盘方式，点击以上按钮下单完成后即会通过邮件和网页的方式发货，有问题请联系邮箱ebook666@outlook.com

产品特色

编辑推荐

本书全面介绍了人工智能（AI）和机器学习（ML）的理论和应用。与仅从理论或仅从实践的角度介绍这个领域的图书不同，本书是将这两个视角结合起来，给予读者整体的理解。其特色为：

l 全面介绍了人工智能和机器学习技术的理论和应用。

l 为人工智能和机器学习提供了直观、易懂的学习指南，较少使用数学。

l 结合应用介绍所有机器学习和人工智能技术及实现。

本书适合机器学习与人工智能相关专业的学生以及具有专业背景的该领域的新手和从业人员阅读。书中尽可能少地使用数学，这使得主题更直观、更容易理解。

内容简介

本书理论与实践相结合，全面介绍人工智能（AI）和机器学习（ML）。全书分为六部分。第一部分介绍人工智能和机器学习在现代背景下的概念以及它们的起源和现状，并讨论了使用这些概念的各种场景和数据的理解、表示与可视化。第二部分介绍机器学习的各种方法及新兴趋势。第三部分介绍使用算法构建端到端机器学习管道。第四部分重点介绍机器学习模型的实现，以开发人工智能应用。第五部分介绍解决现实机器学习问题的一些实现策略。第六部分是本书总结和下一步工作。

作者简介

　　Ameet V.Joshi，博士，目前是微软的一名数据科学经理。他于2006年在密歇根州立大学获得博士学位。他拥有超过15年的机器学习算法开发方面的经验，涉及各种不同的工业领域，包括管道检查、家庭能源分解、微软Cortana智能和CRM中的商务智能。此前，他曾担任Belkin International的机器学习专家和Microline Technology Corp．的研究主管。他是多个技术委员会的成员，在许多会议和期刊上发表过文章，也是多本书籍的编著者之一。他还拥有两项专利，并获得多个行业奖项，包括IEEE高级会员（只有8%的会员获得）。

内页插图

精彩书评

　　★“这是一本可能值得反复阅读的书。当读者看到本书中所描述的技术在现实世界中的应用时，他们很可能会想重温本书的各个章节，以更新他们的理解，或者深入探究某个领域。我认为这就是非常值得拥有的书籍。即使作为一名业内资深人士，我也喜欢阅读这本书，并会随身携带一本。”
　　——Vij Rajarajan微软公司总经理
　　
　　★“本书对在许多实时应用中实践机器学习所需了解的数学工具提供了一个透彻的描述……”
　　——Sitharama lyengar佛罗里达国际大学杰出教授
　　
　　★“本书在理论与实践方面取得了良好的平衡，有效结合了机器学习与人工智能的各个主题。与其他关于人工智能的书籍不同，本书并没有完全从数学的角度讲述，这使得它更容易阅读。总的来说，本书比较容易理解，每章都有独立的引言和总结部分，并使用了许多有用的图来阐释相关概念。”
　　——Computing Reviews

序
前言
致谢

第一部分简介
第1章人工智能和机器学习简介
1．1 引言
1．2 什么是人工智能
1．3 什么是机器学习
1．4 本书的结构
1．4．1 简介
1．4．2 机器学习
1．4．3 构建端到端管道
1．4．4 人工智能
1．4．5 实现
1．4．6 结语
第2章人工智能和机器学习的基本概念
2．1 引言
2．2 大数据和非大数据
2．2．1 什么是大数据
2．2．2 为什么我们应该区别对待大数据
2．3 学习类型
2．3．1 监督学习
2．3．2 无监督学习
2．3．3 强化学习
2．4 基于时间的机器学习方法
2．4．1 静态学习
2．4．2 动态学习
2．5 维数
2．6 线性和非线性
2．7 奥卡姆剃刀原理
2．8 “没有免费的午餐”定理
2．9 收益递减规律
2．10 机器学习的早期趋势
2．11 小结
第3章数据的理解、表示和可视化
3．1 引言
3．2 理解数据
3．2．1 理解实体
3．2．2 理解属性
3．2．3 理解数据类型
3．3 数据的表示和可视化
3．3．1 主成分分析
3．3．2 线性判别分析
3．4 小结

第二部分机器学习
第4章线性方法
4．1 引言
4．2 线性模型和广义线性模型
4．3 线性回归
4．3．1 定义问题
4．3．2 解决问题
4．4 正则化的线性回归
4．4．1 正则化
4．4．2 岭回归
4．4．3 Lasso回归
4．5 广义线性模型
4．6 k最近邻算法
4．6．1 KNN的定义
4．6．2 分类和回归
4．6．3 KNN的其他变体
4．7 小结
第5章感知器和神经网络
5．1 引言
5．2 感知器
5．3 多层感知器或人工神经网络
5．3．1 前馈操作
5．3．2 非线性多层感知器或非线性人工神经网络
5．3．3 训练多层感知器
5．3．4 隐藏层
5．4 径向基函数网络
5．5 过度拟合与正则化
5．5．1 L1和L2正则化
5．5．2 丢弃正则化
5．6 小结
第6章决策树
6．1 引言
6．2 为什么使用决策树
6．3 构建决策树的算法
6．4 回归树
6．5 分类树
6．6 决策指标
6．6．1 误分类误差
6．6．2 基尼指数
6．6．3 交叉熵或偏差
6．7 卡方自动交叉检验
6．8 训练决策树
6．9 集成决策树
6．10 Bagging集成树
6．11 随机森林
6．12 Boosted集成树
6．12．1 AdaBoost
6．12．2 梯度提升
6．13小结
……

第三部分构建端到端管道
第四部分人工智能
第五部分实现
第六部分结语

参考文献

查看全部↓

前言/序言

大约35年前，我第一次接触到计算机。那时正是“微型计算机”一词被“个人计算机”（Personal Computer，PC）一词取代的时候。在5年的时间里，发生了这样一个重大变革：计算机作为一个超级专业化的领域，全世界只有几千人在凉爽干净的房间里使用这些神奇的机器工作，突然间数亿人可以很容易地接触到这些机器。每个人都意识到，计算机将影响商业的方方面面，并最终影响个人生活。随之而来的是学习计算机的热潮，有人在学习关于计算机是什么的基础知识，还有人在学习如何使用诸如文字处理或电子表格等应用程序，而世界各地的工程师则在学习计算机体系结构以及编程、算法和数据结构。如果你学习的这些技能没能达到一定水平，那么将对你的职业发展造成非常不利的影响—不管你的职业是什么。

大约到1995年，个人计算机已经发展得十分强大，通过客户机–服务器体系结构接管商业计算，大多数人在工作和家庭中都拥有了自己的个人计算机。然后，Internet、Web、马赛克、Netscape、浏览器、Webserver、HTML和HTTP等术语突然席卷了计算机领域。这一巨变完全重塑了数据和信息的民主化过程，其规模比人类历史上任何事物都要大几个数量级。互联网促成了智能手机的诞生，而智能手机反过来又成倍地扩大了互联网的规模和覆盖范围。计算架构，尤其是围绕数据表示、存储和分布式的架构，经历了一场巨大的变革。随之而来的是学习“互联网”的热潮—各个年龄段的人都在学习互联网的基础知识，如何使用浏览器，以及如何通过电子方式与人们交流，以将内容创作为Web消耗品（电子邮件、网页、网站、博客、帖子、微博等）。工程师们蜂拥而至，学习互联网体系结构、Web和移动应用程序开发、分布式数据架构等。如果没有学习这方面的知识，那么你不仅在职业上处于严重的不利地位，在社会上也可能处于不利地位。

再快进15年。互联网和移动技术的进步带来了数据创建和聚合的爆炸性增长。数据的大规模聚合和随之而来的几乎无限的计算能力演变成在物理上是分布式的，但在逻辑上却是统一的。这就是“云”。组织和理解这种规模的数据不仅超出了人类的能力，甚至超出了传统算法的能力。传统的算法甚至无法扩展到对海量数据进行“搜索”，更不用说理解它了。然而，如此庞大的数据的便捷可用性，最终使计算机通过理解数据从“处理信息”到实际“创造智能”的长期梦想成为可能。拥有数十年历史的机器学习和人工智能重新焕发了活力，并通过轻松访问云中的大量数据和计算而取得了跨越式的进展。因此，我们现在正式处于“人工智能”时代。正如个人计算机和互联网革命所发生的那样，现在人们意识到，人工智能不仅将以前所未有的方式改变计算机，而且将改变社会和人类。人们开始意识到，人工智能和机器学习的适用性远远超出了他们的Facebook订阅中的诸如人脸识别之类的普通事物。它也超出了像自动驾驶汽车和数字助理这样华丽的科幻场景。医疗保健、制造业、酒店业、金融业等各行各业，都正处于以数据和人工智能为中心的大规模转型过程中。在生活的方方面面，没有智能的数字信息将变得毫无意义。未来十年将由人工智能改变。互联网时代即将过渡到人工智能时代。

然而，理解人工智能的“群体”才刚刚开始。在这种情况下，我很高兴Ameet Joshi博士写作了这本关于机器学习和人工智能的书。当一个话题能引起人们的极大兴趣并具有影响力时，人们永远不会有足够的知识和学习资源。与个人计算机时代或互联网时代创造的那种学习内容相比，机器学习和人工智能相关的内容仍然稀少，而且有一定针对性。即使对于精通技术的人来说，这仍然是一个神秘的领域。虽然有必要解决所有受众的问题，但迫切需要为那些能熟练掌握数学和科学而不一定是计算机科学家或工程师的人们阐明这一领域。这些人愿意并且有能力很好地掌握机器学习和人工智能。他们对数据和数学的理解相当深入，他们可能理解传统的计算和算法，但他们远离了数据科学专家所涉及的领域。他们渴望挽起袖子，潜入其中，并从基础上了解什么是机器学习和人工智能。机器学习和人工智能学习民主化的时机已经成熟。Joshi博士的书恰好能够满足这一需求。读过本书的大多数人可能不会成为数据科学家，但他们都会对机器学习和人工智能的工作方式有一个了解，并能够将其应用到他们所从事的任何工作领域。他们将能够看到人工智能的每一个应用，无论是与之交谈的数字助理，还是以一种截然不同的视角和更深刻的理解对广告进行准确定位或对机票价格波动进行准确预测。围绕着发生在我们身边的许多数字化事物的神秘笼罩似乎更加明显和真实。更重要的是，我希望阅读本书的人能够利用学到的知识，在他们未来的工作领域中寻找应用。对于某些读者来说，这甚至可能充分激发他们的兴趣，使他们成为机器学习和人工智能的专业从业者。对于这样的专业人才，肯定有巨大的需求。

Joshi博士本人就是一位充满激情的从业者。他的热情在这本书中表现得淋漓尽致。他从事过广泛的机器学习和人工智能问题的研究，这些实践经验帮助他识别并解释了本书中相关的场景和应用。这是一本值得反复阅读的图书。当读者看到本书中所描述的技术在现实世界中的应用时，他们很可能会想重温本书的各个章节，以更新他们的理解，或者深入探究某个领域。我认为这就是最值得拥有的书籍。即使作为一名业内资深人士，我也喜欢阅读这本书，并会随身携带一本。

阅读愉快。

Vij Rajarajan

微软公司总经理

美国华盛顿州雷德蒙德

前　　言

有史以来最伟大的物理学家之一、诺贝尔奖获得者理查德·费曼（Richard Feynman）博士曾经被他的同行要求解释当时刚刚发现的费米–狄拉克（Fermi-Dirac）统计的一个性质。费曼迅速说道：

我不仅会向你们解释它，而且还将为新手准备一个关于它的讲座。

然而，很不寻常的是，几天后，他回来承认：

我做不到。我无法将解释简化为新手水平。那意味着我们真的不理解它。

甚至连费曼博士也说出了这种言论。然而，除了费米–狄拉克统计本身的话题外，它还暗示着我们对一般事物理解的深刻思考。这里的新手水平基本上意味着可以直接使用数学或物理中的基本原理推导出来的东西。这种想法总是使我有意识地尝试用基本原理来解释我声称理解的所有事物，尝试从概念上解释所有事物，而不仅仅是使用复杂的方程组。

在过去的十年里，人工智能和机器学习领域发展迅猛。随着广泛的普及，该领域的核心概念时而被淡化，时而被重新诠释。随着该领域的指数级增长，该领域的范围也在不断地增长。这个领域的新手很快就会发现这个话题令人生畏和困惑。人们总是可以从网络上搜索相关主题或者只是从维基百科开始了解相关内容，但通常情况下，每一个主题都会给你带来越来越多的新概念和未知的概念，很容易让你迷失方向。而且，机器学习中的大多数概念都深深植根于数学和统计学中。没有理论数学和统计学的扎实背景，定理和引理的复杂推导会使人们对该领域感到困惑和无趣。

我在这里尝试介绍机器学习及其应用中最基本的主题，以直观和概念性的方式构建人工智能解决方案。有时会使用一些数学指导，如果没有这些指导，概念就不够清晰，但我已经尽量避免复杂的推导和证明，以便让那些不具有强大数学背景的读者更容易理解书中的内容。根据费曼博士的说法，在这个过程中，我还要确保自己理解了它们。就一般的数学和统计要求而言，我认为一般的本科水平应该足够了。而且，随着开源领域中机器学习库的激增和标准化，人们不需要对该理论进行多么深入的数学理解就可以实现最先进的机器学习模型，从而得到最新的智能解决方案。

当尝试解决给定应用程序中的问题时，引起混乱的主要根源之一是算法的选择。通常，这里介绍的每种算法都源自某个特定的问题，但是该算法通常不限于仅解决该问题。然而，即使对于一个具有强大数学背景的博士生来说，为给定的问题选择正确的算法也并非易事。为了区分两者，我已经把这两个方面分成了独立的部分来介绍。这将使读者更容易理解。

建议读者从第一部分开始，然后根据需要选择第二部分或第三部分。对于学生来说，按顺序学习本书是理想的选择，而具有专业背景的该领域的新手则更适合从第三部分开始，以便理解或专注于手头的精确应用，然后根据需要在第二部分深入研究算法的理论细节。第四部分和第五部分应随后学习。我已经在两个部分之间添加了足够的交叉引用，以使过渡平滑。

在我看来，除非人们能看到模型在真实数据上的作用，否则就无法完全理解。因此，在详细介绍算法和应用程序之后，我添加了另一部分内容，以介绍使用免费和开源选项的模型的基本实现。完成这部分内容的学习将使读者能够使用最新的机器学习技术解决人工智能中的现实问题！

Ameet Joshi

美国华盛顿州雷德蒙德

2019年3月

查看全部↓