《强化学习：原理与Python实战》[40M]百度网盘|pdf下载|亲测有效

产品特色

编辑推荐

适读人群：本书适合于以下读者：?想系统学习强化学习的人士；?想运用强化学习解决实际问题的人士；?想在强化学习领域工作的人士。读者需要了解概率论。对于深度强化学习部分，读者需要

携七大优势，带你一书学透强化学习，掌握ChatGPT背后的关键技术。

1）内容完备：完整地介绍了主流强化学习理论，全面覆盖主流强化学习算法，包括了资格迹等经典算法和MuZero等深度强化学习算法，且给出主要定理的证明过程。让你参透ChatGPT背后的关键技术。

2）表述一致：全书采用统一的数学符号，并兼容主流强化学习教程。

3）配套丰富：每章都配有知识点总结、代码和习题。

4）环境全面：既有Gym的内置环境，也有在Gym基础上进一步扩展的第三方环境，还带领读者一起实现了自定义的环境。

5）兼容广泛：所有代码均可在Windows、macOS、Linux上运行，提供安装和配置方法。同时，为深度强化学习相关算法提供了TensorFlow和PyTorch的对照实现，学习方案任你选择。

6）硬件要求低：所有代码均可在没有GPU的个人计算机上运行，也可以在线查阅运行结果。

7）版权输出：本书内容受到国际知名出版社Springer和评审专家认可，英文版同步输出，以飨读者。

内容简介

本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。

全书从逻辑上分为三部分。

第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。

第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。

第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好了解强化学习研究的全貌。

作者简介

肖智清

强化学习一线研发人员，清华大学工学博士。在国内外出版多本人工智能专著，在知名期刊和会议上发表多篇第一作者论文。他是开源项目Gym的源码贡献者，并在国内外多项程序设计和数据科学竞赛上获得冠军。

前言/序言

为什么要写作本书

强化学习正在改变人类社会的方方面面：基于强化学习的游戏AI已经在围棋、《星际争霸》等游戏上全面碾压人类顶尖选手，基于强化学习的控制算法已经运用于机器人、无人机等设备，基于强化学习的交易算法已经部署在金融平台上并取得了超额收益。由于同一套强化学习代码在同一套参数设置下能解决多个看起来毫无关联的问题，因此强化学习常被认为是迈向通用人工智能的重要途径。

本书特色

本书完整地介绍了主流强化学习理论。

选用现代强化学习理论体系，突出主干，主要定理均给出证明过程。基于理论讲解强化学习算法，全面覆盖主流强化学习算法，包括资格迹等经典算法和MuZero等深度强化学习算法。

全书采用完整的数学体系各章内容循序渐进。全书采用一致的数学符号，并兼容主流强化学习教程。

本书各章均提供Python代码，实战性强。

简洁易懂：全书代码统一规范，简约完备，与算法讲解直接对应。

查阅、运行方便：所有代码及运行结果均在GitHub上展示，既可以在浏览器上查阅，也可以下载到本地运行。各算法实现放在单独的文件里，可单独查阅和运行。

环境全面：既有Gym的内置环境，也有在Gym基础上进一步扩展的第三方环境，还带领读者一起实现自定义的环境。

兼容性好：所有代码在三大操作系统（Windows、macOS、Linux）上均可运行，书中给出了环境的安装和配置方法。深度强化学习代码还提供了TensorFlow 2和PyTorch对照代码。读者可任选其一。

版本新：全书代码基于最新版本的Python及其扩展库。作者会在GitHub上更新代码以适应版本升级。

硬件要求低：所有代码均可在没有GPU的个人计算机上运行。

本书主要内容

本书介绍强化学习理论及其Python实现。

第1章：从零开始介绍强化学习的背景知识，以及环境库Gym的使用。

第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的深度强化学习算法。Python实现和算法讲解一一对应，对于深度强化学习算法还给出了基于TensorFlow 2和PyTorch的对照实现。

第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便让读者更好地了解强化学习研究的全貌。

勘误与支持

致谢

在此感谢为本书出版做出贡献的所有工作人员。本书还采纳了童峥岩、赵永进、黄永杰、李伟、马云龙、黄俊峰、李岳铸、李柯、龙涛、陈庆虎等专家的意见。向他们表示感谢。

特别要感谢我父母的无私支持，感谢我的上司与同事对本书出版的关心和支持。

感谢你选择本书。祝学习快乐！

肖智清

查看全部↓

强化学习：原理与Python实战 pdf下载

内容简介

产品特色

编辑推荐

内容简介

作者简介

目录

前言/序言

强化学习：原理与Python实战 pdf下载

内容简介

产品特色

编辑推荐

内容简介

作者简介

目录

前言/序言

相关推荐

嵌入式应用技术丛书：ARM嵌入式开发实例·基于STM的系统设计肖广兵

工程制图

企业信息安全管理从0到1邹庆,段阳阳,刘洪旺书籍

国之重器出版工程金融数据中心网络架构与技术张学明，陈乐