《Python强化学习实战--使用OpenAlGymTensorFlow和Ke》[47M]百度网盘|pdf下载|亲测有效

Python强化学习实战--使用OpenAlGymTensorFlow和Ke pdf下载

出版社文轩网精品图书专营店

出版年 2021-02

页数 390页

装帧精装

评分 9.0(豆瓣)

⏰ 限时特惠 00:00:00

活动结束后恢复原价

纸质书参考价 ¥23

电子版限时价 ¥5.99 省 18 元

选择版本

基础版

PDF文件

¥4

内容简介

本篇主要提供Python强化学习实战--使用OpenAlGymTensorFlow和Ke电子书的pdf版本下载，本电子书下载方式为百度网盘方式，点击以上按钮下单完成后即会通过邮件和网页的方式发货，有问题请联系邮箱ebook666@outlook.com

作者:(美)托威赫·贝索洛著敖富江//杜静//张民垒译

定价:49.8

出版社:清华大学出版社

出版日期:2021年02月01日

页数:127

装帧:平装

ISBN:9787302570097

" 本书带领读者深入强化宁习算法的世界，并使用Fyth cn在不同用例中应用它们。其中涵盖了一些重要主题，例如策略样度算法和Q学习算法，并使用了TensorFlaw. Keras和OpenAl Gym框架。本书带领读者深入强化宁习算法的世界，并使用Fyth cn在不同用例中应用它们。其中涵盖了一些重要主题，例如策略样度算法和Q学习算法，并使用了TensorFlaw. Keras和OpenAl Gym框架。本书介绍了强化学习(RL)算法背后的理论及用于实现它们的代码。读占将依次学习Cpen等

●章强化学习导论
1.1 强化学发展史
1.2 MDP及其与强化学关系
1.3 强化学习算法和强化学习框架
1.4 Q学习
1.5 强化学应用
1.5.1 经典控制问题
1.5.2 《马里奥兄弟》游戏
1.5.3 《毁灭战士》游戏
1.5.4 基于强化学做市策略
1.5.5 《刺猬索尼克》游戏
1.6 本章小结
第2章强化学习算法
2.1 OpenAI Gym
2.2 基于策略的学习
2.3 策略梯度的数学解释
2.4 基于梯度上升的策略优化
2.5 使用普通策略梯度法求解车杆问题
2.6 什么是折扣奖励，为什么要使用它们
2.7 策略梯度的不足
2.8 近端策略优化(PPO)和Actor-Critic模型
2.9 实现PPO并求解《马里奥兄弟》
2.9.1 《马里奥兄弟》概述
2.9.2 安装环境软件包
2.9.3 资源库中的代码结构
2.9.4 模型架构
2.10 应对难度更大的强化学习挑战
2.11 容器化强化学习实验
2.12 实验结果
2.13 本章小结
第3章强化学习算法：Q学习及其变种
3.1 Q学习
3.2 时序差分(TD)学习
3.3 epsilon-greedy算法
3.4 利用Q学习求解冰湖问题
3.5 深度Q学习
3.6 利用深度Q学习玩《毁灭战士》游戏
3.7 训练与性能
3.8 深度Q学局限性
3.9 双Q学习和双深度Q网络
3.10 本章小结
第4章基于强化学做市策略
4.1 什么是做市
4.2 Trading Gym
4.3 为什么强化学习适用于做市
4.4 使用Trading Gym合成订单簿数据
4.5 使用Trading Gym生成订单簿数据
4.6 实验设计
4.6.1 强化学习方法1：策略梯度
4.6.2 强化学习方法2：深度Q网络
4.7 结果和讨论
4.8 本章小结
第5章自定义OpenAI强化学习环境
5.1 《刺猬索尼克》游戏概述
5.2 下载该游戏
5.3 编写该环境的代码
5.4 A3C Actor-Critic
5.5 本章小结
附录A 源代码

本书带领读者深入强化学习算法的世界，并使用Python在不同用例中应用它们。其中涵盖了一些重要主题，例如策略梯度算法和Q学习算法，并使用了TensorFlow、Keras和OpenAI Gym框架。本书介绍了强化学习（RL）算法背后的理论及用于实现它们的代码。读者将依次学习OpenAI Gym的各类功能，从应用标准库，到创建自己的环境，再到掌握如何构建强化学习问题，从而能够研究、开发和部署基于强化学解决方案。

(美)托威赫·贝索洛著敖富江//杜静//张民垒译

Taweh Beysolow II是一位数据科学家和作家，目前居住在美国。他拥有美国圣约翰大学的经济学学士学位和福特汉姆大学的应用统计学理学硕士学位。在成功退出与他人共同创立的初创公司后，他现在担任总部位于旧金山的私人股本公司Industry Capital的董事，在那里领导加密货币和区块链平台。

Python强化学习实战--使用OpenAlGymTensorFlow和Ke pdf下载

选择版本

内容简介

相关推荐

网络组建与运维

时空大数据的"形状":几何和拓扑的视角

NoSQL数据库入门与实践

Unity和C#编程入门Shader开发实战