作 者:郭宪,方勇纯 编著
定 价:79
出 版 社:电子工业出版社
出版日期:2018年01月01日
页 数:239
装 帧:平装
ISBN:9787121329180
●1 绪论
●1.1 这是一本什么书
●1.2 强化学习可以解决什么问题
●1.3 强化学习如何解决问题
●1.4 强化学习算法分类及发展趋势
●1.5 强化学习仿真环境构建
●1.5.1 gym安装及简单的demo示例
●1.5.2 深入剖析gym环境构建
●1.6 本书主要内容及安排
●第一篇 强化学习基础
●2 马尔科夫决策过程
●2.1 马尔科夫决策过程理论讲解
●2.2 MDP中的概率学基础讲解
●2.3 基于gym的MDP实例讲解
●2.4 习题
●3 基于模型的动态规划方法
●3.1 基于模型的动态规划方法理论
●3.2 动态规划中的数学基础讲解
●3.2.1 线性方程组的迭代解法
●3.2.2 压缩映射证明策略评估的收敛性
●部分目录
郭宪、方勇纯编著的《深入浅出强化学习(原理入门)》用通俗易懂的语言深入浅出地介绍了强化学习的基本原理,覆盖了传统的强化学习基本方法和当前炙手可热的深度强化学习方法。开篇从很基本的马尔科夫决策过程入手,将强化学习问题纳入到严谨的数学框架中,接着阐述了解决此类问题很基本的方法――动态规划方法,并从中总结出解决强化学习问题的基本思路:交互迭代策略评估和策略改善。基于这个思路,分别介绍了基于值函数的强化学习方法和基于直接策略搜索的强化学习方法。很后介绍了逆向强化学习方法和近年具有代表性、比较前沿的强化学习方法。
除了系统地介绍基本理论,书中还介绍了相应的数学基础和编程实例。因此,《深入浅出强化学习(原理入门)》既适合零基础的人员入门学习、也适合相关科研人员作为研究参考。
郭宪,方勇纯 编著
郭宪,南开大学计算机与控制工程学院博士后。2009年毕业于华中科技大学机械设计制造及自动化专业,同年保送到中国科学院沈阳自动化研究所硕博连读,主攻机器人动力学建模与控制,并于2016年1月获得工学博士学位;期间在靠前外知名杂志和会议发表论文数10篇。2016年以来,郭博士主攻方向为机器人智能感知和智能决策,目前主持两项重量课题,内容涉及深度学习、深度强化学习等智能算法在机器人领域中的应用。