作 者:刘全 等 著
定 价:96
出 版 社:科学出版社
出版日期:2016年03月01日
页 数:277
装 帧:平装
ISBN:9787030477477
●前言
●第1章强化学习概述
●1.1简介
●1.2形式框架
●1.2.1马尔可夫决策过程
●1.2.2策略
●1.2.3回报
●1.3值函数
●1.4解决强化学习问题
●1.4.1动态规划:基于模型的解决技术
●1.4.2强化学习:模型无关的解决技术
●1.5本章小结
●参考文献
●第2章大规模或连续状态空间的强化学习
●2.1简介
●2.2近似表示
●2.2.1带参数化值函数逼近
●2.2.2非参数化值函数逼近
●2.3值函数逼近求解方法
●2.3.1梯度下降方法
●部分目录
从与环境交互中学习是人类获取知识的主要方法,也是人类提高智能水平的基本途径。人类智能研究的一个很核心问题就是构建具有类似人类智能的系统。该系统的一个主要特征就是能够适应未知环境,并逐渐增强其自身能力。本书对连续状态空间的理论、算法及应用进行了研究和论述。主要包括:强化学习基本理论和大规模强化学习基本理论。