本篇主要提供深度强化学习核心算法与应用电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
《深度强化学习核心算法与应用》由腾讯游戏的AI算法专家联合写作,作为深度强化学习落地的先行者,他们将自己丰富的实践经验融入了本书。
不同于其他算法书,本书摒弃“枝蔓”,直接切入算法主干,阐述具体场景中算法设计的思路、实现与流程,并侧重分析各类算法之间继承与发扬关系(脉络)。
这种写法让读者可以直接掌握深度强化学习算法的本质,举一反三,领悟各类相关算法的精髓,应用于自己的工作中。
强化学习是实现决策智能的主要途径之一。经历数十年的发展,强化学习领域已经枝繁叶茂,技术内容纷繁复杂,这也为初学者快速入门造成障碍。
本书是一本深度强化学习领域的入门读物,梳理了深度强化学习算法的发展脉络,阐述了各类算法之间的关联,它们之间既有继承也有更新和发展,这种写法可以帮助读者更好地掌握算法中不变的精髓,并理解在不同的场景下应如何根据情势作出调整。
全书分为四部分。第一部分主要阐述强化学习领域的基本理论知识;第二部分讲解深度强化学习常用算法的原理、各算法之间的继承与发展,以及各自的算法流程;第三部分总结深度强化学习算法在游戏、推荐系统等领域的应用;第四部分探讨了该领域存在的问题和发展前景。
本书适合想了解强化学习算法的小伙伴作为入门读物,也适合对强化学习感兴趣的读者阅读。
陈世勇
腾讯游戏AI研究中心高级算法研究员。毕业于南京大学机器学习与数据挖掘研究所,主要从事强化学习、分布式机器学习方面的研究工作,并在国际顶级会议和期刊上发表多篇论文。对于大规模强化学习在游戏AI和推荐系统领域的研究和落地有着丰富经验,负责了多款游戏的强化学习AI项目和“淘宝锦囊”强化学习推荐项目研发,参与了虚拟淘宝项目研发。
苏博览
新加坡国立大学博士,曾任职于腾讯游戏AI研究中心,参与了QQ飞车和斗地主游戏AI的研发,在国际顶级会议和期刊发表论文数十篇,在机器学习和强化学习上有丰富的科研和落地应用经验。
杨敬文
腾讯游戏AI研究中心高级算法研究员。毕业于南京大学机器学习与数据挖掘研究所,获南京大学“优秀毕业生”称号、南京大学计算机优秀硕士毕业论文奖。曾获全国大学生大数据竞赛第yi名,在国际顶会发表多篇论文和技术文章。长期从事强化学习在游戏领域的研究与应用,是竞速类、格斗类、射击类、多人在线战术竞技类等强化学习AI项目的主要负责人之一,具有丰厚的强化学习研究和落地的经验。
强化学习是实现决策智能的主要途径之一。经历数十年的发展,强化学习领域已经枝繁叶茂,技术内容纷繁复杂,这也为初学者快速入门造成障碍。作者是深度强化学习在游戏领域的早期探索实践者,在腾讯从事多年的游戏AI设计,对强化学习技术的优势与局限有深入理解。本书作为强化学习方向的入门读物,与其他强化学习书籍相比,在介绍强化学习基本概念以外,更加强调对当下流行的深度强化学习算法的介绍,以及对强化学习应用的介绍,这其中包含了作者亲身参与的项目。相信读者能从本书中获得对强化学习技术发展状况的了解,尤其有助于初学者掌握强化学习应用技术的主干。
——俞扬,南京大学人工智能学院教授
很高兴看到这样一本全面、深入、实用的强化学习书籍面世。强化学习是一个既古老又年轻,并不断散发出全新魅力的技术领域,我和我的团队也一直致力于强化学习技术的工业化落地。正如本书总结与展望篇所说,强化学习的研究和应用还面临诸多挑战,但审慎乐观,大有可为。期待在本书的帮助下,有更多有志之士投身到强化学习技术的学习和实践当中!
——何径舟,百度自然语言处理部总经理
本书的一大特色是重视强化学习算法在工业界的实际应用落地,作者在学术界和工业界都有多年的工作经验,兼具扎实的理论功底和工业界实践经验,尤其对深度强化学习算法应用在游戏领域有广博而深度的认识。 因此本书对于想在工作中尝试深度强化学习的互联网一线AI工程师有切实的指导意义。
——靳志辉(Rick Jin),日本东京大学人工智能博士,《神奇的伽马函数》作者