本篇主要提供对偶学习电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
许多人工智能(和机器学习)任务具有对偶形式,例如,英语到汉语的翻译和汉语到英语的翻译、语音识别和语音合成、问题回答和问题生成、图像分类和图像生成。对偶学习是一种新的学习框架,它利用人工智能任务的原始-对偶结构获取有效的反馈或者正则信号来加强学习/推断过程。对偶学习的概念在几年前就被提出,它已经在多个领域引起了关注并且在多个任务——例如机器翻译、图像翻译、语音合成和语音识别、(视觉)问题回答和问题生成、图像描述和图像生成、代码摘要和代码生成——上验证了有效性。
本书系统全面地阐述了对偶学习,可以帮助相关研究人员和从业者更好地了解该领域的前沿技术。全书分为五部分。第一部分简要介绍机器学习和深度学习的基础知识。第二部分以机器翻译、图像翻译、语音处理及其他自然语言处理/计算机视觉任务为例,详细介绍了基于对偶重构准则的算法。算法包括对偶半监督学习、对偶无监督学习、多智能体对偶学习等。关于图像翻译,介绍了包括CycleGAN、DualGAN、DiscoGAN、cdGAN在内的算法以及近期发展。第三部分介绍基于概率准则的若干研究,包括基于联合概率准则的对偶有监督学习和对偶推断,以及基于边缘概率准则的对偶半监督学习。第四部分从理论角度解读了对偶学习,并且讨论了和其他学习范式的联系。第五部分总结了全书内容并给出若干未来研究方向。本书还就进一步阅读提供了建议,给出了相关文献,以帮助读者深入了解该领域、推动该领域的发展。
秦涛
微软亚洲研究院首席研究员、深度学习和强化学习组负责人,IEEE、 ACM高级会员,中国科学技术大学客座教授,研究方向包括深度学习及其在自然语言、语音、图像处理和药物研发中的应用,强化学习及其在游戏AI和实际问题中的应用,博弈论与多智能体系统及其在云计算和在线广告中的应用,信息检索以及计算广告。他的团队提出的对偶学习及其他技术帮助微软于2018年在中英新闻翻译任务上达到了人类专家的水平,获得WMT 2019国际机器翻译大赛8项冠军,并集成到了微软翻译系统中。2019年,他和团队设计了当时最为高效的语音合成模型FastSpeech,该模型支撑了微软云Azure上的所有语音(涵盖100多种语言和270多种语音)合成服务。同年,研发了麻将AI Suphx,在“天凤”平台荣升十段,安定段位8.7,显著超越人类顶级选手。
在过去的十几年中,深度神经网络已经成为人工智能(Artificial Intelligence,AI)的主导模式。深度学习极大地推动了从计算机视觉、自然语言和语音处理到游戏等人工智能各领域的发展。深度学习成功的关键要素之一在于大量有标数据的获取。与此对应的一个挑战(也是研究热点)是如何从有限的、不充分的数据上有效地学习。对偶学习是一种新的学习范式,通过人工智能任务之间的结构对偶性来解决这一挑战。
本书系统地总结了对偶学习的进展,涵盖对偶学习的基本准则(包括对偶重构准则、联合概率准则、边缘概率准则)和多种机器学习设定及算法(包括对偶半监督学习、对偶无监督学习、对偶有监督学习、对偶推断)。对每种设定,我们会依据实际场景介绍多种应用,例如机器翻译、图像到图像的翻译、语音合成和识别、问题回答和问题生成、图像分类和生成、代码摘要和代码生成,以及情感分析等。
本书主要面向机器学习、计算机视觉、自然语言和语音领域的研究人员和研究生、本科生。掌握这些领域的背景知识对阅读本书会有帮助,但不是必需的。为了方便阅读,本书第 2 章和第 3 章简要介绍了机器学习和深度学习的基本概念。
秦 涛
2020 年 7 月
北京