译者序
当前业界与学界流行的热词是人工智能、区块链、云计算、数据科学与大数据、物联网、虚拟现实,而人工智能则包含了机器学习与深度学习。三位深度学习之父Yoshua Bengio、Yann LeCun、Geoffrey Hinton因他们在神经计算领域的突出贡献而获得了2019年度计算机科学界的最高奖——图灵奖。人工智能技术在60多年前就已萌芽,早年由于缺乏足够强劲的硬件和海量数据支撑,导致其发展迟缓。如今,得益于硬件算力的增强和深度学习算法的进步,加上互联网及移动计算产生的海量数据,人工智能技术的发展和应用具备了成熟条件。越来越多的国家和地区将人工智能上升为发展战略,并将其视作促进经济繁荣、社会福祉、国家安全的重要筹码。在最近数年中,计算机视觉、语音识别、自然语言处理和机器人取得的爆炸性进展都离不开人工智能与机器学习。
为满足业界急剧上升的人才需求,全国已有500余所高校设立了大数据与人工智能类专业,科技前沿公司也纷纷布局自己的研发战略及产品生态。本书从独特的视野介绍了人工智能中出现的关键技术。全书分为5个部分:第1部分介绍了基于逻辑的方法;而第2部分重点介绍了基于概率的方法;第3部分介绍了涌现智能的特点,探讨了基于群体智能的进化计算方法;接下来是最新的发展,介绍了人工神经网络和深度学习;最后一部分重点介绍了自然语言理解。
本书的两位作者是人工智能领域的学科引领者及创业者。Richard E.Neapolitan博士是美国东北伊利诺伊州大学的计算机科学名誉教授和美国西北大学的生物信息学教授,同时也是贝叶斯网络解决方案公司总裁。其研究兴趣包括概率和统计、决策支持系统、认知科学以及概率模型等在医学、生物学和金融等领域的应用。Xia Jiang博士是美国匹兹堡大学医学院生物医学信息学系的副教授。她在人工智能、机器学习、贝叶斯网络和因果学习等方面拥有超过16年的教学和研究经验,并将这些方法用于建模和解决生物学、医学和转化科学领域的问题。
本书适合作为本科教学参考书及高职院校培训教材,对研究生自修也有极大帮助,对自学及实战者也是不可多得的辅助参考。本书的翻译出版得益于机械工业出版社编辑的推荐与鼓励,在此特致感谢。我的研究生们在全书的初稿形成、图表编辑等诸多方面给予了帮助,在此一并致谢。由于译者水平有限,加之人工智能与机器学习领域新兴概念繁多,难免误译或词不达意,敬请读者赐教与原谅。
译者谨识2021.5原 书 前 言原 书 前 言
近年来,我对人工智能(AI)课程的认识产生了巨大转变。曾经认为该课程应该讨论为建立一个可以在复杂、变化的环境中进行学习和决策、影响该环境并将所获知识和决策传达给人类的人工实体的工作,即一个可以思考的实体。因此,在课程中会引入那些未能扩展的弱人工智能方法。但是,随着强人工智能方法在有限领域解决挑战性问题时越来越重要,我们的课程也越来越关注于这些方法。现在将引入反向链、正向链、规划、贝叶斯网络推理、规范决策分析、进化计算、决策树学习、贝叶斯网络、监督学习、无监督学习以及强化学习,我们将展示这些方法的实际应用。这些技术对于计算机科学专业的学生来说已经变得与分治法、贪婪方法、分支定界法等技术同等重要。然而,除非学生选修了人工智能课程,否则将不会学到上述方法。因此,我的人工智能课程演变成了一门本科学生可以同时或跟随在算法分析课程之后学习的课程,它将涵盖我认为比较重要的人工智能领域的问题求解方案。我觉得这样的课程应该像数据结构和算法分析一样,成为计算机相关专业本科培养计划中的核心课程之一。
由于以下两个原因,尚未有图书能满足我所教授课程的需要:
1)人工智能是一个广阔的领域,在过去的50年中,发展出了许多各种各样的技术。现有的图书试图涵盖全部内容,而不是简单地提供有用的方法和算法。
2)目前没有图书可供美国东北伊利诺伊州大学等主要大学的学生使用。我对算法分析课程也有同样的困惑,这也是写作《算法基础》的原因。
因此,我使用自己的《贝叶斯网络》课本和课堂笔记来教授该课程。最后,我决定将这些笔记变成这本著作,以便其他高校的教授也可以提供类似的课程。虽然我竭力使所有计算机科学专业的学生都能读懂这本书,但依旧很难在严格意义上进行折中。我觉得本书适合在任何开设人工智能课程的高校中使用。
本书撰写的目的不是要成为AI的百科全书或呈现AI发展史,而是在一个学期有限的时间内,尽量涵盖AI内容,并且向学生讲授那些我认为与AI相关的最为有用的技术。这些技术包括:
1)基于逻辑的方法;
2)基于概率的方法;
3)基于群体智能的进化计算与方法;
4)神经网络与深度学习;
5)语言理解。
本书清楚地反映了我自己的偏好。书中没有讨论模糊逻辑、支持向量机以及AI中的许多其他分支。例如没有包括搜索技术,因为大多数搜索技术都出现在数据结构和算法图书中。书中几乎一半的内容是有关概率的方法,可能有部分原因是我对这些方法最为了解,因为这是我自己的研究领域,也可能因为我认为它们是最为重要的(这就是为什么概率成为我的研究领域)。在第2版中,增加了关于神经网络和深度学习的部分,因为它们在语音和图像识别等领域的使用越来越广泛。
本书的撰写是以我讲授的顺序为基础。因此,建议大家从头至尾按顺序学习这些章节。如果没有时间学习整本书,建议可以跳过9.3~9.6节内容,这些章节探讨了决策分析中的高阶主题,而11.6节则涉及因果学习。标有(*)的部分所包含的内容与书中的其他内容相比,难度较高,但确涵盖了重要的主题,如果学生有足够的能力来掌握它们,则不应跳过这些章节。
感谢Dawn Holmes和Kevin Korb阅读了手稿并提供了有用的评论。我还要感谢Prentice Hall出版社允许节选了我的著作Learning Bayesian Networks,以及感谢Morgan Kaufmann出版社允许节选了我的著作Probabilistic Methods for Financial and Marketing Informatics和Probabilistic Methods for Bioinformatics。
Richard E.Neapolitan RE-Neapolitan@neiu.edu