新一代人工智能的崛起深刻影响着国际竞争格局,人工智能已经成为推动国家与人类社会发展的重大引擎。2017年,国务院发布《新一代人工智能发展规划》,其中明确指出:支持开展形式多样的人工智能科普活动,鼓励广大科技工作者投身人工智能知识的普及与推广,全面提高全社会对人工智能的整体认知和应用水平。实施全民智能教育项目,在中小学阶段设置人工智能相关课程,逐步推广编程教育,鼓励社会力量参与寓教于乐的编程教学软件、游戏的开发和推广。
为了贯彻落实《新一代人工智能发展规划》,国家有关部委相继颁布出台了一系列政策。截至2022年2月,全国共有440所高校设置了人工智能本科专业,387所高等职业(专科)院校设置了人工智能技术服务专业,一些高校甚至已经在积极探索人工智能跨学科的建设。在高中阶段,“人工智能初步”已经成为信息技术课程的选择性必修内容之一。在2022年实现“从0到1”突破的义务教育阶段信息科技课程标准中,明确要求在7~9年级需要学习“人工智能与智慧社会”相关内容。实际上,1~6年级阶段的不少内容也与人工智能关系密切,是学习人工智能的基础。
人工智能是一门具有高度交叉属性的学科,笔者认为其交叉性至少体现在三个方面:行业交叉、学科交叉、学派交叉。在大数据、算法、算力三驾马车的推动下,新一代人工智能已经逐步开始赋能各个行业。人工智能也在助力各学科的研究,近几年,《自然》等顶级刊物不断刊发人工智能赋能学科的文章,如人工智能推动数学、化学、生物、考古、设计、音乐以及美术等。人工智能内部的学派也在不断交叉融合,像知名的AlphaGo,就是集三大主流学派优势,并且现在这种不同学派间取长补短的研究开展得如火如荼。总之,未来的学习、工作与生活中,人工智能赋能的身影将无处不在,因此掌握一定的人工智能知识与技能将大有裨益。
根据笔者长期从事人工智能教学、研究经验来看,一些人对人工智能还存在一定的误区。比如将编程与人工智能直接画上了等号,又或是认为人工智能就只有深度学习等。实际上,人工智能的知识体系十分庞大,涵盖的内容相当广泛,不但有逻辑推理、知识工程、搜索算法等相关内容,还涉及机器学习、深度学习以及强化学习等算法模型。当然,了解人工智能的起源与发展、人工智能的道德伦理,对正确认识人工智能和树立正确的价值观也是十分必要的。
通过对人工智能及其相关知识的系统学习,可以培养数学思维(mathematical thinking)、逻辑思维(reasoning thinking)、计算思维(computational thinking)、艺术思维(artistic thinking)、创新思维(innovative thinking)与数据思维(data thinking),即MRCAID。然而遗憾的是,目前市场上既能较综合介绍人工智能相关知识,又能辅以程序代码解决问题,同时还能迅速入门的图书并不多见。因此笔者策划了本系列图书,以期实现体系内容较全、配合程序操练及上手简单方便等特点。
本书以数据素养为主线,按照如下内容进行组织:第1章介绍什么是数据素养、数据的类型以及人工智能与数据的关系;第2章介绍认识数据规律中涉及的随机等相关概念,为认识数据、理解数据以及利用数据奠定基础;第3章介绍如何获取数据以及清洗数据的相关知识与技能,这也是利用机器学习等算法分析问题的前提;第4章围绕数据的一些特征以及数据的可视化相关内容展开探讨,进一步加深对数据的理解;第5章系统阐述了数据的特征这一概念以及如何善用特征发现问题、分析问题;第6章介绍了图像、文本等非结构化数据的处理技能,为人工智能相关算法处理图像、文本铺平道路;第7章结合数据分析、数据可视化以及简单的人工智能算法,给出了几个数据赋能课堂的案例。本书的附录部分,介绍了抽样分布与参数估计、假设检验及Python实验室Jupyter Lab的使用。
本书的出版要感谢曾提供热情指导与帮助的院士、教授、中小学教师等专家学者,也要感谢与笔者一起并肩参与写作的其他作者,同时还要感谢化学工业出版社编辑老师们的热情支持与一丝不苟的工作态度。
在本书的出版过程中,未来基因 ( 北京 ) 人工智能研究院、腾讯教育、阿里云、科大讯飞等机构给予了大力支持,在此一并表示感谢。
由于笔者水平有限,书中内容不可避免会存在疏漏,欢迎广大读者批评指正并提出宝贵意见。
龚超
2023年4月于清华大学