序1
我是2018年开始接触人工智能的。最早的契机是,开发一款大数据风险评估产品。
当时,我们需要融合各种数据源,通过算法对客户的金融信用进行评级和打分。对此,我们尝试了各种算法,包括回归算法、支持向量机、决策树、随机森林等。
但是我们很快发现,清洗数据、融合数据、训练模型、部署模型、反馈模型等,好像所有事务都要从零开始,我们需要手动造轮子。为此,所有人都痛苦不已。
然而,还有一件更痛苦的事情——每一个在训练场景中都能完美收敛的算法,在上线之后总是和目标结果有很大偏差。
我猜想一定是哪里做错了、想错了,才使整个人工智能的落地过程令人感觉如此痛苦,可究竟是哪里做错了、想错了呢?
2019年,我开始深度参与如雨后春笋般成长起来的人工智能产品的研发,并负责其中的关键环节,如无人零售场景分析、商场人流分析和预测、无人监控服务器运维值守等。我开始深刻地认识到,在人工智能工业化落地过程中,作为设计人员,一定要明白人工智能到底是什么、能用来做什么,以及如何去做。
基于此,2019年下半年,我开始构思、推广人工智能中台化这一概念。所谓人工智能中台化,就是将企业所需要的常见人工智能能力模块化、组件化、可插拔化,将人工智能能力(包括硬件的计算能力、算法的训练能力、模型的部署能力、基础业务的展现能力)集约起来,包装成基础平台。
站在整个企业架构的角度来看,人工智能中台的地位和数据中心、业务中台一样,是公司发展的基石。可以这么说,20年前便开始好好规划企业数据中心的公司、10年前便开始规划企业业务中台的公司,以及目前已着手规划企业人工智能中台的公司,都是站在时代前沿的追逐者。
市面上主流的关于人工智能的图书,多半深耕算法或某一特定领域工具。我和身边的朋友交流发现,很多人都希望有这样一本书:面对的读者是工程师,介绍的内容是人工智能从算法到产品再到工程化,不仅能帮助业务落地,而且能控制企业成本。于是,我和王函老师合作,撰写此书,希望能给各位工程师朋友提供帮助。
这本书是对我最近两年在人工智能工程化道路上深度思考的总结。我在这本书中着重描述了人工智能的基础能力和各种落地场景,介绍了每个场景适合的算法,不同场景各有哪些缺陷。在本书最后,我还描述了如何利用一系列开源组件快速搭建一个适用于中小型企业的人工智能中台。
鉴于本人能力有限,如果书中有不足之处,还请各位读者多多海涵、批评指点。
蒋 彪
2020年6月
序2
以互联网爆炸式发展为开端,互联网从军事领域逐渐走进千家万户。
如今,计算机、手机、平板电脑等智能设备基本成了人们的标配,5G的兴起更是让万物互联的理想慢慢得以实现。伴随而来的是海量数据,如何处理这些数据成了人们面临的迫切问题。
要想解决这个问题,人工智能可谓不二之选。犹如蒸汽机将人类从生物能时代带到机械时代一样,人工智能将深刻改变我们的思考方式。
对于我来说,能投入这场伟大的变革之中是一件十分幸福的事情。
我大概从初中开始接触计算机,接触之初便十分痴迷,于是开始学习一些与编程相关的知识,还曾写出一个五子棋人机对战的小程序。虽然只是一个很简单的小程序,但从那时开始,我就认识到了人工智能的无限可能性。
后来,我又陆续接触和学习了一些更具难度的与编程相关的知识,但因为没有实际的应用场景所以在一段时间后中断了学习。直到后来,我看到一篇介绍深度学习的文章,其中的梯度下降和反向传播理念深深吸引了我,我意识到,原来计算机技术涉及这么深奥的理论。于是我开始尝试将学到的深奥知识运用到实际中。
正如前面所讲的,我们现在面临的迫切问题是,如何处理海量数据。如果不借助人工智能方法,而用传统方法来处理,我们自身的能力(人的数量)本身就是最大的瓶颈。依托人工智能理论,我们的能力仿佛可以得到复制,进而能够很好地处理问题,突破人数限制的瓶颈。
对于企业来讲,这种能力正是不可或缺的,是企业未来的核心竞争力。而人工智能中台化正是这种竞争力的落实和体现之处。
本书是我对于将上述想法应用于实际场景的探索和总结,书中介绍了目前比较容易实现的一些技术场景。希望大家通过阅读本书增进对人工智能工程化的了解。
在这里要特别感谢蒋彪,因为他的邀请,我才能参与到本书的创作之中,这也让我有机会整理了之前的想法,明确了未来的方向。
本书内容如有纰漏,还望大家批评斧正,期待和大家共同探讨人工智能的未来。
王 函
2020年6月
前言
这是一本什么样的书
人工智能几乎是近几年最火热的技术名词。
仿佛一夜之间,不谈人工智能就是落伍,不搞人工智能产品就表示没能站在风口上。
但是当很多中小型团队冲入人工智能领域时,他们会发现,一开始以为是“拦路虎”的算法问题并不是最关键的痛点,而找到一个好的人工智能工程化落地场景,以及快速搭建人工智能工程化技术方案,变成了巨大的、难以跨越的鸿沟。
究其本质,取得人工智能核心算法的突破性进展是非常漫长且学术化的行为,尤其是在深度学习领域,有人调侃称,每年发表的论文堆起来比东方明珠塔还高。可以说,深度学习依然是不可解释的、依靠经验调参的“炼金术”。在这种背景下,绝大部分中小型企业并不具备在核心算法上取得突破性进展的能力。
对于绝大部分公司来说,能够找到一个准确的场景来应用人工智能算法,进而实现算法落地,实现人工智能工程化,才是最明智的。这也是本书能够解决的第一个问题——人工智能工程化的应用场景是什么。
本书能够解决的第二个问题是,如何进行工程化。
人工智能领域有着层出不穷的训练框架、算法包、工具,这是技术上的复杂性。另外,人工智能领域还涉及数据标注、算法训练、模型服务化、反馈模型等,这是项目管理上的复杂性。
也许对于算法科学家而言,这些都属于雕虫小技。但是对于绝大部分中小型企业的工程师而言,如果不解决这些复杂的技术细节,那么人工智能工程化就是空谈,人工智能产品化也将无从谈起,或者说,成本极高。
本书聚焦人工智能工程化的应用场景,以及人工智能工程化的技术细节,希望本书能给读者带来一点工程化实践的价值。
本书内容
本书主要介绍人工智能核心算法、人工智能工程化的应用场景,以及搭建人工智能中台的技术方案。全书共分9章,每一章的内容简介如下。
第1章 认识人工智能
人工智能是目前软件行业十分火热的方向之一,本章将介绍人工智能的基本概念、人工智能的常见流派、深度学习的不同种类、人工智能的数学基础,以及人工智能的应用场景。
第2章 人工智能的常见算法
本章将介绍一些人工智能的常见算法,包括线性回归、决策树、支持向量机、K近邻算法、人工神经网络、梯度下降,以及目前大热的卷积神经网络等。
第3章 人工智能与智能制造
制造能力对于企业发展而言非常重要,本章将深入探讨人工智能在智能制造方面的一些应用和前景。
第4章 人工智能与智能设计
随着互联网电商和内容渠道的高速发展和变化,人工智能也开始大展身手,本章将介绍人工智能如何在这些方面为人们提供生产力。
第5章 人工智能中台化战略
企业通常面临着外面市场的快速变化,本章将解答中台化战略是什么、中台化战略的目的是什么,以及中台化战略能解决什么样的问题。
第6章 人工智能中台工程化:数据能力
中台化战略是一个大概念,包含多方面能力。本章将从数据的角度探讨人工智能中台化应该具有哪些能力,并介绍现在的一些工程化方案。
第7章 人工智能中台工程化:硬件能力
数据需要硬件的支撑才能发挥作用,本章将讨论如何构建一个平台来最大限度地提高数据的利用效率。
第8章 人工智能中台工程化:业务能力
企业是围绕着业务运转的,因此如何将业务落实在中台之上是非常重要的。本章将围绕企业业务能力讨论模型服务平台和算法建模平台的构建。
第9章 人工智能中台工程化:平台能力
平台化能提高数据、硬件和业务的利用效率,本章将讨论如何将各种平台能力整合起来,方便企业内部的各个部门使用。