原书前言
数年后,无人驾驶汽车也许不再是天方夜谭,而将变成日常生活中的常态现象。这一现象的背后必然有数种高精尖技术的支持。首先是实现精准传感功能的图像识别技术,其次是机器人模仿人类的高度精准估测的强化学习技术。本书旨在围绕上述两大技术,通过基于深 度学习的示例程序演示,向读者介绍操作性强的入门知识。
深度学习在国际上早已迈入业务应用和实践阶段。Kaggle是创办于美国的国际性数据竞赛平台。在该平台的图像类比赛中,越来越多的参赛队伍搭建了基于深度学习的模型来提升估测精度。图像分类领域里已训练出了1000层的深度学习网络。利用VGG- 16(16层)、ResNet- 152(152层)等开源预训练模型(pre- trained model)进行微调(Fine- tuning)已成为近年 来的主流方案。结果证明,预训练模型的使用有助于图像分类的高效实现。 本书第4章“图像识别分类”将通过示例程序向读者说明VGG- 16、ResNet- 152的具体操作方法。在第5章“目标检测”将介绍基于26层网络的Yolo和有助于医学图像目标识别的U形23层网络模型。这其中包括了提升估测精度的方法,即由根特大学和Google Deep- Mind公司共同组建的联合参赛队在2015年3月Kaggle海洋浮游生物分类比赛中斩获桂冠所采用的方法。
本书中的内容主要基于深度学习库Keras(Python)实现。Keras自2015年3月开源后,因其易用性广受欢迎。基于Keras,model.fit(X_train, Y_train, nb_epoch=10, batch_size=64, shuffle=True)一行指令即可自动实现前向传播、误差计算和反向传播。常用于图像处理的卷积操作设置也仅需键入conv1 = Convolution2D(32,3,3,activation=′relu′,border_mode=′same′)(inputs)一行指令即可。除Keras外,本书还将对全球范围广泛使用的Torch(Lua)以及由日本开发的Chainer(Python)的安装及使用方法进行介绍。其中,第6章“强化学习”中的示例都 是基于Chainer运行实现的,约6min即可训练出擅长井字棋游戏(Tic- tac- toe)的智能计算机。
由于深度学习在计算参数时涉及矩阵运算,因此需要图形处理器(Graphics Processing Unit,GPU)的参与。本书不仅会教授读者如何把个人游戏计算机改造为深度学习机器,还会详细介绍机器改造后该如何使用。本书第1章主要介绍深度学习必备的硬件环境、操作系统及中间件的安装方法,第2、3章主要解读深度学习示例中的基本术语。第4章后将通过操作演示示例程序,介绍基于深度学习技术的图像识别及强化学习。
第4章后使用的示例程序可在Ohmsha的主页上下载后直接使用。通过对示例程序的试 用练习,可加深对深度学习的理解,还可学到提升估测精度的操作方法。深度学习之名可能容易给人留下逻辑算法复杂难懂的印象,但实际上不足为惧。阅读本 书,学习知识的同时动手实践实为本书之旨。
借出版之际,谨对邀请我们执笔此书的Ohmsha的各位同仁表示衷心的感谢。
藤田一弥 高原步
2016年11月
译者序
深度学习(Deep Learning,DL)是机器学习(Machine Learning,ML)领域中一个新的研究方向,近年来引起了人们的广泛关注。尤其是其在语音和图像识别方面取得的成果,远远超过了先前的相关技术,为人工智能的进一步实现提供了坚实的基础。
图像识别作为人工智能的关键技术之一,被广泛应用于电子商务、游戏、汽车、制造业和教育领域等多种场景,为人们的生活提供了极大的便利。本书作者Forward Network株式 会社的董事长藤田一弥和Hadoop认证开发管理员高原步从实践的角度出发详细地介绍了如何利用深度学习实现图像识别。本书从深度学习方法出发,由浅入深地介绍了图像识别中的神经网络模型、深度学习的操作流程、图像分类的训练模型、图像目标检测模型以及强化学习等知识,并将这些知识与五大深度学习开源框架相结合,应用于实践。本书不仅聚焦知识的学习,而且在各环节中还倡导并引导读者动手实践,由此可大大降低读者对深度学习算法复杂难懂的印象,帮助读者快速实现深度学习的入门和进阶。
本书共6章,具体内容如下: 第1章主要介绍了国际上在图像识别领域取得的研究成果,以及本书使用的软硬件信息。 第2章介绍了图像识别领域的网络模型,包括常见的卷积神经网络(CNN)等。第3章介绍了深度学习的操作流程,以及本书使用的基本术语,可帮助读者进行快速知识查阅。第4章通过深度学习模型机,使用VGG- 16、ResNet- 152训练模型进行图像识别分类的实际训练。第5章介绍了更为精细的目标检测,全面展示了基于26层模型的估测目标定位、尺寸及种类的方法。第6章则通过井字棋游戏介绍了基于深度学习的强化学习方法。
本书在翻译的过程中,得到了多位同事和朋友的帮助与支持,在此表示衷心的感谢。由于时间仓促,加之译者水平有限,书中若有不当和错漏之处,恳请广大读者指正批评。
译者