前言
深度学习应用于计算机视觉已经非常普遍,自从AlexNet横空出世,卷积神经网络在计算机视觉领域一骑绝尘,频频突破原先的最佳模型,甚至在多个任务上超越人类。遗憾的是,市面上关于基于深度学习计算机视觉的中文书少之又少,其中精品更是很难见到。有的书注重讲解数学,忽略了计算机视觉是一门实践科学的本质; 有的书有很多代码实战,却轻描淡写地带过了计算机视觉和深度学习的原理。对于深度学习和计算机视觉来说,原理和实践是相辅相成的,缺一不可。有的书确实做到了原理和实践相结合,但是忽略了传统计算机视觉的重要性,只关注基于深度学习的计算机视觉。于是笔者决定写一本真正的计算机视觉入门图书,既包括传统计算机视觉和深度学习,又包括原理和代码实战。
本书的写成源于AI火箭营的初心,我们希望在人工智能时代来临之际,能够帮助更多的人进入人工智能技术的殿堂,使更多的人利用人工智能解决现实中的实际问题,让更多的人在各行各业用人工智能升级改造传统产业或技术体系。
本书内容
本书从传统计算机视觉入手,通过色彩特征、局部特征、梯度特征等带领读者走入图像的世界,而后介绍传统计算机视觉的经典算法,例如目标检测、光流与跟踪等,继而进入深度学习部分,深入讲解如何将卷积神经网络应用于物体分类、目标检测等实际问题,最后介绍最新的GAN网络。为了让读者更好地了解传统计算机视觉和深度学习计算机视觉的区别,第13章详细介绍了传统计算机视觉和深度学习计算机视觉关于人脸识别方法的对比。
本书特点
(1) 通俗易懂,作为入门类图书,不用大量的数学公式,也不用复杂的术语,而是用通俗易懂的语言、形象生动的例子、栩栩如生的图片带领读者进入计算机视觉的世界。本书尽量以简单、易懂的方式将数学公式呈现给读者。即使是新入门的读者,也不会有任何阅读困难。
(2) 原理与实战相结合,作为计算机编程类图书,本书并非列举编程库或是编程函数,而是将原理与实战相结合,既阐明深刻的原理,又将所学应用到真正的实战项目,如人脸识别、车牌识别等,让读者学会OpenCV、TensorFlow等平台的函数及用法。
(3) 抽丝剥茧、深挖本质。计算机视觉往往涉及种类繁多的模型和各式各样的特征。本书在讲解新的网络架构或是算法时,透过其繁杂的表面,深挖其本质。
(4) 横向比较: 同一个问题往往有很多种不同的算法,例如目标检测问题就有RCNN、YOLO、SSD三大网络,它们各有千秋,我们要取其精华,去其糟粕。 纵向对比: 同一个实际问题,有传统计算机视觉的解决方案,也有深度学习计算机视觉的解决方案,如最常用的人脸识别,要分析不同方案的优劣,适合应用的场景。
本书对所有涉及的技术点进行了背景介绍,写作风格严谨。书中所有的代码执行结果都是自动生成的,任何改动都会触发对书中每一段代码的测试,以保证读者在动手实践时能复现结果。
由于笔者水平有限,书中难免存在疏忽,敬请原谅,并恳请读者批评指正。
余海林翟中华
2020年7月
本书源代码下载