昇腾AI处理器CANN应用与实战——基于Atlas硬件的人工智能案例开发指南pdf下载pdf下载

昇腾AI处理器CANN应用与实战——基于Atlas硬件的人工智能案例开发指南百度网盘pdf下载

作者:
简介:本篇主要提供昇腾AI处理器CANN应用与实战——基于Atlas硬件的人工智能案例开发指南pdf下载
出版社:清华大学出版社
出版时间:2021-09
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

产品特色

编辑推荐

华为公司官方出品

!华为智能计算技术丛书,20个典型案例解密昇腾CANN平台的强大功能,华为技术有限公司2012实验室总裁何庭波作序!


内容简介

  《昇腾AI处理器CANN应用与实战——基于Atlas硬件的人工智能案例开发指南(华为智能计算技术丛书)》专注于昇腾AI处理器的革命性边缘计算SoC芯片,基于Atlas开发者套件或Atlas推理卡建设应用生态。全书共20章,重点剖析若干重要领域的典型案例,内容涵盖图像分割、图像生成、图像处理、模式分类、目标检测、智能机器人和序列模式分析等。每章自成体系,较为完整地给出了案例系统的应用动机、系统架构和执行流程的设计方案,并结合代码剖析案例系统的实现过程和实际测试结果,能够帮助读者快速应用舁腾AI处理器解决实际问题。
  《昇腾AI处理器CANN应用与实战——基于Atlas硬件的人工智能案例开发指南(华为智能计算技术丛书)》是一本系统介绍舁腾AI处理器的案例教材,体例完整,案例具有典型性,配套代码完全开源,实战资源丰富,可以作为高校人工智能、智能科学与技术、计算机科学与技术、软件工程、电子信息工程、自动化等专业的教材,也适合从事人工智能系统开发的科研和工程技术人员作为参考书。

作者简介

  苏统华,博士、哈尔滨工业大学企业与服务智能计算研究中心副教授、软件学院副院长。主要研究方向为模式识别、深度学习、异构计算等。致力于自然手写体中文文本识别的研究与开拓,注重人工智能基础技术和工业应用商业化。曾建立**手写中文库(HIT-MW库),先后被国内外200余家科研院所采用。自主研发大规模深度学习训练和预测平台,该平台已经成功应用到传统煤气表改造工程、中小学试卷全自动批改、手写输入法等商用领域。出版专著3本、译著9本,曾2次获得国际手写汉字识别竞赛首名。
  
  杜鹏,博士,华为海思异腾CANN技术专家,主要研究方向为异构计算、计算机图形学、人工智能等。曾在韩国科学技术院、新加坡南洋理工大学、杭州电子科技大学从事科研与教学工作,在SIGGRAPH、PG等国际著名学术会议发表论文10余篇。

内页插图

精彩书评

  ★人工智能技术发展日新月异,行业应用正在加速,带动了千行百业的智能化转型升级,创造出巨大的发展机遇。同时,人工智能与产业结合的高门槛,也成为广大开发者面临的挑战。该书汇聚了国内20位知名教授的研究成果,深入论述了异腾AI处理器、异构编程及工具链的应用,覆盖计算机视觉、语音语义理解等热门应用领域。对于从事人工智能研究的科研和工程技术人员,极具参考价值。
  ——许映童 华为昇腾计算产品线总裁
  
  ★以异腾AI处理器为核心的人工智能计算系统满足了从训练到推理、从大规模Al集群到边缘智能设备的各种应用场景。如何结合不同场景,利用异腾AI处理器的强大算力开发各种Al应用是开发者面对的重大挑战。华为推出的基于异构计算架构CANN(Compute Architecture for Kleural Network)的全栈AI基础软件,涵盖从驱动、运行时、加速库、编译器、编程语言TBE、调试器、工具链MindStudio、开发套件MindX SDK、标准编程接口AscendCL API、AI框架MindSpore等,可以帮助开发者高效开发Al应用。开发者通过该书不仅可以学习到异腾Al处理器及CANN开发的知识,而且可以获得AI应用的宝贵实践经验。
  周斌华为昇腾计算CTO
  
  ★华为异腾AI处理器及其软件栈成功的关键在于基于它的软件生态是否成熟,这需要整个计算行业的广泛参与。为了降低学习门槛,该书围绕异腾AI处理器及相关工具链,通过内容多样且详尽的案例帮助读者快速入门。书中的案例(也包括我的团队所做的一些工作)都是近年来AI领域新研究成果在异腾AI处理器上的实现,具有非常高的参考价值。
  ——程明明南开大学教授
  
  ★当前,华为致力于与国内著名高校建立紧密的合作伙伴关系,共同推动自主可控的AI生态建设。华为与高校联合开发的实践项目形成了该书的基本素材,这些素材聚集了全国20位知名教授新的研究成果,覆盖AI应用的多个领域——视觉、图像、视频、语音、语义、机器人等热门应用案例,为使用华为异腾AI处理器系列产品的用户提供了非常有益的经验。本人负责的实验室也将异腾AI处理器和CANN软件栈在机器人领域进行了开发应用,并将这些应用经验融入该书。推荐对AI处理器感兴趣的朋友阅读该书,定会受益良多。
  ——张新宇 机器人操作系统(ROS)暑期学校创办人,华东师范大学教授

目录

引言00

第一篇目标检测

第1章手写汉字拍照检测与识别00

1.1案例简介00

1.2系统总体设计00

1.2.1功能结构00

1.2.2运行流程与体系结构00

1.3系统设计与实现00

1.3.1数据集制作00

1.3.2字符图像预处理0

1.3.3模型训练0

1.3.4模型转换0

1.3.5文字区域提取0

1.3.6模型推理0

1.4系统部署0

1.5运行结果0

1.6本章小结0

第2章人类蛋白质图谱分类0

2.1案例简介0

2.2系统总体设计0

2.2.1功能结构0

2.2.2体系结构0

2.3系统设计与实现0

2.3.1数据集的下载与筛选0

2.3.2选择性搜索算法0

2.3.3数据集的制作0

2.3.4模型训练0

2.3.5模型推理0

2.4系统部署0

2.4.1服务器端部署0

2.4.2客户端部署0

2.5本章小结0

第3章遥感图像目标检测0

3.1案例简介0

3.2系统总体设计0

3.2.1功能结构0

3.2.2系统设计流程0

3.3系统设计与实现0

3.3.1目标检测模型定义0

3.3.2目标检测模型训练0

3.3.3模型转换0

3.3.4模型推理0

3.3.5系统运行界面设计0

3.4系统部署与运行结果0

3.5本章小结0

第二篇图 像 分 割

第4章人像的语义分割0

4.1案例简介0

4.2系统总体设计0

4.2.1功能结构0

4.2.2运行流程与体系结构0

4.3系统设计与实现0

4.3.1数据集生成0

4.3.2基于错误预测的分割网络0

4.3.3模型训练及评估0

4.3.4模型转换0

4.3.5获取视频数据0

4.3.6模型推理0

4.3.7推理结果后处理0

4.4系统部署0

4.5运行结果0

4.6本章小结0

第5章人像分割与背景替换0

5.1案例简介0

5.2系统总体设计0

5.2.1功能结构0

5.2.2系统设计流程0

5.3系统设计与实现0

5.3.1构建数据集0

5.3.2定义人像分割网络0

5.3.3模型转换0

5.3.4模型推理0

5.4系统部署0

5.5运行结果0

5.6本章小结0

第6章眼底视网膜血管图像分割0

6.1案例简介0

6.2系统总体设计0

6.2.1功能结构0

6.2.2体系结构0

6.3系统设计与实现0

6.3.1数据集制作0

6.3.2网络训练0

6.3.3模型部署0

6.3.4用户交互层0

6.4系统部署0

6.5运行结果0

6.6本章小结0

第7章边缘检测0

7.1案例简介0

7.2系统总体设计0

7.2.1功能结构0

7.2.2运行流程与体系结构0

7.3系统设计与实现0

7.3.1数据集制作0

7.3.2图像预处理0

7.3.3模型训练0

7.3.4模型评估和验证0

7.4系统部署0

7.4.1服务器端部署0

7.4.2客户端部署0

7.5运行结果0

7.6本章小结0

第三篇图 像 生 成

第8章AR阴影生成0

8.1案例简介0

8.2系统总体设计

8.2.1功能结构

8.2.2运行流程

8.3系统设计与实现

8.3.1数据集制作

8.3.2图像预处理

8.3.3模型创建

8.3.4模型转换

8.3.5网络推理

8.4系统部署

8.5运行结果

8.6本章小结

第9章卡通图像生成

9.1案例简介

9.2系统总体设计

9.2.1功能结构

9.2.2系统设计流程

9.3系统设计与实现

9.3.1网络模型定义

9.3.2算法应用

9.3.3模型转换

9.3.4模型推理

9.4系统部署

9.5运行结果

9.6本章小结

第四篇图 像 增 强

第10章图像去雾

10.1案例简介

10.2系统总体设计

10.2.1功能结构

10.2.2运行流程与体系结构

10.3系统设计与实现

10.3.1数据集介绍

10.3.2图像预处理

10.3.3模型训练

10.3.4模型转换

10.3.5模型推理

10.4系统部署

10.4.1服务器端部署

10.4.2客户端部署

10.5运行结果

10.6本章小结

第11章雨天图像增强系统

11.1案例简介

11.2系统总体设计

11.2.1功能结构

11.2.2运行流程与体系结构

11.3系统设计与实现

11.3.1数据集生成

11.3.2方向和残差感知的渐进式引导网络

11.3.3模型训练及评估

11.3.4模型转换

11.3.5模型推理

11.4系统部署

11.5运行结果

11.6本章小结

第12章图像的HDR效果增强系统

12.1案例简介

12.2系统总体设计

12.2.1功能结构

12.2.2系统设计流程

12.3系统设计与实现

12.3.1模型定义

12.3.2模型训练、保存与转换

12.3.3模型推理

12.4系统部署与运行

12.5运行结果

12.6本章小结

第13章超分辨率图像算法

13.1案例简介

13.2系统总体设计

13.2.1功能结构

13.2.2运行流程与体系结构

13.3系统设计与实现

13.3.1超分辨率图像算法

13.3.2数据集制作

13.3.3网络结构

13.3.4模型训练与验证

13.3.5模型转换

13.3.6预处理及模型推理

13.3.7推理结果后处理

13.4系统部署

13.4.1超分辨率图像转换系统

13.4.2基于Flask的Web应用

13.5运行结果

13.5.1实现结果

13.5.2PSNR

13.6本章小结

第五篇模 式 分 类

第14章人体动作识别

14.1案例简介

14.2系统总体设计

14.2.1功能结构

14.2.2系统设计流程

14.3系统设计与实现

14.3.1OpenPose检测骨骼关键点与制作数据集

14.3.2动作识别网络

14.3.3模型转换

14.3.4模型推理

14.4系统部署

14.4.1配置开发板环境

14.4.2部署动作识别项目

14.4.3实时传输摄像头数据

14.5运行结果

14.6本章小结

第15章人脸识别

15.1案例简介

15.2系统总体设计

15.2.1功能结构

15.2.2系统设计流程

15.3系统设计与实现

15.3.1模型定义

15.3.2模型转换

15.3.3人脸注册

15.3.4摄像头输入

15.3.5人脸检测模型

15.3.6关键点提取模型

15.3.7特征向量提取模型推理

15.3.8后处理

15.3.9展示器服务端

15.4系统部署

15.5运行结果

15.6本章小结

第16章大规模视频手势识别

16.1案例简介

16.1.1手势识别现状概述

16.1.2C3D模型介绍

16.1.3基于强化学习的ResC3D大规模手势识别

16.1.4案例迁移简介

16.2系统设计与实现

16.2.1系统综合设计

16.2.2C3D模型的定义、训练与生成

16.2.3系统设计流程

16.2.4模型转换

16.2.5模型推理

16.3系统部署

16.4运行结果

16.5本章小结

第六篇机器人

第17章VSLAM智能小车平台

17.1案例简介

17.2总体设计

17.2.1平台硬件系统

17.2.2VSLAM系统功能结构

17.2.3VSLAM系统流程

17.3系统设计与实现

17.3.1ROS框架

17.3.2实时跟踪定位

17.3.3深度预测模型训练

17.3.4地图重建

17.4系统部署

17.4.1ROS环境部署

17.4.2模型转换

17.4.3AscendCL模型推理

17.4.4SLAM系统部署

17.5运行结果

17.6本章小结

第七篇序 列 分 析

第18章中文语音识别

18.1案例简介

18.2系统总体设计

18.2.1功能结构

18.2.2系统设计流程

18.3系统设计与实现

18.3.1声学模型定义

18.3.2CTC算法应用

18.3.3语言模型训练

18.3.4模型转换

18.3.5模型推理

18.4系统部署

18.5运行结果

18.6本章小结

第19章手写文本行识别

19.1案例简介

19.2系统总体设计

19.2.1功能结构

19.2.2CNNA模型

19.3系统设计与实现

19.3.1数据集创建

19.3.2模型构建

19.3.3训练

19.3.4测试

19.4系统部署与运行

19.4.1图片预处理

19.4.2模型推理

19.4.3模型后处理

19.5识别结果

19.5.1数据集评估

19.5.2雅可比矩阵可视化分析

19.6本章小结

第20章意见挖掘与情感分析

20.1案例简介

20.2系统总体设计

20.2.1功能结构

20.2.2系统设计流程

20.3系统模型框架

20.3.1BERT

20.3.2LSTM

20.4系统设计与实现

20.4.1数据集

20.4.2数据读取

20.4.3词典构建

20.4.4网络搭建

20.4.5模型训练

20.4.6模型转换

20.4.7模型推理

20.5本地部署

20.5.1本地工程编译及运行

20.5.2本地系统演示

20.6本章小结

参考文献

前言/序言

  2018年度的ACM(美国计算机协会)图灵奖授予深度学习领域三巨头(YoshuaBengio、Yann LeCun、Geoffrey Hinton),这是学术界与工业界对深度学习最大的认可。深度学习具有强大的学习能力,为人工智能技术插上了翅膀。各国相继把发展人工智能确立为国家战略。我国国务院于2017年7月8日重磅发布《新一代人工智能发展规划》,人工智能课程已经相继走入中小学课堂。 人工智能将是未来全面支撑科技、经济、社会发展和信息安全的重要支柱!
  深度学习已经在许多领域影响深远,但它对算力的要求极高。华为公司应时而动,打造出基于达芬奇架构的异腾AI系列处理器,并进一步为全场景应用提供统一、协同的硬件和软件架构。其中有面向云端提供强大训练算力的硬件产品(如异腾910处理器),也有面向边缘端和移动端提供推理加速算力的硬件产品(如异腾310处理器)。与硬件同样重要的是异腾AI处理器的软件生态建设。 友好、丰富的软件生态会真正释放舁腾AI处理器的能量,走入千家万户,助力我国的新一代人工智能发展。
  全书共分七篇计20章,重点剖析若干重要领域的典型案例,内容涵盖目标检测、图像分割、图像生成、图像增强、模式分类、智能机器人以及序列模式分析等领域,涉及各种典型的深度学习网络模型。
  第一篇目标检测,包含三个案例,分别涉及手写汉字拍照检测与识别、人类蛋白质图谱分类和遥感图像目标检测,提供了基于联通成分分析搭配ResNet、选择性搜索算法搭配ResNet和YOLOv3等方法的应用。
  第二篇图像分割,分别涉及人像的语义分割、人像分割与背景替换(抠图)、眼底视网膜血管图像的分割和边缘检测四个不同领域的任务,展示了如何利用DeepLab V3+U形语义分割网络、全卷积网络以及更丰富卷积特征(RCF)网络模型进行特定分割任务。
  第三篇图像生成,包含两个案例,分别涉及AR(增强现实)阴影以及卡通图像生成,集中展示了如何使用对抗生成网络(GAN)生成逼真图像。
  第四篇图像增强,包含四个案例,涵盖图像去雾、去雨、HDR(高动态范围渲染)和图像的超分辨率四个基本问题,分别从对抗生成网络、渐进式引导图像去雨网扩宽了原有处理思路。
  第五篇模式分类,包含三个案例,介绍来自人体动作识别、人脸识别和手势识别的实践。这些与人类本身具有的能力相关,常常是我们特别期望赋予计算机的。本篇提供了基于图卷积网络(GCN)、朴素卷积网络和三维卷积网络等经典模型的分类应用。
  第六篇机器人,给出机器人领域的一个案例,让智能小车自动感知环境并自动规划路线,基于ROS框架,综合利用了雷达传感信号感知、基于DenseNet的深度图预测、SLAM和PID控制等技术。
  第七篇序列分析,集中介绍了序列分析领域的三个典型案例,包含中文语音识别、手写文本行识别以及意见挖掘与情感分析,给出了如何综合利用VGGNet网络、LSTM网络、注意力网络、BERT网络、GTC算法来解决序列分析问题。
  本书的案例素材征集自国内20位知名教授,包括清华大学胡事民、刘永进、张松海,南开大学程明明、李涛,浙江大学许威威、朱秋国,上海交通大学杨旸、陈立,武汉大学肖春霞,华中科技大学颜露新,吉林大学徐吴,华东师范大学张新宇,西安电子科技大学苗启广、侯彪,哈尔滨工业大学张盛平、苏统华,深圳大学邱国平,苏州大学张民、付国宏。苏统华和杜鹏对全书进行统稿。
  在本书的编写过程中得到清华大学出版社盛东亮主任及钟志芳编辑的专业指导,他们的编辑和审校工作明显提高了本书的质量,特别向他们致以敬意。在本书统稿过程中,刘姝辰、张明月和文荟俨等人做了大量辅助工作,特此感谢! 在本书的编写过程中同时受到多个基金(新一代人工智能重大项目2020AAA0108003、重点研发计划课题2017YFB1400604、国家自然科学基金项目61673140和81671771)的资助。