本篇主要提供新书计算机视觉基于PythonKeras和TensorFlow的深度学方法维哈夫·弗登基于Python实现深度学架构开发设计书电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com
书名: | 计算机视觉——基于Python、Keras和TensorFlow的深度学方法 |
出版社: | 清华大学出版社 |
出版日期 | 2022 |
ISBN号: | 9787302599425 |
![]() |
本书聚焦深度学架构和技术,使用Keras和TensorFlow库创建解决方案。涉及多种神经网络架构,包括LeNet、AlexNet、VGG、Inception、R-CNN、Fast R-CNN、Faster R-CNN、Mask R-CNN、YOLO和SqueezeNet,并通过实践了解如何基于Python实现深度学架构。书中对所有代码片段进行详细分解并彻底分析,以便可以在各自的环境中实现相同的原则。 |
![]() |
|
|
涵盖多种典型神经网络模型,构建计算机视觉系统解决方案 详解计算机视觉应用案例,从算法到编程,边学原理边实践 提供完整的源码及数据集资料
|
|
第1章计算机视觉和深度学简介 1.1使用OpenCV处理图像 1.1.1使用OpenCV检测颜色 1.1.2使用OpenCV检测形状 1.1.3使用OpenCV检测人脸 1.2深度学的基础知识 1.2.1神经网络背后的动力 1.2.2神经网络中的层 1.2.3神经元 1.2.4超参数 1.2.5ANN的连接与权重 1.2.6偏置项 1.2.7激活函数 1.2.8学率 1.2.9反向传播 1.2.10过度拟合 1.2.11梯度下降算法 1.2.12损失函数 1.3深度学的工作原理 1.3.1深度学过程 1.3.2流行的深度学程序库 1.4小结 题 拓展阅读 第2章面向计算机视觉的深度学 2.1使用TensorFlow和Keras进行深度学 2.2张量 2.3卷积神经网络 2.3.1卷积 2.3.2池化层 2.3.3全连接层 2.4开发基于CNN的深度学解决方案 2.5小结 题 拓展阅读 第3章使用LeNet进行图像分类 3.1深度学的网络架构 3.2LeNet架构 3.2.1LeNet1架构 3.2.2LeNet4架构 3.2.3LeNet5架构 3.2.4增强LeNet4架构 3.3使用LeNet创建图像分类模型 3.3.1使用LeNet进行MNIST分类 3.3.2使用LeNet进行德国交通标志分类 3.4小结 题 拓展阅读 第4章VGG和AlexNet网络 4.1AlexNet和VGG神经网络模型 4.1.1AlexNet模型架构 4.1.2VGG模型架构 4.2使用AlexNet和VGG开发应用案例 4.2.1CIFAR数据集 4.2.2使用AlexNet模型处理CIFAR10数据集 4.2.3使用VGG模型处理CIFAR10数据集 4.3AlexNet模型和VGG模型的比较 4.4使用CIFAR100数据集 4.5小结 题 拓展阅读 第5章使用深度学进行目标检测 5.1目标检测 5.1.1目标分类、目标定位与目标检测 5.1.2目标检测的应用案例 5.2目标检测方法 5.3目标检测的深度学框架 5.3.1目标检测的滑窗法 5.3.2边界框方法 5.3.3重叠度指标 5.3.4非极大性抑制 5.3.5锚盒 5.4深度学网络架构 5.4.1基于区域的 CNN 5.4.2Fast RCNN 5.4.3Faster RCNN 5.4.4YOLO算法 5.4.5单阶段多框检测器 5.5迁移学 5.6实时的目标检测Python实现 5.7小结 题 拓展阅读 第6章人脸识别与手势识别 6.1人脸识别 6.1.1人脸识别的应用 6.1.2人脸识别的过程 6.2人脸识别的深度学模式 6.2.1Facebook的DeepFace解决方案 6.2.2FaceNet的人脸识别 6.3FaceNet的Python实现 6.4手势识别Python解决方案 6.5小结 题 拓展阅读 第7章基于深度学的视频分析 7.1视频处理 7.2视频分析的应用 7.3梯度消失和梯度爆炸 7.3.1梯度消失 7.3.2梯度爆炸 7.4ResNet架构 7.5Inception网络 7.5.11×1卷积 7.5.2GoogLeNet架构 7.5.3Inception v2中的改进 7.5.4Inception v3模型 7.6视频分析 7.7使用Inception v3和ResNet创建Python解决方案 7.8小结 题 拓展阅读 第8章端到端的网络模型开发 8.1深度学项目需求 8.2深度学项目的开发过程 8.2.1业务问题的定义 8.2.2源数据或数据收集阶段 8.2.3数据存储与管理 8.2.4数据准备和扩充 8.2.5图像样本增强 8.3深度学的建模过程 8.3.1迁移学 8.3.2常见错误/挑战和模型性能提高 8.3.3模型的部署与维护 8.4小结 题 拓展阅读 附录A A1CNN中的主要激活函数与网络层 A2Google Colab
|
![]() |
创新正是领导与员工的区别所在。 —史蒂夫·乔布斯(Steve Jobs) 你的驾驶技术如何?你会比自动驾驶系统的驾驶技术更好吗?或者你认为在医学图像分类方面,某种算法会比专家表现得更好吗?这可能是一个比较棘手的问题。但是,人工智能目前已经在通过图像分析检测肺癌和乳腺癌方面超过了医生。 大自然非常仁慈地赐予了我们视觉、味觉、嗅觉、触觉和听觉的能力。在这些感官之中,视觉的力量让我们能够欣赏世界的美丽,享受色彩,识别家人和所爱之人的面孔,更重要的是享受这个美丽的世界和生活。随着时间的推移,人类提升了大脑的力量,并做出了开创性的发明和发现。车轮或飞机、印刷机或时钟、灯泡或个人计算机——这些创新已经改变了我们的生活、工作、旅行、决策和进步的方式,让生活变得更简单、更容易、更愉快和更安全。 数据科学和深度学能够进一步提升创新的可能性。通过深度学可以复制大自然赋予的视觉力量。计算机通过训练可以执行与人类相同的任务。它可以检测颜色、形状或大小,对猫、狗或马进行分类,或者在道路上行驶——应用案例不胜枚举。这些解决方案适用于零售、制造、金融服务和保险、农业、安全、运输、制药等行业。 本书重点介绍和解释与计算机视觉问题相关的深度学和神经网络概念。书中详细研究卷积神经网络以及各个组成部件和属性,探索各种神经网络架构,介绍了LeNet、AlexNet、VGG、RCNN、Fast RCNN、Faster RCNN、SSD、YOLO、ResNet、Inception、DeepFace和FaceNet等模型的细节。书中使用Python和Keras作为解决方案的开发工具,开发实用的解决方案,用于解决二值图像分类、多类图像分类、目标检测、人脸识别和视频分析等实际问题。所有的代码和数据集都被收录至GitHub repo,读者可以快速访问这些资源。最后一章探讨了深度学开发项目中的所有步骤——从定义业务问题到计算机视觉系统的部署,以及如何处理在制订解决方案时面临的重大错误和问题。本书提供了能够进行更好训练的算法技巧,减少训练时间,能够及时地监测结果并改进解决方案。书中还分享了很多优秀的研究论文和数据集,建议读者深入阅读并获得更多知识。 本书适合想使用深度学来探索和实施计算机视觉解决方案的研究人员和学生。本书面向实际应用,因此推荐给打算探索前沿技术、掌握先进概念、深入了解深度学架构并获得最佳实践和解决方案、迎接计算机视觉挑战的广大计算机专业人士。同时,本书也适用于使用深度学算法解决计算机视觉问题,并想尝试Python的读者。 我要感谢Apress、Aaron、Jessica和Vishwesh,感谢他们对我的信任,赋予我在这个课题上工作的机会。我还要特别感谢我的家人——Yashi、Pakhi和Rudra,感谢他们的大力支持。没有他们的支持,这项工作就不可能完成。 Vaibhav Verdhan 2020年11月于爱尔兰利默里克
|