《解析深度学习语音识别实践俞栋邓力》[49M]百度网盘|pdf下载|亲测有效
《解析深度学习语音识别实践俞栋邓力》[49M]百度网盘|pdf下载|亲测有效

解析深度学习语音识别实践俞栋邓力 pdf下载

出版社 网书网图书专营店
出版年 2025
页数 390页
装帧 精装
评分 9.1(豆瓣)
8.99¥ 10.99¥

内容简介

本篇主要提供解析深度学习语音识别实践俞栋邓力电子书的pdf版本下载,本电子书下载方式为百度网盘方式,点击以上按钮下单完成后即会通过邮件和网页的方式发货,有问题请联系邮箱ebook666@outlook.com

基本信息(以实物为准)

书    名

   解析深度学习 语音识别实践

外文书名

  

出版社

  电子工业出版社

作    者

   俞栋,邓力

定    价

  109.00元

出版时间

   2020-10-01

I S B N

  9787121287961

套装书

   否

重    量

  KG

装    帧

   平装

版    次

  1

字    数

   426000

配套资源

页    数

   336

开      本

  16开

 

内容简介(以实物为准)


         本书是首部介绍语音识别中深度学习技术细节的专著。全书首先概要介绍了传统语音识别理论和经典的深度神经网络核心算法。接着全面而深入地介绍了深度学习在语音识别中的应用,包括“深度神经网络-隐马尔可夫混合模型”的训练和优化,特征表示学习、模型融合、自适应,以及以循环神经网络为代表的若干先进深度学习技术。本书适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读,所有的算法及技术细节都提供了详尽的参考文献,给出了深度学习在语音识别中应用的全景。


目    录(以实物为准)


译者序 iv

序 vii

前言 ix

术语缩写 xxii

符号 xxvii

第 1 章 简介 1

1.1 自动语音识别:更好的沟通之桥 . . . . . . . . . . . . . . . . . . . . . . . 1

1.1.1 人类之间的交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.1.2 人机交流 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

1.2 语音识别系统的基本结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

1.3 全书结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

1.3.1 第一部分:传统声学模型 . . . . . . . . . . . . . . . . . . . . . . 6

1.3.2 第二部分:深度神经网络 . . . . . . . . . . . . . . . . . . . . . . 6

1.3.3 第三部分:语音识别中的 DNN-HMM 混合系统 . . . . . . . . . . 7

1.3.4 第四部分:深度神经网络中的表征学习 . . . . . . . . . . . . . . 7

1.3.5 第五部分:高级的深度模型 . . . . . . . . . . . . . . . . . . . . . 7

第一部分 传统声学模型 9

第 2 章 混合高斯模型 11

2.1 随机变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

2.2 高斯分布和混合高斯随机变量 . . . . . . . . . . . . . . . . . . . . . . . . 12

2.3 参数估计 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2.4 采用混合高斯分布对语音特征建模 . . . . . . . . . . . . . . . . . . . . . 16

第 3 章 隐马尔可夫模型及其变体 19

3.1 介绍 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

3.2 马尔可夫链 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

3.3 序列与模型 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

3.3.1 隐马尔可夫模型的性质 . . . . . . . . . . . . . . . . . . . . . . . . 23

3.3.2 隐马尔可夫模型的仿真 . . . . . . . . . . . . . . . . . . . . . . . . 24

3.3.3 隐马尔可夫模型似然度的计算 . . . . . . . . . . . . . . . . . . . . 24

3.3.4 计算似然度的高效算法 . . . . . . . . . . . . . . . . . . . . . . . . 26

3.3.5 前向与后向递归式的证明 . . . . . . . . . . . . . . . . . . . . . . 27

3.4 期望*大化算法及其在学习 HMM 参数中的应用 . . . . . . . . . . . . . 28

3.4.1 期望*大化算法介绍 . . . . . . . . . . . . . . . . . . . . . . . . . 28

3.4.2 使用 EM 算法来学习 HMM 参数——Baum-Welch 算法 . . . . . . 30

3.5 用于解码 HMM 状态序列的维特比算法 . . . . . . . . . . . . . . . . . . . 34

3.5.1 动态规划和维特比算法 . . . . . . . . . . . . . . . . . . . . . . . . 34

3.5.2 用于解码 HMM 状态的动态规划算法 . . . . . . . . . . . . . . . . 35

3.6 隐马尔可夫模型和生成语音识别模型的变体 . . . . . . . . . . . . . . . . 37

3.6.1 用于语音识别的 GMM-HMM 模型 . . . . . . . . . . . . . . . . . 38

3.6.2 基于轨迹和隐藏动态模型的语音建模和识别 . . . . . . . . . . . . 39

3.6.3 使用生成模型 HMM 及其变体解决语音识别问题 . . . . . . . . . 40

第二部分 深度神经网络 43

第 4 章 深度神经网络 45

4.1 深度神经网络框架 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

4.2 使用误差反向传播来进行参数训练 . . . . . . . . . . . . . . . . . . . . . 48

4.2.1 训练准则 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

4.2.2 训练算法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4.3 实际应用 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.3.1 数据预处理 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

4.3.2 模型初始化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.3.3 权重衰减 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.3.4 丢弃法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.3.5 批量块大小的选择 . . . . . . . . . . . . . . . . . . . . . . . . . . 58

4.3.6 取样随机化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4.3.7 惯性系数 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

4.3.8 学习率和停止准则 . . . . . . . . . . . . . . . . . . . . . . . . . . 61

4.3.9 网络结构 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

4.3.10 可复现性与可重启性 . . . . . . . . . . . . . . . . . . . . . . . . . 62

第 5 章 高级模型初始化技术 65

5.1 受限玻尔兹曼机 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.1.1 受限玻尔兹曼机的属性 . . . . . . . . . . . . . . . . . . . . . . . . 67

5.1.2 受限玻尔兹曼机参数学习 . . . . . . . . . . . . . . . . . . . . . . 70

5.2 深度置信网络预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5.3 降噪自动编码器预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76

5.4 鉴别性预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5.5 混合预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

5.6 采用丢弃法的预训练 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

第三部分 语音识别中的深度神经网络–隐马尔可夫混合模型 81

第 6 章 深度神经网络–隐马尔可夫模型混合系统 83