本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源,一旦发现资源涉及侵权,将立即删除。希望所有用户一同监督并反馈问题,如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正
这是 本系统性地介绍声纹识别、声纹分割
聚类及声纹在语音识别、语音合成、人声分离等领
域中应用的技术书。本书内容全面且紧随时代前沿
,不仅涵盖了早至 20世纪 60 年代的经典方法,
而且以大量篇幅着重介绍了深度学 的 新技
术。本书注重理论与实践的结合,除了配备大量实
践案例与习题,还有专门章节介绍声纹技术在实际
工程部署方面的诸多课题。本书面向大学与研究机
构的学生、教研人员,以及企 从事声纹技
术相关工作的工程师、架构师和产品经理等。
1 声纹技术的前世今生
1.1 什么是声纹
1.2 早的声纹技术
1.3 声纹技术的发展
1.3.1 声纹技术与音频信号处理
1.3.2 模板匹配方法
1.3.3 早期统计学方法
1.3.4 高斯混合模型
1.3.5 联合因子分析与 i-vector
1.4 大变革:深度学 的来临
1.5 新的机遇:智能语音助手的普及
2 音频信号处理基础
2.1 欲懂声纹,先学音频
2.2 声学基础
2.2.1 语音的产生
2.2.2 正弦波
2.2.3 频谱
2.2.4 听觉与感知
2.2.5 听觉的非线性
2.3 音频信号基础概念
2.3.1 模拟音频信号
2.3.2 模拟转数字:采样与量化
2.3.3 音频编码
2.3.4 音频文件格式
2.3.5 动手实践:SoX 程序
2.4 从信号到特征:短时分析
2.4.1 传统特征分析的不足
2.4.2 分帧
2.4.3 窗函数处理
2.4.4 帧叠加与帧采样
2.5 常用的音频特征
2.5.1 时域特征
2.5.2 从时域到频域:傅里叶变换
2.5.3 频谱、倒谱、时频谱和功率谱
2.5.4 感知线性预测
2.5.5 梅尔倒谱系数
2.5.6 功率正则化倒谱系数
2.5.7 动手实践:用 LibROSA 提取 MFCC 特征
3 声纹识别技术
3.1 声纹识别:声纹技术的核心
3.1.1 名称与概念
3.1.2 按任务分类
3.1.3 按文本内容分类
3.1.4 系统流程
3.2 声纹识别的评价指标
3.2.1 相似匹配
3.2.2 录入集与验证集
3.2.3 ROC 曲线及曲线下面积
3.2.4 等错率
3.2.5 小检测代价函数