语音识别原理与应用+Kaldi语音识别实战+深度学习 语音识别技术实践+语音信号处理+图解语音识别pdf下载pdf下载

语音识别原理与应用+Kaldi语音识别实战+深度学习 语音识别技术实践+语音信号处理+图解语音识别百度网盘pdf下载

作者:
简介:本篇主要提供语音识别原理与应用+Kaldi语音识别实战+深度学习 语音识别技术实践+语音信号处理+图解语音识别pdf下载
出版社:
出版时间:
pdf下载价格:0.00¥

免费下载


书籍下载


内容介绍

语音识别:原理与应用(全彩)

洪青阳,李琳 著

出版社: 电子工业出版社

ISBN:9787121385025

定价 128元

本书系统地介绍了语音识别的原理和应用,全书共分 15 章,原理部分涵盖声学特征、隐马尔可夫模型(HMM)、高斯混合模型(GMM)、深度神经网络(DNN)、语言模型和加权有限状态转换器(WFST),重点描述了 GMM-HMM、DNN-HMM 和端到端(E2E)三种语音识别框架。本书应用部分包含 Kaldi、Espnet、工业应用实践介绍,内容主要来自工程经验,极具实用性。

本书可以作为普通高等学校人工智能、计算机科学与技术、电子信息工程、自动化等的本科生及研究生教材,也适合作为从事智能语音系统的科研和工程技术人员的参考用书。

Kaldi语音识别实战   


作  译  者:陈果果 等


出版时间:2020-03千 字 数:338


版     次:01-01 页 数:336开       本:16开 装      帧:


I S B N :9787121378744换       版:


纸质书定价:¥89.0 


Kaldi是目前语音识别领域,广受欢迎并流行的开源工具包。Kaldi设计之初对通用性,可拓展性等一系列源代码层次的考量,大大降低了Kaldi作为语音识别工具包的门槛, 同时拥有非常完整的语音识别系统训练脚本。本书通过对Kaldi已有训练脚本的梳理和引导,帮助读者快速搭建可用的语音识别系统。



书名: 语音信号处理(第3版)


作者: 韩纪庆、张磊、郑铁然

定价: 89.00元

ISBN编号: 9787302517603开本: 16开

出版社名称: 清华大学出版社


本书系统地介绍语音信号处理的基础、概念、原理、方法与应用。全书共分9章。1章介绍语音信号处理及其发展过程; 2章介绍语音信号的产生与人类听觉的机理,传统的线性语音产生模型,以及非线性语音产生模型; 3章从语音信号的时域特征入手,引入时频分析的思想,并进一步阐述时频分析中短时傅里叶变换和小波变换在语音信号特征分析中的应用,后对广泛使用的倒谱特征以及同态解卷积进行介绍; 4章介绍语音信号的线性预测原理、解法、几种推演方法以及线谱对分析法; 5章介绍语音编码的相关知识,包括语音的波形编码、极低速率语音编码技术,以及相关编码器的性能指标和评测方法; 6章介绍语音识别的基本内容,从基于矢量量化的识别技术到动态时间归正的识别技术,从隐马尔可夫模型技术到基于深度学习的语音识别技术,从孤立词识别到连接词识别及连续语音识别技术,再到关键词检出技术,后还介绍新兴起的语音识别应用技术,以及用于HMM系统构建的HTK工具和用于深度学习系统构建的Kaldi工具等; 7章介绍说话人识别的基本内容,从基于GMM?UBM的识别技术到基于支持向量机的识别技术,从基于联合因子分析的识别技术到基于i?vector的识别技术,以及近年来受到关注的基于深度学习的识别技术等; 8章介绍顽健语音识别技术,从影响语音识别性能的环境变化因素分析开始,介绍噪声环境下顽健语音识别技术,以及变异语音识别的技术; 9章介绍语音的基本原理、线性预测、共振峰以及汉语按规则,以及基于HMM的技术等内容。

本书可作为高等院校计算机应用、信号与信息处理、通信与电子系统等及学科的高年级本科生、研究生教材,也可供该领域的科研及工程技术人员参考。




书名: 深度学习:语音识别技术实践

作者: 柳若边

定价: 89.00元

ISBN编号: 9787302516927

开本: 16开


出版社名称: 清华大学出版社


 内容简介

语音识别已经逐渐进入人们的日常生活。语音识别技术是涉及语言、计算机、数学等领域的交叉学科。《深度学习:语音识别技术实践》介绍了包括C#、Perl、Python、Java在内的多种编程语言实践,开源语音识别工具包Kaldi的使用与代码分析,深度学习的开发环境搭建,卷积神经网络,以及语音识别中常见的语言模型——N元模型和依存模型等,让读者快速了解语音识别基础,掌握开发语音识别程序的算法。



《深度学习:语音识别技术实践》从语音识别的基础开始讲起,并辅以翔实的案例,既适合需要具体实现语音识别的程序员使用,也适合有一定机器学习或语音识别基础的学生、研究者或从业者阅读。




商品名:图解语音识别

ISBN:9787115528711

定价:59

出版社:人民邮电出版社

作者:[日]荒木雅弘

出版时间:2020-04-01

《图解语音识别》从语音识别的历史和基础知识讲起,通过图解的方式对语音识别技术进行了尽可能简单的解释。内容涉及语音学基础知识、统计模式识别、有限状态自动机、语音特征的提取、声学模型和语言模型、搜索算法和基于WFST 的语音识别技术等。
此外,本书没有将语音识别限定在“将语音转换成文本”的传统范畴内,而是在此基础上,还讲解了从语音识别技术到人机对话技术的演进过程和方法。内容涉及语义分析和语音对话系统的实现。