新書推薦:
《
算法图解(第2版)
》
售價:NT$
356.0
《
科学的奇幻之旅
》
售價:NT$
352.0
《
画艺循谱:晚明的画谱与消闲
》
售價:NT$
653.0
《
新民说·现实政治史:从马基雅维利到基辛格
》
售價:NT$
454.0
《
宽容是件奢侈品(人生360度·一分钟经典故事)
》
售價:NT$
203.0
《
甲骨拼合六集
》
售價:NT$
1520.0
《
视觉美食家:商业摄影实战与创意解析
》
售價:NT$
602.0
《
中国经济发展的新阶段:机会与选择
》
售價:NT$
454.0
|
內容簡介: |
本书系统介绍了语音信号处理的基础、原理、方法、应用、新理论、新成果与新技术、前沿领域及研究进展,以及背景知识、研究现状、应用前景和发展趋势。全书分三篇共18章。篇语音信号处理基础,包括第1章绪论,第2章语音信号处理的基础知识;第二篇语音信号分析,包括第3章时域分析,第4章短时傅里叶分析,第5章倒谱分析与同态滤波,第6章线性预测分析,第7章语音信号的非线性分析,第8章语音声学参数检测与估计,第9章矢量量化,第10章隐马尔可夫模型;第三篇语音信号处理技术与应用,包括第11章语音编码,第12章语音合成,第13章语音识别,第14章说话人识别和语种辨识,第15章智能信息处理技术在语音信号处理中的应用,第16章语音增强,第17章麦克风阵列语音信号处理,第18章语音信息对抗。本书体系完整,结构严谨,系统性强,原理阐述透彻,内容繁简适中,丰富而新颖,联系实际应用。本书可作为高等院校信号与信息处理、通信与电子工程、电路与系统、模式识别与人工智能等专业及学科高年级本科生及研究生的教材,也可供该领域的科研及工程技术人员参考。
|
關於作者: |
胡航,哈尔滨工业大学电子信息学院,副教授,主要从事信号处理方面的教学、科研工作,编著出版《语音信号处理》等教材多部,
|
目錄:
|
目 录篇 语音信号处理基础 第1章 绪论11.1 语音信号处理的发展历史11.2 语音信号处理的主要研究内容及 发展概况31.3 本书的内容7思考与复习题8第2章 语音信号处理的基础知识92.1 概述92.2 语音产生的过程92.3 语音信号的特性122.3.1 语言和语音的基本特性122.3.2 语音信号的时间波形和频谱特性132.3.3 语音信号的统计特性152.4 语音产生的线性模型162.4.1 激励模型172.4.2 声道模型182.4.3 辐射模型202.4.4 语音信号数字模型202.5 语音产生的非线性模型212.5.1 FM-AM模型的基本原理222.5.2 Teager能量算子222.5.3 能量分离算法232.5.4 FM-AM模型的应用242.6 语音感知242.6.1 听觉系统242.6.2 神经系统252.6.3 语音感知26思考与复习题29 第二篇 语音信号分析 第3章 时域分析303.1 概述303.2 数字化和预处理313.2.1 取样率和量化字长的选择313.2.2 预处理333.3 短时能量分析343.4 短时过零分析363.5 短时相关分析393.5.1 短时自相关函数393.5.2 修正的短时自相关函数403.5.3 短时平均幅差函数413.6 语音端点检测423.6.1 双门限前端检测433.6.2 多门限过零率前端检测433.6.3 基于FM-AM模型的端点检测433.7 基于高阶累积量的语音端点检测443.7.1 噪声环境下的端点检测443.7.2 高阶累积量与高阶谱443.7.3 基于高阶累积量的端点检测46思考与复习题48第4章 短时傅里叶分析504.1 概述504.2 短时傅里叶变换504.2.1 短时傅里叶变换的定义504.2.2 傅里叶变换的解释514.2.3 滤波器的解释544.3 短时傅里叶变换的取样率554.4 语音信号的短时综合564.4.1 滤波器组求和法564.4.2 FFT求和法584.5 语谱图59思考与复习题61第5章 倒谱分析与同态滤波625.1 概述625.2 同态信号处理的基本原理625.3 复倒谱和倒谱635.4 语音信号两个卷积分量复倒谱的性质645.4.1 声门激励信号645.4.2 声道冲激响应序列655.5 避免相位卷绕的算法665.5.1 微分法675.5.2 小相位信号法675.5.3 递推法695.6 语音信号复倒谱分析实例705.7 Mel频率倒谱系数72思考与复习题73第6章 线性预测分析746.1 概述746.2 线性预测分析的基本原理746.2.1 基本原理746.2.2 语音信号的线性预测分析756.3 线性预测方程组的建立766.4 线性预测分析的解法(1)—自相关和 协方差法776.4.1 自相关法786.4.2 协方差法796.4.3 自相关和协方差法的比较806.5 线性预测分析的解法(2)—格型法816.5.1 格型法基本原理816.5.2 格型法的求解836.6 线性预测分析的应用—LPC谱估计和 LPC复倒谱856.6.1 LPC谱估计856.6.2 LPC复倒谱876.6.3 LPC谱估计与其他谱分析方法的 比较886.7 线谱对(LSP)分析896.7.1 线谱对分析原理896.7.2 线谱对参数的求解916.8 极零模型91思考与复习题93第7章 语音信号的非线性分析947.1 概述947.2 时频分析947.2.1 短时傅里叶变换的局限957.2.2 时频分析967.3 小波分析977.3.1 概述977.3.2 小波变换的定义977.3.3 典型的小波函数997.3.4 离散小波变换1007.3.5 小波多分辨分析与Mallat算法1007.4 基于小波的语音分析1017.4.1 语音分解与重构1017.4.2 清/浊音判断1027.4.3 语音去噪1027.4.4 听觉系统模拟1037.4.5 小波包变换在语音端点检测中的应用1037.5 混沌与分形1047.6 基于混沌的语音分析1057.6.1 语音信号的混沌性1057.6.2 语音信号的相空间重构1067.6.3 语音信号的Lyapunov指数1087.6.4 基于混沌的语音、噪声判别1097.7 基于分形的语音分析1107.7.1 概述1107.7.2 语音信号的分形特征1107.7.3 基于分形的语音分割1117.8 压缩感知1137.9 语音信号的压缩感知1147.9.1 语音信号的稀疏性1147.9.2 语音压缩感知的实现1147.9.3 需要进一步解决的问题116思考与复习题117第8章 语音声学参数检测与估计1188.1 基音估计1188.1.1 自相关法1198.1.2 并行处理法1218.1.3 倒谱法1228.1.4 简化逆滤波法1248.1.5 高阶累积量法1278.1.6 小波变换法1278.1.7 基音检测的后处理1288.2 共振峰估计1298.2.1 带通滤波器组法1298.2.2 DFT法1308.2.3 倒谱法1318.2.4 LPC法1338.2.5 FM-AM模型法134思考与复习题135第9章 矢量量化1369.1 概述1369.2 矢量量化的基本原理1379.3 失真测度1389.3.1 欧氏距离—均方误差1399.3.2 LPC失真测度1399.3.3 识别失真测度1419.4 矢量量化器和码本的设计1419.4.1 矢量量化器设计的两个条件1419.4.2 LBG算法1429.4.3 初始码书生成1429.5 降低复杂度的矢量量化系统1439.5.1 无记忆的矢量量化系统1449.5.2 有记忆的矢量量化系统1469.6 语音参数的矢量量化1489.7 智能信息处理在矢量量化中的应用策略149思考与复习题150第10章 隐马尔可夫模型15110.1 概述15110.2 隐马尔可夫模型的引入15210.3 隐马尔可夫模型的定义15410.4 隐马尔可夫模型三个问题的求解15510.4.1 概率的计算15610.4.2 HMM的识别15810.4.3 HMM的训练15910.4.4 EM算法16010.5 HMM的选取16110.5.1 HMM的类型选择16110.5.2 输出概率分布的选取16210.5.3 状态数的选取16210.5.4 初值选取16210.5.5 训练准则的选取16410.6 HMM应用与实现中的一些问题16510.6.1 数据下溢16510.6.2 多输出(观察矢量序列)情况16510.6.3 训练数据不足16610.6.4 考虑状态持续时间的HMM16710.7 HMM的结构和类型16910.7.1 HMM的结构16910.7.2 HMM的类型17110.7.3 按输出形式分类17210.8 HMM的相似度比较173思考与复习题174 第三篇 语音信号处理技术与应用 第11章 语音编码17511.1 概述17511.2 语音信号的压缩编码原理17711.2.1 语音压缩的基本原理17711.2.2 语音通信中的语音质量17811.2.3 两种压缩编码方式17911.3 语音信号的波形编码17911.3.1 PCM及APCM17911.3.2 预测编码及自适应预测编码18211.3.3 ADPCM及ADM18411.3.4 子带编码(SBC)18611.3.5 自适应变换编码(ATC)18811.4 声码器19011.4.1 概述19011.4.2 声码器的基本结构19111.4.3 通道声码器19111.4.4 同态声码器19311.5 LPC声码器19411.5.1 LPC参数的变换与量化19511.5.2 LPC-1019611.5.3 LPC-10e19711.5.4 变帧率LPC声码器19811.6 各种常规语音编码方法的比较19811.6.1 波形编码的信号压缩技术19811.6.2 波形编码与声码器的比较19911.6.3 各种声码器的比较19911.7 基于LPC模型的混合编码20011.7.1 混合编码采用的技术20111.7.2 MPLPC20311.7.3 RPELPC20611.7.4 CELP20711.7.5 CELP的改进形式21011.7.6 基于分形码本的CELP21211.8 基于正弦模型的混合编码21311.8.1 正弦变换编码21411.8.2 多带激励(MBE)编码21411.9 极低速率语音编码21611.9.1 (400~1.2k)b/s数码率的声码器21611.9.2 识别-合成型声码器21711.10 语音压缩感知编码21811.11 语音编码的性能指标21911.12 语音编码的质量评价22011.12.1 主观评价方法22111.12.2 客观评价方法22211.12.3 主客观评价方法的结合22511.12.4 基于多重分形的语音质量评价22611.13 语音编码国际标准22711.14 语音编码与图像编码的关系227小结228思考与复习题229第12章 语音合成23012.1 概述23012.2 语音合成原理23112.2.1 语音合成的方法23112.2.2 语音合成的系统特性23312.3 共振峰合成23312.3.1 共振峰合成原理23312.3.2 共振峰合成实例23512.4 LPC合成23612.5 PSOLA语音合成23812.5.1 概述23812.5.2 PSOLA的原理23812.5.3 PSOLA的实现23912.5.4 PSOLA的改进24112.5.5 PSOLA语音合成系统的发展24112.6 文语转换系统24212.6.1 组成与结构24212.6.2 文本分析24212.6.3 韵律控制24412.6.4 语音合成24612.6.5 TTS系统的一些问题24712.7 基于HMM的参数化语音合成24812.8 语音合成的发展趋势25212.9 语音合成硬件简介253思考与复习题254第13章 语音识别25513.1 概述25513.2 语音识别原理25813.3 动态时间规整26213.4 基于有1
|
|