《说话人识别的现代方法与技术》求取 ⇩

前言1

第一章 说话人识别导引1

1.1 说话人识别的基本概念、分类与应用1

1.1.1 说话人识别的分类1

1.1.2 说话人识别的应用领域1

目录1

1.1.3 说话人识别的难点3

1.1.4 本书的特点和内容安排3

1.2.1 语音的发音模型与特征的提取4

1.2 说话人识别原理与说话人识别系统的结构4

1.2.2 说话人识别原理5

1.2.3 说话人识别系统的结构7

1.3 说话人识别系统的性能评价8

1.3.1 评价指标8

1.3.2 错误识别概率和说话人数目的关系9

第二章 特征提取与评价13

2.1 特征提取的基本过程13

2.2.1 线性预测问题14

2.2.2 LP的结构14

2.2 LPC分析与特征提取14

2.2.3 LP的标准方程15

2.2.4 LPC特征的距离度量16

2.2.5 语音信号的短时频谱及利用LPC的求法16

2.3 部分相关系数17

2.3.1 部分相关的概念17

2.3.2 PARCOR系数与声道截面积的关系18

2.3.3 计算部分相关系数的格型算法18

2.3.4 PARCOR系数与线性预测系数的关系20

2.4.1 倒谱特征的含义21

2.4 倒谱特征21

2.4.2 音源激励部分与声道部分的分离22

2.4.3 LPC倒谱特征23

2.4.4 Mel倒谱和二维Mel倒谱24

2.4.5 过渡倒谱特征25

2.4.6 倒谱失真测度25

2.5 LSP特征26

2.5.1 LSP特征的含义26

2.5.2 LSP特征的求法28

2.5.3 LSP类特征28

2.6.1 F比29

2.6 特征的选择与评价29

2.6.2 可分性测度30

第三章 基于模板的说话人识别31

3.1 识别系统的结构31

3.2 动态时间弯折技术31

3.2.1 时间弯折的要求31

3.2.2 时间弯折的限制32

3.2.3 时间弯折的DP方法33

3.2.4 实时识别的VQ方法34

3.3.2 斜率限制的扩展35

3.3.3 对称和非对称加权系数35

3.3.1 端点限制的取消35

3.3 DTW方法的扩充和变形35

3.3.4 交叉排列的DP匹配36

3.3.5 线性匹配37

3.3.6 分段线性匹配38

3.4 特征序列间失真测度的关联修正38

3.5 与噪声特征距离最大的动态时间弯折技术39

3.5.1 特征序列的帧数规整39

3.5.2 模板建立40

3.5.4 基于正交投影原理的时间规整方案41

3.5.3 匹配距离计算与说话人识别41

3.6.1 动态频率弯折42

3.6 频率弯折技术42

3.6.2 去除噪声的频率弯折43

3.7 动态时间弯折的神经预测(NP)方法45

3.7.1 神经预测单元45

3.7.2 神经预测网络的训练与说话人的识别45

第四章 基于VQ的说话人识别48

4.1 矢量量化的基本原理48

4.2.2 初始码书的选定49

4.2 VQ码书设计方法49

4.2.1 LBG算法49

4.3 单VQ说话人识别50

4.4 双VQ说话人测52

4.5 长时平均方法54

4.6 基于VQ-DTW的说话人识别54

4.7 重叠失真测度与基于VQ的说话人识别56

4.7.1 重叠失真测度56

4.7.2 识别实验与结果57

4.8.1 平均失真的表示58

4.8 等方差加权倒谱失真测度与基于VQ的说话人识别58

4.8.2 最佳加权系数的计算59

4.8.3 识别实验与结果60

4.9 说话人个性特征矢量量化的人工神经网络方法60

4.9.1 Kohonen网用于特征矢量的矢量量化60

4.9.2 学习型矢量量化(LVQ)方法61

4.9.3 LVQ用于说话人识别63

第五章 基于GMM的说话人识别64

5.1 高斯混合模型(GMM)64

5.2.1 参数的最大似然估计65

5.2 GMM的训练和学习65

5.2.2 辅助函数66

5.2.3 EM算法67

5.3 基于GMM的说话人识别68

5.3.1 GMM与单高斯分布模型的比较68

5.3.2 GMM初始参数设置69

5.3.3 GMM的阶数M70

5.3.4 VQ与GMM的比较71

5.3.5 GMM模型中的说话人补偿71

5.4.1 集成GMM72

5.4 噪声环境下的集成GMM说话人识别72

5.4.2 SGMM模型参数的最大似然估计73

5.4.3 几种典型的噪声模型74

5.4.4 噪声屏蔽76

5.4.5 识别实验与结果78

第六章 基于HMM的说话人识别80

6.1 隐马尔可夫模型(HMM)80

6.1.1 HMM的基本概念80

6.1.2 概率密度函数的几种典型形式82

6.2.1 HMM参数的优化84

6.2 参数优化与Viterbi识别算法84

6.2.2 前向概率和后向概率85

6.2.3 Viterbi算法86

6.3 自左至右HMM与说话人识别87

6.3.1 自左至右HMM87

6.3.2 模型训练88

6.3.3 初始分段方法90

6.3.4 子状态数M与说话人证实性能91

6.3.5 基于HMM与基于模板的说话人证实性能比较92

6.4.3 说话人证实93

6.4.2 说话人模型的建立93

6.4.1 遍历HMM与类因素划分93

6.4 遍历HMM与说话人识别93

6.4.4 识别实验与结果94

6.5 离散HMM与连续HMM的说话人识别性能比较95

6.5.1 HMM的退化形式96

6.5.2 性能与状态转移的关系97

6.5.3 对训练数据的鲁棒性97

6.6 动态HMM(DHMM)与说话人识别99

6.6.1 动态HMM及其训练99

6.6.2 自左至右DHMM用于说话人辩认101

第七章 基于人工神经网络的说话人识别103

7.1 多层感知器网络103

7.1.1 感知器103

7.1.2 多层感知器网络的分类能力105

7.1.3 多层感知器网络及其训练的BP算法107

7.2 基于多层感知器网络说话人识别的基本问题108

7.2.1 说话人识别系统的结构109

7.2.2 训练数据的均衡问题111

7.2.3 网络训练与网络性能的关系112

7.3.1 特征的矢量量化113

7.3 VQ与BP网结合的说话人识别113

7.3.2 第一级码号变换114

7.3.3 第二级码号变换115

7.3.4 识别系统结构115

7.4 基于径向基函数网络的说话人识别116

7.4.1 径向基函数网络116

7.4.2 中心与宽度选择及说话人证实模型建立117

7.4.3 与VQ方法的比较117

7.5与 HMM结合的基于神经预测网络的说话人识别118

7.5.1 HMM/NP模型118

7.5.2 HMM/NP模型的训练119

7.5.3 1状态与N状态遍历HMM/NP模型的实验与比较120

7.6 基于时间延迟神经网络(TDNN)的说话人识别方法120

7.6.1 TDNN的原理120

7.6.2 TDNN用于说话人识别122

7.7 基于二分类人工神经网络的与文本无关说话人识别124

7.7.1 说话人识别系统的模块化结构124

7.7.2 与文本无关二分类网络建立126

7.8 识别系统结构与神经网络结构127

说话人识别的进一步研究课题130

参考文献133

1994《说话人识别的现代方法与技术》由于是年代较久的资料都绝版了,几乎不可能购买到实物。如果大家为了学习确实需要,可向博主求助其电子版PDF文件(由张军英著 1994 西安:西北大学出版社 出版的版本) 。对合法合规的求助,我会当即受理并将下载地址发送给你。

高度相关资料

现代实验血液学研究方法与技术(1999 PDF版)
现代实验血液学研究方法与技术
1999 北京医科大学;中国协和医科大学联合出版社
人类的别一种智慧:后现代主义与当代小说( PDF版)
人类的别一种智慧:后现代主义与当代小说
生动的说话方法( PDF版)
生动的说话方法
北京:新时代出版社
技术经济与现代化管理方法(1986 PDF版)
技术经济与现代化管理方法
1986 河南省技术经济研究会
现代建筑的艺术与技术( PDF版)
现代建筑的艺术与技术
动人的说话术( PDF版)
动人的说话术
新企业图书出版社
现代科学技术与认识论的发展(1989 PDF版)
现代科学技术与认识论的发展
1989 西安:陕西人民出版社
说话的技巧与艺术(1998 PDF版)
说话的技巧与艺术
1998 北京:中国社会出版社
现代电话应用知识与技术(1995 PDF版)
现代电话应用知识与技术
1995 北京:科学技术文献出版社
现代管理技术方法(1989 PDF版)
现代管理技术方法
1989 北京:中国经济出版社
中国新民主主义革命史  初稿  修订本(1950 PDF版)
中国新民主主义革命史 初稿 修订本
1950 新华书店
汉字识别技术(1992 PDF版)
汉字识别技术
1992 北京:清华大学出版社
现代经济监督技术与方法(1992 PDF版)
现代经济监督技术与方法
1992 北京:经济管理出版社
现代管理方法与技术(1998 PDF版)
现代管理方法与技术
1998 昆明:云南人民出版社
石油机械现代设计技术与方法(1992 PDF版)
石油机械现代设计技术与方法
1992 北京:石油工业出版社