《表3 不同特征下说话人分类性能》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《I-vector聚类字典及注意力机制框架的说话人自适应》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

在该框架得到性能提升的基础上，需要研究分析A-vector所包含的信息及意义.A-vector是对i-vector字典中字典向量线性表达，所以A-vector应该包含说话人相关的信息并且具有区分性.因此通过说话人识别任务来研究A-vector的具体意义以进一步验证该方法的合理性，我们分别用FBank特征，句子级的i-vector以及该框架TDNN+DNN和LSTM+LSTM模型得到的A-vector做说话人识别实验，其中句子级的FBank特征和A-vector通过对该句的所有帧的特征求平均得到.具体做法是首先从测试集的每个说话人中随机选取不重复的20句话，其中10句话用作注册，10句话作为测试，通过余弦打分评价性能.最后结果如表3所示.

图表编号	XD0060258400 严禁用于非法目的
绘制时间	2019.02.01
作者	黄俊、蒋兵、李先刚、郭武生、戴礼荣
绘制单位	中国科学技术大学语音与语言信息处理国家工程实验室、百度在线网络技术(北京)有限公司语音技术部、百度在线网络技术(北京)有限公司语音技术部、安徽广行贝尔数码科技有限责任公司、中国科学技术大学语音与语言信息处理国家工程实验室
更多格式	高清、无水印（增值服务）