《表3 不同特征下说话人分类性能》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《I-vector聚类字典及注意力机制框架的说话人自适应》
在该框架得到性能提升的基础上,需要研究分析A-vector所包含的信息及意义.A-vector是对i-vector字典中字典向量线性表达,所以A-vector应该包含说话人相关的信息并且具有区分性.因此通过说话人识别任务来研究A-vector的具体意义以进一步验证该方法的合理性,我们分别用FBank特征,句子级的i-vector以及该框架TDNN+DNN和LSTM+LSTM模型得到的A-vector做说话人识别实验,其中句子级的FBank特征和A-vector通过对该句的所有帧的特征求平均得到.具体做法是首先从测试集的每个说话人中随机选取不重复的20句话,其中10句话用作注册,10句话作为测试,通过余弦打分评价性能.最后结果如表3所示.
图表编号 | XD0060258400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.01 |
作者 | 黄俊、蒋兵、李先刚、郭武生、戴礼荣 |
绘制单位 | 中国科学技术大学语音与语言信息处理国家工程实验室、百度在线网络技术(北京)有限公司语音技术部、百度在线网络技术(北京)有限公司语音技术部、安徽广行贝尔数码科技有限责任公司、中国科学技术大学语音与语言信息处理国家工程实验室 |
更多格式 | 高清、无水印(增值服务) |