《表3 不同特征下说话人分类性能》

《表3 不同特征下说话人分类性能》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《I-vector聚类字典及注意力机制框架的说话人自适应》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在该框架得到性能提升的基础上,需要研究分析A-vector所包含的信息及意义.A-vector是对i-vector字典中字典向量线性表达,所以A-vector应该包含说话人相关的信息并且具有区分性.因此通过说话人识别任务来研究A-vector的具体意义以进一步验证该方法的合理性,我们分别用FBank特征,句子级的i-vector以及该框架TDNN+DNN和LSTM+LSTM模型得到的A-vector做说话人识别实验,其中句子级的FBank特征和A-vector通过对该句的所有帧的特征求平均得到.具体做法是首先从测试集的每个说话人中随机选取不重复的20句话,其中10句话用作注册,10句话作为测试,通过余弦打分评价性能.最后结果如表3所示.