《表2 深度聚类分离指标估计》

《表2 深度聚类分离指标估计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于聚类分析与说话人识别的语音跟踪》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

BLSTM相比于LSTM,embedding维度K=40,在其他参数保持不变的情况下,训练的时间复杂度更高,所以低延迟版本中将采用LSTM网络结构,如表2所示,采用BLSTM的语音分离质量明显高于窗长为8 ms与32 ms的LSTM,因为BLSTM更能挖掘语音上下文的相关性,提高语音的分离质量,而采用1.5 s的缓存时长的低延迟版本中,在降低采样率的同时,SDR仅下降2.3 d B。