《表2 深度聚类分离指标估计》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于聚类分析与说话人识别的语音跟踪》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

BLSTM相比于LSTM，embedding维度K=40，在其他参数保持不变的情况下，训练的时间复杂度更高，所以低延迟版本中将采用LSTM网络结构，如表2所示，采用BLSTM的语音分离质量明显高于窗长为8 ms与32 ms的LSTM，因为BLSTM更能挖掘语音上下文的相关性，提高语音的分离质量，而采用1.5 s的缓存时长的低延迟版本中，在降低采样率的同时，SDR仅下降2.3 d B。

图表编号	XD00134292600 严禁用于非法目的
绘制时间	2020.04.01
作者	郝敏、刘航、李扬、简单、王俊影
绘制单位	广东工业大学机电工程学院、广东工业大学机电工程学院、广东工业大学机电工程学院、广东工业大学机电工程学院、广东工业大学机电工程学院
更多格式	高清、无水印（增值服务）