《表2 深度聚类分离指标估计》
BLSTM相比于LSTM,embedding维度K=40,在其他参数保持不变的情况下,训练的时间复杂度更高,所以低延迟版本中将采用LSTM网络结构,如表2所示,采用BLSTM的语音分离质量明显高于窗长为8 ms与32 ms的LSTM,因为BLSTM更能挖掘语音上下文的相关性,提高语音的分离质量,而采用1.5 s的缓存时长的低延迟版本中,在降低采样率的同时,SDR仅下降2.3 d B。
图表编号 | XD00134292600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 郝敏、刘航、李扬、简单、王俊影 |
绘制单位 | 广东工业大学机电工程学院、广东工业大学机电工程学院、广东工业大学机电工程学院、广东工业大学机电工程学院、广东工业大学机电工程学院 |
更多格式 | 高清、无水印(增值服务) |