《表1 各模型的F1分数:基于平均教师模型的弱标记半监督声音事件检测》
GCWL-MT(EMA)是基于EMA算法的平均教师模型,GCWL-MT(SWA)是基于SWA算法的平均教师模型,GCWL-MT-SA(SWA)是在GCWL-MT(SWA)基础上使用了SpecAugment数据增强.由表1可以看出采用平均教师策略后的GCWL-MT(EMA)模型与未采用平均教师策略的单一模型GCWBLSTM相比,在开发集和评估集上的F1分数有很大提高,说明平均教师模型可以有效改善系统的性能.采用SWA算法后的GCWL-MT(SWA)模型在开发集和评估集上的F1分数比采用EMA算法的GCWL-MT(EMA)模型分别高出1.2%和1.4%,证明了SWA算法的有效性.基于相同的模型结构,使用数据增强后,F1分数大幅提高,证明了数据增强的有效性.需要说明的是:我们提出的方法使用中值滤波器对标签进行处理,这种方法可以有效地去除短而嘈杂的输出,可以有效滤除一些不重要的噪音,但并不会连接相邻的输出,这严重影响了短暂的、零星出现的事件,例如猫叫、狗叫和洗碗声的预测结果,因此对这类声音事件的预测结果并不太理想.
图表编号 | XD00220342700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 王金甲、杨倩、崔琳、纪绍男 |
绘制单位 | 燕山大学信息科学与工程学院(软件学院)、河北省信息传输与信号处理重点实验室、燕山大学信息科学与工程学院(软件学院)、河北省信息传输与信号处理重点实验室、燕山大学信息科学与工程学院(软件学院)、河北省信息传输与信号处理重点实验室、燕山大学信息科学与工程学院(软件学院)、河北省信息传输与信号处理重点实验室 |
更多格式 | 高清、无水印(增值服务) |