《表3 本文选取的关键词列表》
本文使用的数据集是清华大学的30小时中文语音数据集THCHS-30[22,23].THCHS-30数据集中收集的都是汉语普通话语句,采样频率为16kHz,采样大小为16bits.数据集中训练音频时长为25h,测试音频时长为6h.本文使用此数据集进行关键词检测,首先挑选了部分的词汇作为系统设定的关键词.训练集包含2409个已标注的关键词,测试集包含587个已标注关键词.本文选取的关键词列表如表3所示.
图表编号 | XD00212219300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 陈太波、张翠芳 |
绘制单位 | 西南交通大学信息科学与技术学院、西南交通大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |