《表1 音频数据:基于Transformer的越南语连续语音识别》
语料库使用文献[17]采集的数据,由50多个越南本地人发音构成。如表1所示,该语料库分为训练集和测试集两个部分:训练集包含46个说话人(其中22个男性,24个女性)的语音,共11 660个句子总时长大约为15个小时。测试集包含19个说话人(12个男性,7个女性),760个句子总时长大约为50分钟。训练集和测试集的说话人都不相同。录音在安静的条件下进行,得到的音频质量比较高。
图表编号 | XD00227417300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 刘佳文、屈丹、杨绪魁、张昊、唐君 |
绘制单位 | 信息工程大学、信息工程大学、信息工程大学、信息工程大学、信息工程大学 |
更多格式 | 高清、无水印(增值服务) |