《表1 音频数据：基于Transformer的越南语连续语音识别》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于Transformer的越南语连续语音识别》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

语料库使用文献[17]采集的数据，由50多个越南本地人发音构成。如表1所示，该语料库分为训练集和测试集两个部分:训练集包含46个说话人（其中22个男性，24个女性）的语音，共11 660个句子总时长大约为15个小时。测试集包含19个说话人（12个男性，7个女性），760个句子总时长大约为50分钟。训练集和测试集的说话人都不相同。录音在安静的条件下进行，得到的音频质量比较高。

图表编号	XD00227417300 严禁用于非法目的
绘制时间	2020.04.01
作者	刘佳文、屈丹、杨绪魁、张昊、唐君
绘制单位	信息工程大学、信息工程大学、信息工程大学、信息工程大学、信息工程大学
更多格式	高清、无水印（增值服务）