《表1 原料化学成分:基于word2vec的语音识别后文本纠错》

《表1 原料化学成分:基于word2vec的语音识别后文本纠错》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于word2vec的语音识别后文本纠错》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

如表1语音识别结果所示:实验中把误识别词分成3类:第一类,识别后词语拼音没有发现变化;第二类,识别后词语长度发生变化;第三类,识别后词语长度不变,但拼音发生变化。所选的音频一是教师在课堂上直接录制的,虽然语音听上去吐字清晰,语速也适当,但从视频中分离的音频仍然含有各种杂音,比如老师的翻书声、话筒的嘶嘶声、学生的窃窃私语声。语音识别的最终结果吞音、吐音现象很明显,在误识别的词集中,仅有26.24%是替换错误,例如“就是所有的活动、所有的工作都是需要受到控制的,所有的人都需要受到控制,不是说你是领导就不受控制,你是部门主管就不受控制,那不行。”被识别成了“活动,所有的工作是需要适当控制的,所有的人都说你是领导就不受控制,你是部门主管就不行。”。所选的第二个和第三个音频则虽然是在安静环境下录制的,但也存在一定杂音。