《表3 自然手语和对应汉语的文本示例》
文本调序采用的训练数据集是维基百科问答语料[16],该语料总共含有150万条预先过滤过的、高质量问题和答案,每个问题属于一个类别,总共有492个类别,其中频率达到或超过10次的类别有434个,语料内容以日常交流用语为主,基本涵盖了常见领域。本次实验对该语料截取50万条数据并只保留“title”“desc”“answer”属性的内容进行训练。测试数据是《中国手语日常会话》[17]的日常用语500条,部分示例如表3所示。
图表编号 | XD00201809800 严禁用于非法目的 |
---|---|
绘制时间 | 2021.03.10 |
作者 | 龙广玉、陈益强、邢云冰 |
绘制单位 | 湘潭大学计算机学院·网络空间安全学院、湘潭大学计算机学院·网络空间安全学院、中国科学院计算技术研究所、中国科学院计算技术研究所 |
更多格式 | 高清、无水印(增值服务) |