《表3 人工评价结果:基于多视角对抗学习的开放域对话生成模型》
此外,对模型结果的人工评价结果平均得分如表3所示。其中,S2S+A模型取得了不错的分数,经过分析具体案例得知,该模型得到的回复多为“嗯”“好的”“是的”“我不知道”这样的普适语句,这与语料库中这些语句出现的概率比较高有很大关系。虽然这些话对于理解对话、延续交流和话题转换等日常对话功能起不到什么作用,没有什么实际意义,但是组成的对话大多易于理解,于是它得到的人工评分也比较高。而本文模型在保证了多样性的条件下,也得到了与Seq2Seq+attention模型差不多,甚至稍高一些的分数。
图表编号 | XD00202094600 严禁用于非法目的 |
---|---|
绘制时间 | 2021.02.05 |
作者 | 张凉、杨燕、陈成才、贺樑 |
绘制单位 | 华东师范大学计算机科学与技术学院、华东师范大学计算机科学与技术学院、上海智臻智能网络科技股份有限公司小i机器人研究院、华东师范大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |