《表1 数据集样例:基于开放域对话系统的自动化评测方法研究》
为了验证本文模型的有效性,选用两种常用的数据集对模型进行验证,分别为Cornell数据集(http://www.cs.cornell.edu/~cristian/Cornell_Movie-Dialogs_Corpus.html)和Reddit数据集(https://www.kaggle.com/reddit/reddit-comments-may-2015/home)。Cornell数据集是由Cornell大学从原始的电影剧本中所提取的对话集合,Reddit数据集则主要由Reddit论坛上的评论数据构成。本文直接使用Github上开源的Cornell和Reddit两种数据集(https://github.com/bshao001/ChatLearner/tree/master/Data),分别包含约4万个问题—回复对和11万个问题—回复对,均为连续的对话数据,其数据集样例如表1所示。
图表编号 | XD00163336500 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 王春柳、杨永辉、赖辉源、邓霏 |
绘制单位 | 中国工程物理研究院计算机应用研究所、中国工程物理研究院计算机应用研究所、中国工程物理研究院计算机应用研究所、中国工程物理研究院计算机应用研究所 |
更多格式 | 高清、无水印(增值服务) |