《表1 数据集样例：基于开放域对话系统的自动化评测方法研究》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于开放域对话系统的自动化评测方法研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

为了验证本文模型的有效性，选用两种常用的数据集对模型进行验证，分别为Cornell数据集（http：//www.cs.cornell.edu/～cristian/Cornell＿Movie-Dialogs＿Corpus.html）和Reddit数据集（https：//www.kaggle.com/reddit/reddit-comments-may-2015/home）。Cornell数据集是由Cornell大学从原始的电影剧本中所提取的对话集合，Reddit数据集则主要由Reddit论坛上的评论数据构成。本文直接使用Github上开源的Cornell和Reddit两种数据集（https：//github.com/bshao001/ChatLearner/tree/master/Data），分别包含约4万个问题—回复对和11万个问题—回复对，均为连续的对话数据，其数据集样例如表1所示。

图表编号	XD00163336500 严禁用于非法目的
绘制时间	2020.05.01
作者	王春柳、杨永辉、赖辉源、邓霏
绘制单位	中国工程物理研究院计算机应用研究所、中国工程物理研究院计算机应用研究所、中国工程物理研究院计算机应用研究所、中国工程物理研究院计算机应用研究所
更多格式	高清、无水印（增值服务）