《表1 数据集样例:基于开放域对话系统的自动化评测方法研究》

《表1 数据集样例:基于开放域对话系统的自动化评测方法研究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于开放域对话系统的自动化评测方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证本文模型的有效性,选用两种常用的数据集对模型进行验证,分别为Cornell数据集(http://www.cs.cornell.edu/~cristian/Cornell_Movie-Dialogs_Corpus.html)和Reddit数据集(https://www.kaggle.com/reddit/reddit-comments-may-2015/home)。Cornell数据集是由Cornell大学从原始的电影剧本中所提取的对话集合,Reddit数据集则主要由Reddit论坛上的评论数据构成。本文直接使用Github上开源的Cornell和Reddit两种数据集(https://github.com/bshao001/ChatLearner/tree/master/Data),分别包含约4万个问题—回复对和11万个问题—回复对,均为连续的对话数据,其数据集样例如表1所示。