《表2 训练数据集中的数据样例》

《表2 训练数据集中的数据样例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于词语相关性的对话系统话题分割》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对开放的数据进行随机采样,最终使用50万组对话构成训练集,2.5万组对话构成验证集,测试集中数据为1 000组。数据集中已经人工对对话数据是否存在话题转移做了标注。数据样例如表2所示。标签就是对话对应的标注,黑体字表示可能出现话题转移的位置,标签为1的表示句子描述内容属于同一话题,标签为0的表示出现话题转移,前后内容不连贯。