《表2 训练数据集中的数据样例》
对开放的数据进行随机采样,最终使用50万组对话构成训练集,2.5万组对话构成验证集,测试集中数据为1 000组。数据集中已经人工对对话数据是否存在话题转移做了标注。数据样例如表2所示。标签就是对话对应的标注,黑体字表示可能出现话题转移的位置,标签为1的表示句子描述内容属于同一话题,标签为0的表示出现话题转移,前后内容不连贯。
图表编号 | XD0067683600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.01 |
作者 | 何天文、王红、刘海燕 |
绘制单位 | 山东师范大学信息科学与工程学院、山东省分布式计算软件新技术重点实验室、山东师范大学信息科学与工程学院、山东省分布式计算软件新技术重点实验室、山东师范大学生命科学研究院、山东师范大学信息科学与工程学院、山东省分布式计算软件新技术重点实验室 |
更多格式 | 高清、无水印(增值服务) |