《表2 问题长度和答案片段数量统计》
从图中可以看到答案由多个片段组成的情况占比高达37%,其中有20%由两个答案片段组成,17%由多于两个答案片段组成.这说明在实际搜索场景中,多个片段的情况较为常见.我们统计答案对应的答案片段数量为1~5时,对应的平均文本长度如表2所示.从中可以看出,搜索中的简短模糊的查询是造成答案为片段的一个原因.
图表编号 | XD00163168000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 苏立新、郭嘉丰、范意兴、兰艳艳、徐君、程学旗 |
绘制单位 | 中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院网络数据科学与技术重点实验室、中国科学院计算技术研究所、中国科学院大学 |
更多格式 | 高清、无水印(增值服务) |