《表1 语料格式Tab.1 Format of the corpus》
本次研究主要针对开放领域,且复述语料资源有限,因此选取“百度知道”相似问题作为语料来源,共爬取百度知道完整问句2 232 051条、373 704组。研究采取的具体形式可见表1。
图表编号 | XD0030168900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.01.01 |
作者 | 曹雨、张宇、刘挺 |
绘制单位 | 哈尔滨工业大学计算机科学与技术学院、哈尔滨工业大学计算机科学与技术学院、哈尔滨工业大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |