《表1 来源于SQuAD真实候选答案源 (框住的为关键词)》
基于密度优先的相关性测量是一种经验性的方法,其设计动因来源于实际数据的观测结果,即问题关键词在正确答案源中的分布往往体现出密集出现的现象。比如,表1罗列了针对问题“Who broadcast the Super Bowl on TV?”(谁在电视上播出冠军超级杯?)的三个候选答案源,其中,文本片段(Ⅰ)是可靠的答案源,而文本片段(Ⅱ)和(Ⅲ)是错误或不确切的答案源。可以发现自然语言问句中的关键词较为密集地分布于文本片段(Ⅰ)中的局部区域,而在文本片段(Ⅱ)和(Ⅲ)中,这类关键词或离散分布,或存在缺失现象。
图表编号 | XD0041681800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.02.15 |
作者 | 李伟康、洪宇、陈鑫、邹博伟、张民 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |