《表1 来源于SQuAD真实候选答案源 (框住的为关键词)》

《表1 来源于SQuAD真实候选答案源 (框住的为关键词)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于密度优先策略的答案源搜索方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

基于密度优先的相关性测量是一种经验性的方法,其设计动因来源于实际数据的观测结果,即问题关键词在正确答案源中的分布往往体现出密集出现的现象。比如,表1罗列了针对问题“Who broadcast the Super Bowl on TV?”(谁在电视上播出冠军超级杯?)的三个候选答案源,其中,文本片段(Ⅰ)是可靠的答案源,而文本片段(Ⅱ)和(Ⅲ)是错误或不确切的答案源。可以发现自然语言问句中的关键词较为密集地分布于文本片段(Ⅰ)中的局部区域,而在文本片段(Ⅱ)和(Ⅲ)中,这类关键词或离散分布,或存在缺失现象。