《表4 相似度阈值试验:一种基于文本相似计算的校园智能问答系统设计》

《表4 相似度阈值试验:一种基于文本相似计算的校园智能问答系统设计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一种基于文本相似计算的校园智能问答系统设计》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

对于计算得到的相似度数据,还需要根据实际情况设置相似度阈值。如果相似度阈值设置过高,那么在系统实际运行过程中会出现用户问题在语料库中找不到匹配问题的情况,导致系统无法给出回答,会极大地影响用户体验感受。同时,如果相似度阈值设置得过低,则会在系统运行中出现用户的一个问题可以在语料库中匹配到多个答案的情况,这样系统实现的效果将与普通搜索引擎毫无区别,用户依然需要从大量数据中二次检索答案。因此,一个合理的相似度阈值设置在系统设计中至关重要。在本文中,为找到短文本相似度设置的最佳阈值进行了多次试验,在相同语料库的基础上,采取50名志愿者对系统给出的答案进行评分(10分记为满分),每个问题的评分取50个用户的评价平均值。每个问题在语料库中搜索答案时,相似度阈值分别从0.3、0.4、0.5递增至0.8。对于不同问题在相同语料库下获得的答案满意度试验数据如表4所示。