《表4 相似度阈值试验:一种基于文本相似计算的校园智能问答系统设计》
对于计算得到的相似度数据,还需要根据实际情况设置相似度阈值。如果相似度阈值设置过高,那么在系统实际运行过程中会出现用户问题在语料库中找不到匹配问题的情况,导致系统无法给出回答,会极大地影响用户体验感受。同时,如果相似度阈值设置得过低,则会在系统运行中出现用户的一个问题可以在语料库中匹配到多个答案的情况,这样系统实现的效果将与普通搜索引擎毫无区别,用户依然需要从大量数据中二次检索答案。因此,一个合理的相似度阈值设置在系统设计中至关重要。在本文中,为找到短文本相似度设置的最佳阈值进行了多次试验,在相同语料库的基础上,采取50名志愿者对系统给出的答案进行评分(10分记为满分),每个问题的评分取50个用户的评价平均值。每个问题在语料库中搜索答案时,相似度阈值分别从0.3、0.4、0.5递增至0.8。对于不同问题在相同语料库下获得的答案满意度试验数据如表4所示。
图表编号 | XD009090700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.25 |
作者 | 李月、周江 |
绘制单位 | 广东交通职业技术学院信息学院、广东交通职业技术学院信息学院 |
更多格式 | 高清、无水印(增值服务) |