《表5 在WebQuestions数据集上的C组实验》
我们在最终的系统中使用了新的特征模板lemmaAndBinary和获取核心词汇的策略,并与基准系统在测试集上进行对比实验,在基准系统中,我们开启了桥连接功能,并选择使用了lemmaAndBridge特征模板,在我们的系统中,我们使用了lemmaAndBinary特征,并同时使用基于投票机制的核心词典获取方法,设置实验再次测试这两种策略带来的效果。在两个数据集上的结果如表5和表6所示。从结果中我们可以看到,基于桥连接的词典学习方法在使用lemmaAndBinary特征模板和基于投票机制的核心词典获取的情况下,比桥连接方法更有效。更重要的是,我们的方法能够学习到新的词汇,可提供后续分析和使用。表7展示了几个我们新学习到的词汇。这些词汇都是原始词典中不存在的词汇,而是在训练过程中,基于桥连接方法,自动引入的词汇,并加以学习而得来的,我们可以看到这些词汇也符合我们的直觉,是我们所需要的,有了这些新词汇,能够有效提高语义解析器的性能。
图表编号 | XD0054899300 严禁用于非法目的 |
---|---|
绘制时间 | 2019.05.01 |
作者 | 陈波、孙乐、韩先培 |
绘制单位 | 中国科学院软件研究所中文信息处理实验室、中国科学院软件研究所中文信息处理实验室、中国科学院软件研究所中文信息处理实验室 |
更多格式 | 高清、无水印(增值服务) |