《表7单任务模型和多任务模型与基线方法的实验对比》
(3) 相比于文献[19],本文在事件触发词分类和事件元素分类的F1值上都处于劣势.本文分析造成该情况的原因有如下两点:(a)单字的事件触发词存在很强的歧义性,诸如“投”“中”“做”等.文献[19]采用基于依存句法分析的推理规则进行单字触发词的特殊处理.本文由于没有对单字触发词进行特殊处理,导致对单字触发词的识别效果并不好,经统计,单字触发词的识别错误率高达42.2%.(b)ACE 2005中文语料中存在一些标注不合理的情况.文献[19]通过构建一些规则将其过滤,而在本文模型中,这些样例被视为模型的噪声,因而有损模型的性能.诸如下面两个样例:(A)主要军港设立了18个环境检测站.(B)广州等地设立了代表处.上述(A)、(B)两句中的“设立”表达涵义基本一致,但标注语料中仅将(A)句中“设立”标注为事件触发词,(B) 句中未被标出.经本文统计,在测试集中共包含11个“设立”的正例事件,只有1个事件被本文模型准确识别为Start-Org事件.
图表编号 | XD0039650200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.01 |
作者 | 贺瑞芳、段绍杨 |
绘制单位 | 天津大学智能与计算学部、天津市认知计算与应用重点实验室、天津大学智能与计算学部、天津市认知计算与应用重点实验室 |
更多格式 | 高清、无水印(增值服务) |