《表7单任务模型和多任务模型与基线方法的实验对比》

《表7单任务模型和多任务模型与基线方法的实验对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于多任务学习的中文事件抽取联合模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

(3) 相比于文献[19],本文在事件触发词分类和事件元素分类的F1值上都处于劣势.本文分析造成该情况的原因有如下两点:(a)单字的事件触发词存在很强的歧义性,诸如“投”“中”“做”等.文献[19]采用基于依存句法分析的推理规则进行单字触发词的特殊处理.本文由于没有对单字触发词进行特殊处理,导致对单字触发词的识别效果并不好,经统计,单字触发词的识别错误率高达42.2%.(b)ACE 2005中文语料中存在一些标注不合理的情况.文献[19]通过构建一些规则将其过滤,而在本文模型中,这些样例被视为模型的噪声,因而有损模型的性能.诸如下面两个样例:(A)主要军港设立了18个环境检测站.(B)广州等地设立了代表处.上述(A)、(B)两句中的“设立”表达涵义基本一致,但标注语料中仅将(A)句中“设立”标注为事件触发词,(B) 句中未被标出.经本文统计,在测试集中共包含11个“设立”的正例事件,只有1个事件被本文模型准确识别为Start-Org事件.