《表2 特征模板:触发词与属性值对联合抽取方法研究》
本文利用“CRF++(https://taku910.github.io/crfpp/)”工具训练模型,该工具需要指定特征模板。从预处理获得的训练集来看,现有的特征类型包括词语、词性和依存句法关系。根据分析这些特征类型,本文确定以下特征:(1)当前词语;(2)前后两个词语;(3)当前词语的词性;(4)前后两个词语的词性;(5)依存句法关系;(6)前后两个词语的依存句法关系。本文从一元特征开始,先后添加了特征(1)、(3)、(5);又将特征扩展到多元,先后加入特征(2)、(4)、(6)。此外,本文尝试了加入词性联合依存关系特征,构成多元交叉特征模板。表2为本文所设计的5个特征模板。
图表编号 | XD00163008200 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.01 |
作者 | 汪瀛寰、薛婵、包先雨、吴共庆 |
绘制单位 | 合肥工业大学计算机与信息学院、合肥工业大学计算机与信息学院、深圳市检验检疫科学研究院、合肥工业大学计算机与信息学院 |
更多格式 | 高清、无水印(增值服务) |