《表1 SAO结构主要抽取方法对比表》
上述两类方法均各有其优缺点(表1),基于模式匹配的SAO结构的抽取是非监督的,不需要人工参与去标注相应的语料,抽取结构相对直观、可控,通过改变规则可以直观地改变抽取结果,获得所需SAO结构,它是目前使用较多的方法。但是,由于科技文献即科技论文和专利文献有本身的书写规则和书写风格,需要针对分析的对象以及分析的领域添加特定的规则来提高SAO结构识别的准确性。另外,针对特定领域的专业术语,应该嵌入相应的词表进行SAO结构的抽取。而基于机器学习的主要是有监督的算法,需要人工标注大量的语料来完成提取工作,学习的过程可控性较差且成本较高。但是基于机器学习的方法可以通过对特定领域语料的训练来提升其提取SAO结构的准确性。
图表编号 | XD00224561100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.10.01 |
作者 | 李晓曼、宋红燕 |
绘制单位 | 中国农业科学院农业信息研究所、中国农业科学院农业信息研究所 |
更多格式 | 高清、无水印(增值服务) |