《表1 SAO结构主要抽取方法对比表》

《表1 SAO结构主要抽取方法对比表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向专利情报研究的SAO语义结构分析方法述评》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

上述两类方法均各有其优缺点(表1),基于模式匹配的SAO结构的抽取是非监督的,不需要人工参与去标注相应的语料,抽取结构相对直观、可控,通过改变规则可以直观地改变抽取结果,获得所需SAO结构,它是目前使用较多的方法。但是,由于科技文献即科技论文和专利文献有本身的书写规则和书写风格,需要针对分析的对象以及分析的领域添加特定的规则来提高SAO结构识别的准确性。另外,针对特定领域的专业术语,应该嵌入相应的词表进行SAO结构的抽取。而基于机器学习的主要是有监督的算法,需要人工标注大量的语料来完成提取工作,学习的过程可控性较差且成本较高。但是基于机器学习的方法可以通过对特定领域语料的训练来提升其提取SAO结构的准确性。