《表1 基于语言学规则方法的比较》

《表1 基于语言学规则方法的比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向文本的本体自动构建研究综述》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

(1) 基于语言学规则的方法。基于语言学知识的方法主要是根据术语的模式、特征、语义信息等从语料库中进行术语的抽取(见表1)。段国成提出,将普通词典和种子扩展法相结合来进行单词术语的自动识别,实验结果表明该方法是有效的,但是召回率较低。[21]Sui Z等通过早期的语法过滤器进行术语的自动提取,该过滤器的语法规则比较宽松,可以匹配更多语言结构的术语。[22]虽然这种方法可以提高术语抽取的召回率,但却降低了准确率。L R Jones等基于词语的语言学原理,利用语法结构识别的方法来识别术语,进而完成术语的自动提取。[23]B Daille等通过事先构造语模板来进行术语的自动抽取。[24]表1比较了以上几种基于语言学规则的方法。利用语言学规则进行术语的自动提取的结果准确度较高,而且处理过程简单并且能够提取低频术语。但由于语言学规则本身难以掌握,尤其对于开放性语料,故语言学的规则难以准确应用。