《表1 自动生成模板方法抽取效率对比》

《表1 自动生成模板方法抽取效率对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于视觉特征的网页信息抽取方法研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

从表1可以看出,自动生成模板的方法对于单个网页抽取的运行时间较WEMLVF有明显提升,因为,在抽取过程中自动生成模板的方法不需要提取视觉特征。基于包装器归纳的方法运行速度比基于XPath的要快,因为基于包装器归纳的方法无需解析HTML源码构建DOM树,只需对网页进行分词得到Token序列来构建FST。