《表4 术语平均长度的统计情况(单位:字)》

《表4 术语平均长度的统计情况(单位:字)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《中文术语粒度对其区分能力测度的影响分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

此外,不同来源的术语在粒度上也存在明显差异。两组实验的术语平均长度变化如表4所示,对照组的术语平均长度为3.31,来自KW和KP的术语多为组合短语,其平均长度明显大于来自TI和AB的术语,最长的术语来自于KP字段,有15字之长,如“国家人口与健康科学数据共享平台”,KW的最长术语有12字,如“改革开放前后两个历史时期”和“应计制与真实活动盈余管理”,除人名、机构名、历史事件名等实体名称外,这类关键词过于专指,在实际信息检索中的查全率不甚满意,在语义上完全有进一步切分的必要;而在实验组中,术语平均长度为2.06,各字段在术语粒度上普遍更短而无明显差异,AB字段的术语粒度略大。