《表2 关联数据领域的高频关键词与频次》

《表2 关联数据领域的高频关键词与频次》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于年度高频关键词的研究热点提取与可视化研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了验证本文提取高频关键词方法的可行性,对本文提取高频关键词的方法与现有其他方法进行分析。将收集的关联数据领域的全部文献,使用Bicomb2工具进行关键词的提取,对初始提取的关键词进行清洗。由于本实验是以“关联数据”为检索词进行的检索,因此高频关键词选取过程中不考虑该词词频。高频关键词选取的方法主要包括齐普夫第二定律、普赖斯公式、二八定律、g指数等[21,23]。使用齐普夫第二定律获取的高频关键词数量为5,使用普赖斯公式获取的高频关键词数量为94,使用g指数获得的高频关键词数量为25,根据二八定律获取的高频关键词数量为32,由此可知本次实验根据齐普夫第二定律获取的高频关键词数量偏少,根据普赖斯公式获得的高频关键词数量过多,而g指数与二八定律获取的高频关键词数量较为合适,但相对于g指数、二八定律获取的高频关键词相对较多、涵盖的范围比较广,因此本文选取二八定律来分析本文提出年度高频关键词的研究热点方法的可行性。选取高频关键词的词频之和占所有关键词总词频的20.05%可得32个高频关键词,即关键词词频大于等于10,词频总和为743,截取的高频关键词如表2所示。