《表2 关联数据领域的高频关键词与频次》
为了验证本文提取高频关键词方法的可行性,对本文提取高频关键词的方法与现有其他方法进行分析。将收集的关联数据领域的全部文献,使用Bicomb2工具进行关键词的提取,对初始提取的关键词进行清洗。由于本实验是以“关联数据”为检索词进行的检索,因此高频关键词选取过程中不考虑该词词频。高频关键词选取的方法主要包括齐普夫第二定律、普赖斯公式、二八定律、g指数等[21,23]。使用齐普夫第二定律获取的高频关键词数量为5,使用普赖斯公式获取的高频关键词数量为94,使用g指数获得的高频关键词数量为25,根据二八定律获取的高频关键词数量为32,由此可知本次实验根据齐普夫第二定律获取的高频关键词数量偏少,根据普赖斯公式获得的高频关键词数量过多,而g指数与二八定律获取的高频关键词数量较为合适,但相对于g指数、二八定律获取的高频关键词相对较多、涵盖的范围比较广,因此本文选取二八定律来分析本文提出年度高频关键词的研究热点方法的可行性。选取高频关键词的词频之和占所有关键词总词频的20.05%可得32个高频关键词,即关键词词频大于等于10,词频总和为743,截取的高频关键词如表2所示。
图表编号 | XD00198128000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.12.01 |
作者 | 高劲松、黄梅、付家炜 |
绘制单位 | 华中师范大学信息管理学院、华中师范大学信息管理学院、华中师范大学信息管理学院 |
更多格式 | 高清、无水印(增值服务) |