《表2 基于5种术语权重的JDC结果》
因此,可以认为TF-IDF和TFw-IDF可能更加适用于JDC的测算。当然,这仅是基于聚类结果的初步判断,还需要进一步验证。笔者对2017年LIS期刊JDC进行了计算,结果如表2所示,5种JDC结果在数值分布上存在明显差异。为了更加直观地观察这种差异,将表2中的数据绘制成箱线图,如图2所示。
图表编号 | XD00135977400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.24 |
作者 | 张宝隆、王昊、邓三鸿、苏新宁 |
绘制单位 | 南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室、南京大学信息管理学院、江苏省数据工程与知识服务重点实验室 |
更多格式 | 高清、无水印(增值服务) |