《表1 基于均值漂移算法的文本聚类》
部分实验结果如表1所示,通过实验可得到如下结论:特征词规模在Top 1 000时,开始有较好表现,在Top 4 000、Top 4 500、Top 5 000时,聚类效果更合理,Top 4 500是合理的最优取值规模,可有效呈现其所代表的文本特征。
图表编号 | XD00107785700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.25 |
作者 | 赵华茗、余丽、周强 |
绘制单位 | 中国科学院文献情报中心、中国科学院文献情报中心、中国科学院文献情报中心 |
更多格式 | 高清、无水印(增值服务) |