《表1 文本词集生成效果》
1.文本预处理。本文研究中,采用新浪平台提供的63641个用户的真实微博数据集展开测试及验证研究。对单用户(uid为1889213710的用户,不同用户的uid对应为不同用户的微博)的微博文本进行预处理,生成文本词集保存在weibo表中的words字段中。本文采用jieba TF-IDF来处理生成文本词集,效果如下表1:
图表编号 | XD0017826300 严禁用于非法目的 |
---|---|
绘制时间 | 2018.06.25 |
作者 | 黄万云、陈明禄 |
绘制单位 | 景德镇陶瓷大学、景德镇陶瓷大学江西省陶瓷企业信息化工程技术研究中心 |
更多格式 | 高清、无水印(增值服务) |