《表1 文档集数据:基于信息内容和用户关系的用户兴趣分类》
网络爬取数据集第一部分中的微博语料,加上后期补充的数据,经过数据预处理后,共得到680个微博用户。采用人工的方式对用户兴趣类别K进行标注,分别使用1、2、3、4、5、6作为娱乐、休闲生活、音乐、财经、科技/政策、体育六个类别的标签。选取其中50%的语料作为训练数据,另外50%作为测试数据。用户兴趣分布图如表1所示。
图表编号 | XD0024175400 严禁用于非法目的 |
---|---|
绘制时间 | 2018.06.01 |
作者 | 吴峰、范通让、贾红佳、崔娜、赵文彬 |
绘制单位 | 河北省科学技术情报研究院、石家庄铁道大学信息科学与技术学院、石家庄铁道大学信息科学与技术学院、石家庄铁道大学信息科学与技术学院、石家庄铁道大学信息科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |