《表1 实验因素水平:融合社交关系和标签信息的混合新闻推荐算法》
本文实验使用Data Castle提供的Twitter数据集,选取2013年12月~2014年1月的5 000名用户。在抓取文章期间,2 563名用户至少发布了一篇文章,包括新闻门户(Yahoo新闻、CNN、New York时报、Huffington邮报和Fox新闻)的链接。在所有提取的帖子中,有1 845 345篇是由这些用户发布的。从包含新闻门户链接中,提取了10 869篇独特的新闻文章,并拥有28 923个用户新闻关系。另外还在帖子中提取了40 549个用户之间的朋友关系,用户的标签数116 563。腾讯微博数据集使用Tencent Weibo API获取公共时间线内最活跃的4 940名用户发布的568 365条微博。在包含新闻链接(新华网、网易新闻、凤凰网和人民网等)的文章中,收集与1 856个用户关联的7 722篇新闻文章,并且获得22 285个用户—新闻关系。最后,为了获得一个微博文章语料库,使用API来获取用户的时间轴和他们的社会关系。实验统计数据如表1所示。
图表编号 | XD00198105600 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.05 |
作者 | 夏鸿斌、刘春芹、刘渊 |
绘制单位 | 江南大学数字媒体学院、江苏省媒体设计与软件技术重点实验室、江南大学数字媒体学院、江南大学数字媒体学院、江苏省媒体设计与软件技术重点实验室 |
更多格式 | 高清、无水印(增值服务) |