《表1 微博主要数据表:时间敏感的微博热点爬取与发现模型研究》
在微博平台中,用户、微博正文和用户关系是直接影响媒体传播力的3个要素.Scrapy爬虫爬取的微博页面虽然杂乱,但是拥有统一的格式.在经过超期页面剔除、内容去重、数据结构化解析后,将数据持久化到关系数据库中,为后续的舆情分析奠定数据基础.数据表的基本情况如表1所示.
图表编号 | XD0064700900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.01 |
作者 | 应毅、李晓明、栾晶 |
绘制单位 | 三江学院计算机科学与工程学院、三江学院计算机科学与工程学院、三江学院计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |