《表3 图文微博数据集:图文融合的微博情感分析方法》
实验所用的图文微博数据集为网上爬取的新浪微博图文数据集。首先编写网络爬虫爬取新浪微博数据,然后对数据进行去广告、新闻等预处理操作,之后由5名工作人员进行人工标注。标注规则为:若一条微博有3人以上认为其情感倾向为正,则标注为正面;若一条微博有3人以上认为其情感倾向为负,则标注为负面;剩下的微博标注为中性。最终得到3305条正面图文微博,1796条负面图文微博,见表3。
图表编号 | XD0040532900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.04.16 |
作者 | 缪裕青、汪俊宏、刘同来、周明、武继刚 |
绘制单位 | 桂林电子科技大学计算机与信息安全学院、桂林海威科技股份有限公司综合部、桂林电子科技大学计算机与信息安全学院、桂林电子科技大学计算机与信息安全学院、桂林海威科技股份有限公司综合部、广东工业大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |