《表2 推特数据集:社交网络中的抑郁症用户语言和行为特征分析及检测》
参照心理疾病在线识别研究中的数据采集方法[28,34],本文使用表1中的关键短语作为正则表达式构造搜索关键词。通过推特API从公开的推特数据中检索自我诊断为抑郁症的个人用户,最后收集到2015-2017年期间,共5 899名疑似抑郁症用户组,同时爬取这些用户发表的时间轴(Timeline)信息。为了与抑郁症用户组进行对照分析,从推特流中过滤出不包含上述关键短语的5 366个正常用户作为参照组,同时爬取这些用户在同样时间间隔内的时间轴(Timeline)数据。每个被过滤用户的时间轴数据包括帖子文本、用户名、发布时间、标签、提及次数、收藏、地理位置和帖子编号等信息。在表2中列出了所获得数据的基本描述性信息。
图表编号 | XD00174844100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.01 |
作者 | 门秀萍、魏瑞斌、吴小兰 |
绘制单位 | 安徽财经大学管理科学与工程学院、安徽财经大学管理科学与工程学院、安徽财经大学管理科学与工程学院、南京理工大学经济管理学院 |
更多格式 | 高清、无水印(增值服务) |