《表1 典型事件Reddit评论样例(部分)》
数据采集时间为2018年12月17日,使用机器解析+人工核验的方式完成。首先在主题页面中选择“展开全部评论”,之后对网页源码使用正则表达式解析出用户id、评论内容两个字段,对于评论文本中的引用内容,采用中括号的方式加以区分。由于网页源码信息中通过评论id实现评论层级的关联,在实际操作时,研究者采用人工方式对评论内容进行缩进调整以反映评论的树状结构,如表1所示。
图表编号 | XD0072235300 严禁用于非法目的 |
---|---|
绘制时间 | |
作者 | 郭鑫、唐超 |
绘制单位 | 北京大学信息管理系、北京大学信息管理系、中国人民警察大学边防系 |
更多格式 | 高清、无水印(增值服务) |