《表2 部分处理后数据:基于事件描述的社交事件参与度预测》

《表2 部分处理后数据:基于事件描述的社交事件参与度预测》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于事件描述的社交事件参与度预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于爬取的数据描述为HTML格式,同时包含很多非英语词,例如表情、HTML控制标签,因此,在正式在预处理之前,本文对文本进行如下处理:1)去除所有非英文词和HTML标签;2)去除停止词;3)将数字替换为“#”,将出现次数少于5次的词替换为“”;4)去除事件中无意义的属性,例如图片链接,最终选择了如下属性:时间、地点、事件描述、事件种类,部分数据如表2所示。