《表2 关键词词频与权重(部分)》

《表2 关键词词频与权重(部分)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《突发事件情境下社交媒体高影响力用户画像研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

采用jieba R对清洗后的数据进行分词。由于原用户词典没有收录“贺建奎基因编辑婴儿”事件相关词汇、细胞生物学、网络流行用语等词汇,因此本研究首先选用搜狗词库[34]中的搜狗日常用语大词库、搜狗网络流行新词、搜狗基因词库、搜狗细胞生物学词库、搜狗伦理学词库,再结合在线词频分析工具图悦[35]生成的“贺建奎基因编辑婴儿”事件高频145词,将上述步骤得到的69 888个的词汇一同纳入用户词典并导入分词系统。实验使用哈工大停用词表、四川大学机器智能实验室停用词库和百度停用词[36]等结合的1893个停用词构成的停用词典删除停用词。利用在线词频分析工具图悦对138条热门微博生成的部分关键词词频与权重分析表格见表2。由下页表2可知,“基因编辑”“婴儿”“贺建奎”“伦理”“人类”“胚胎”“艾滋病”“峰会”“免疫”等词汇在热门微博中的出现频率非常高,这些词语在一定程度上也大致还原了该事件的基本内容,即贺建奎团队研究产出具有免疫艾滋病病毒能力的婴儿的实验,引发了国内外科学界和社会各界的广泛关注和讨论。