《表2 关键词词频与权重(部分)》
采用jieba R对清洗后的数据进行分词。由于原用户词典没有收录“贺建奎基因编辑婴儿”事件相关词汇、细胞生物学、网络流行用语等词汇,因此本研究首先选用搜狗词库[34]中的搜狗日常用语大词库、搜狗网络流行新词、搜狗基因词库、搜狗细胞生物学词库、搜狗伦理学词库,再结合在线词频分析工具图悦[35]生成的“贺建奎基因编辑婴儿”事件高频145词,将上述步骤得到的69 888个的词汇一同纳入用户词典并导入分词系统。实验使用哈工大停用词表、四川大学机器智能实验室停用词库和百度停用词[36]等结合的1893个停用词构成的停用词典删除停用词。利用在线词频分析工具图悦对138条热门微博生成的部分关键词词频与权重分析表格见表2。由下页表2可知,“基因编辑”“婴儿”“贺建奎”“伦理”“人类”“胚胎”“艾滋病”“峰会”“免疫”等词汇在热门微博中的出现频率非常高,这些词语在一定程度上也大致还原了该事件的基本内容,即贺建奎团队研究产出具有免疫艾滋病病毒能力的婴儿的实验,引发了国内外科学界和社会各界的广泛关注和讨论。
图表编号 | XD00193258100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.11.25 |
作者 | 安璐、胡俊阳、李纲 |
绘制单位 | 武汉大学信息资源研究中心、武汉大学信息管理学院、武汉大学信息管理学院、武汉大学信息资源研究中心 |
更多格式 | 高清、无水印(增值服务) |