《表3 数据集敏感词数统计表》

《表3 数据集敏感词数统计表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《多特征融合的可移植谣言早期检测模型》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

该特征指语料信息的敏感程度,以语料中敏感词含量定量表示。敏感词是在谣言中高频出现的词语,如“震惊”、“惊呆”以及带有性暗示的词语等。而网络文化的发展与舆论监管机制的完善更让这一特征显得复杂,缩写、变换字体、改用谐音等逃脱检测的手法层出不穷。本文对健康、政治及两性等领域的敏感词及变体进行搜集并构建敏感词库,利用词库对语料库统计分析发现,谣言中敏感词的数量远高于非谣言,详细结果如表3所示。