《表1 预处理前后文本对比》

《表1 预处理前后文本对比》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合双向门控循环单元和卷积神经网络的歧视性言论鉴别》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

预处理的主要任务是去除无用词和停用词,即删除对信息无关的标点、数字、特殊符号以及较短的单词,然后将句中的单词,例如过去分词、动名词等词干提取出来,还原为词根形式,这样有助于在不丢失信息的情况下减少数据中唯一单词的数量,其部分处理效果如表1所示。