《表1 预处理前后文本对比》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《融合双向门控循环单元和卷积神经网络的歧视性言论鉴别》
预处理的主要任务是去除无用词和停用词,即删除对信息无关的标点、数字、特殊符号以及较短的单词,然后将句中的单词,例如过去分词、动名词等词干提取出来,还原为词根形式,这样有助于在不丢失信息的情况下减少数据中唯一单词的数量,其部分处理效果如表1所示。
图表编号 | XD00139034600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.24 |
作者 | 徐杨、廖小琴 |
绘制单位 | 贵州大学大数据与信息工程学院、贵州大学大数据与信息工程学院 |
更多格式 | 高清、无水印(增值服务) |