《表2 各分类器的平均分类结果》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

首先，本文分析了预处理阶段的效果。在传统文本处理方法中，直接将词语作为特征而不进行过滤和词干化。对于本文采用的维吾尔语文本数据集，传统方法会产生长度为6 204的特征向量。而本文方法经过词干提取和语义分组后，所获得特征向量长度为1 163，缩小了近5.3倍。为了评估本文CUB-SVM的性能，将其与标准SVM、文献[13]提出的MINSVM和文献[12]提出的SMOTE-SVM进行比较，以突出不同改进型分类方法之间的区别。表2给出了各种方法在数据集上的性能平均值。图5给出了各种方法的ROC曲线。

图表编号	XD00107260700 严禁用于非法目的
绘制时间	2019.11.01
作者	如先姑力·阿布都热西提、亚森·艾则孜、郭文强
绘制单位	新疆警察学院信息安全工程系、新疆警察学院信息安全工程系、新疆财经大学计算机科学与工程学院
更多格式	高清、无水印（增值服务）