《表2 各分类器的平均分类结果》

《表2 各分类器的平均分类结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

首先,本文分析了预处理阶段的效果。在传统文本处理方法中,直接将词语作为特征而不进行过滤和词干化。对于本文采用的维吾尔语文本数据集,传统方法会产生长度为6 204的特征向量。而本文方法经过词干提取和语义分组后,所获得特征向量长度为1 163,缩小了近5.3倍。为了评估本文CUB-SVM的性能,将其与标准SVM、文献[13]提出的MINSVM和文献[12]提出的SMOTE-SVM进行比较,以突出不同改进型分类方法之间的区别。表2给出了各种方法在数据集上的性能平均值。图5给出了各种方法的ROC曲线。