《表2 各分类器的平均分类结果》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》
首先,本文分析了预处理阶段的效果。在传统文本处理方法中,直接将词语作为特征而不进行过滤和词干化。对于本文采用的维吾尔语文本数据集,传统方法会产生长度为6 204的特征向量。而本文方法经过词干提取和语义分组后,所获得特征向量长度为1 163,缩小了近5.3倍。为了评估本文CUB-SVM的性能,将其与标准SVM、文献[13]提出的MINSVM和文献[12]提出的SMOTE-SVM进行比较,以突出不同改进型分类方法之间的区别。表2给出了各种方法在数据集上的性能平均值。图5给出了各种方法的ROC曲线。
图表编号 | XD00107260700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 如先姑力·阿布都热西提、亚森·艾则孜、郭文强 |
绘制单位 | 新疆警察学院信息安全工程系、新疆警察学院信息安全工程系、新疆财经大学计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |