《表1 文本数据集的属性:维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》
为了测试网页文本中的各种不良主题,从各种维吾尔文网站论坛上收集了500篇文本,分为四类:a)毒品类的文本,数量为143篇;b)色情类的文本,数量为78篇;c)赌博类的文本,数量为107篇;d)正常文本,数量为172篇。这些文本及其类别具有不平衡性,文本集的字符长度统计如表1所示。
图表编号 | XD00107261200 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.01 |
作者 | 如先姑力·阿布都热西提、亚森·艾则孜、郭文强 |
绘制单位 | 新疆警察学院信息安全工程系、新疆警察学院信息安全工程系、新疆财经大学计算机科学与工程学院 |
更多格式 | 高清、无水印(增值服务) |