《表1 文本数据集的属性:维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》

《表1 文本数据集的属性:维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《维语网页中n-gram模型结合类不平衡SVM的不良文本过滤方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了测试网页文本中的各种不良主题,从各种维吾尔文网站论坛上收集了500篇文本,分为四类:a)毒品类的文本,数量为143篇;b)色情类的文本,数量为78篇;c)赌博类的文本,数量为107篇;d)正常文本,数量为172篇。这些文本及其类别具有不平衡性,文本集的字符长度统计如表1所示。