《表4 4种方法在二分问题上的性能比较》

《表4 4种方法在二分问题上的性能比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《不均衡大数据集下的文本特征基因提取方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在搜狐新闻数据(SogouC S)20151022语料库上,采用将运动休闲类的230个样本作为正例,其余为负例的方式,构造不均衡二分问题。表4列出了DF、IG、MI以及TFGE采用LIBSVM分类器的实验结果。可以看出,DF与IG方法在解决不均衡问题时,两者差异不大,MI方法则相对性能较差,TFGE各项指标均优于其他3种方法,表现出较优的分类性能。