《表2 平衡后的数据集类型及其样本数量》

《表2 平衡后的数据集类型及其样本数量》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《SDN环境下不同机器学习算法的网络流量分类分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

因本文中使用的Moore数据集中GAME类型与其他类型样本量差距太大,即使使用Borderline-SMOTE算法也无法避免样本重叠,所以在进行实验时,剔除了标记为GAME类型的样本,然后选取WWW类型部分样本和其他类型的全部样本组成新的训练数据集,采用Borderline-SMOTE算法对其进行平衡化处理.平衡后的数据集各类型及其样本数量如表2所示.因平衡后的数据集样本数量不足百万,属于小数量数据集,所以将数据集的80%作为训练数据集,剩余的20%作为测试数据集.