《表1 实验中所用数据集的基本信息》

《表1 实验中所用数据集的基本信息》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于决策树模型重用的分布变化流数据学习》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

数据集.我们采用8个数据集,其中包含2个合成数据集,CIR500G和SIN500G;以及6个真实数据集,Luxembourg,Weather,Gas Sensor,Powersupply,Electricity,Covertype.表1展示了所使用数据集的基本信息,包括数据集名称、样本数目、维度和类别数目.CIR500G合成数据集是CIRCLE数据集[17]的变种,数据属性为2维,决策边界为圆形,并通过调整圆的半径模拟分布变化.具体而言,数据决策空间为x12+x22 r,其中r={3,2.5,2,2.5,3,3.5,4,3.5},变化周期为500.SIN500G合成数据集是SINE数据集[17]的变种,数据属性为2维,决策边界为正弦函数,并通过调整j角度模拟分布变化.具体而言,数据决策空间为sin(x1+θ) x2,其中θ0=0,?θ=π/60,变化周期为500.实验中所用到的真实数据集包含文本、气象、电费、森林覆盖率等多方面,样本数目规模从1900到最多的58万多,且包含二分类和多分类不同任务.详细的介绍可以参考文献[26]的附录1.