《表2 仿真实验数据选取:面向MapReduce的大数据分类模型及算法》

《表2 仿真实验数据选取:面向MapReduce的大数据分类模型及算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向MapReduce的大数据分类模型及算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

提出实验,验证本文设计的面向Map Reduce的大数据分类模型及算法具备一定研究机制,引入CPU(KDD)公共数据处理技术,搭建大数据挖掘检测数据集合。实验需准备3台计算机设备,一台计算机设备为实验主机,设定主机为数据通过主节点(Master),剩余两台计算机设备匹配子节点数据。设备具体属性值如下:处理器选择因特尔(R)核心(TM),i7-5600运行处理模式;计算机硬盘内存为64GB;外设硬盘运行内存为256 GB;计算机运行系统版本为Ubuntu15.6;JAVA计算机语言包工具运行版本为2.6;集散式系统基础运行框架版本为2.6.4;仿真实验运行环境为集成式开发运行环境,配备Map Reduce数据插件,计算机数据集处理语言选择java。遵循标准测试数据库中数据集,设定该数据集合中共有60万个数据样本,样本中包含55个不同数据属性变量值,依照数据类别划分为8种,占用计算及运行内存79.5 MB。此次实验从60万个数据样本中,随机选取部分数据集合作为此次实验的对照组实验数据,同时选取同样数值的数据集合作为实验组测试数据,为提升实验结果的真实性,两组数据中不可包含重复数据。设定10组实验数据,数据选取具体情况如表2所示。