《表5 实验中包含的真实数据集的属性》

《表5 实验中包含的真实数据集的属性》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Spark框架下利用分布式NBC的大数据文本分类方法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

实验数据将采用来源于UCI KDD Archived的20个Newgroups数据集[18~20]。在训练时,本实验使用了Newgroups数据集中所有类的文档,在测试时随机抽取了politics、baseball、religion、hardware和motorcycle五类新闻数据组。这些真实的数据集提供了关于可伸缩性的不同属性,如表5所示。