《表5 实验中包含的真实数据集的属性》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《Spark框架下利用分布式NBC的大数据文本分类方法》
实验数据将采用来源于UCI KDD Archived的20个Newgroups数据集[18~20]。在训练时,本实验使用了Newgroups数据集中所有类的文档,在测试时随机抽取了politics、baseball、religion、hardware和motorcycle五类新闻数据组。这些真实的数据集提供了关于可伸缩性的不同属性,如表5所示。
图表编号 | XD003906600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.01 |
作者 | 臧艳辉、赵雪章、席运江 |
绘制单位 | 佛山职业技术学院、佛山职业技术学院、华南理工大学 |
更多格式 | 高清、无水印(增值服务) |