《表1 实验文件耗时对比:基于Spark框架的政府公文聚类方法研究》
本文爬取了三个政府网站的公文,并对这三组公文分别做了聚类实验,可以发现单机环境下聚类的耗时都远远大于在Spark平台上聚类的耗时。由此可以看出Spark平台上处理相同数量的文本比单机效率有着显著提高。
图表编号 | XD00116575600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.01 |
作者 | 朱家麒、徐亚军 |
绘制单位 | 北京信息科技大学计算机学院、北京信息科技大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |
本文爬取了三个政府网站的公文,并对这三组公文分别做了聚类实验,可以发现单机环境下聚类的耗时都远远大于在Spark平台上聚类的耗时。由此可以看出Spark平台上处理相同数量的文本比单机效率有着显著提高。
图表编号 | XD00116575600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.01 |
作者 | 朱家麒、徐亚军 |
绘制单位 | 北京信息科技大学计算机学院、北京信息科技大学计算机学院 |
更多格式 | 高清、无水印(增值服务) |