本书共包括10章。第1章介绍在单台机器上创建完整的Mahout开发环境。第2章重点介绍序列文件的使用方式。第3章详细介绍使用命令行工具和代码从RDBMS中读写数据。第4章详细讨论朴素贝叶斯分类器和互补朴素贝叶斯分类器的使用方法。第5章通过两个算法logistic回归和随机森林预测股市。第6章描述Mahout框架中最常用的算法,包括大数据的聚类分析和分类。第7章描述频谱聚类的使用方式。第8章描述使用K—均值(包括序列方式和MapReduce方式)对主题中的文本文档进行分类。第9章介绍频……

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。