本书系统地介绍了数据预处理?数据仓库和数据挖掘的原理?方法及应用技术,以及采用Mahout对相应的挖掘算法进行实际练习?本书共有11章,分为两大部分?第1-7章为理论部分?第1章为绪论,介绍了数据挖掘与知识发现领域中的一些基本理论?研究方法等,也简单介绍了Hadoop生态系统中的Mahout;第2-7章按知识发现的过程,介绍数据预处理的方法和技术?数据仓库的构建与OLAP技术?数据挖掘原理及算法(包括关联规则挖掘?聚类分析方法?分类规则挖掘)?常见的数据挖掘工具与产品?第8-11章为实验部分,采用Mahout对数据挖掘各类算法进行实际练习?本书应用性较强,与实践相结合,以小数据集为例详细介绍各种挖掘算法,使读者更易掌握挖掘算法的基本原理及过程;使用广泛的大数据平台-—Hadoop生态系统中的Mahout对各种挖掘算法进行实际练习,实战性强,也符合目前数据处理与挖掘的发展趋势?本书既便于教师课堂讲授,又便于自学者阅读,可作为高等院校高年级学生“数据挖掘技术”“数据仓库与数据挖掘”“数据处理与智能决策”等课程的教材?

提示:百度云已更名为百度网盘(百度盘),天翼云盘、微盘下载地址……暂未提供。