《基于Hadoop平台协同过滤推荐算法的探究》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《基于Hadoop平台协同过滤推荐算法的探究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

Hadoop平台支持文本数据、RDBMS数据库作为输入数据源，但是文本输入过程中需要对数据进行格式化和序列化分析，需要花费大量的时间进行数据处理。RDBMS数据库中如果数据过量，则会导致读写分离现象。基于协同过滤推荐算法计算数据评分的稀疏性，也就是用户评价内容涉及的项目相关信息占总数的1-2%，所以基于Hadoop平台项目下的稀疏性选择HBase分布式数据库作为数据源。HBase需要在Map Reduce框架对数据进行处理，让存储在数据库中和平台更好地融合在一起。如表1所示，对HBase数据库修改Map Reduce程序，扩展Map Reduce里面的相关类别，方便将Map Reduce数据信息直接读取为HTable的数据包。

图表编号	XD0015606500 严禁用于非法目的
绘制时间	2018.10.18
作者	林慧洁
绘制单位	桂林旅游学院、广西旅游数据中心
更多格式	高清、无水印（增值服务）