《基于Hadoop平台协同过滤推荐算法的探究》

《基于Hadoop平台协同过滤推荐算法的探究》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Hadoop平台协同过滤推荐算法的探究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

Hadoop平台支持文本数据、RDBMS数据库作为输入数据源,但是文本输入过程中需要对数据进行格式化和序列化分析,需要花费大量的时间进行数据处理。RDBMS数据库中如果数据过量,则会导致读写分离现象。基于协同过滤推荐算法计算数据评分的稀疏性,也就是用户评价内容涉及的项目相关信息占总数的1-2%,所以基于Hadoop平台项目下的稀疏性选择HBase分布式数据库作为数据源。HBase需要在Map Reduce框架对数据进行处理,让存储在数据库中和平台更好地融合在一起。如表1所示,对HBase数据库修改Map Reduce程序,扩展Map Reduce里面的相关类别,方便将Map Reduce数据信息直接读取为HTable的数据包。