《基于Hadoop平台协同过滤推荐算法的探究》
Hadoop平台支持文本数据、RDBMS数据库作为输入数据源,但是文本输入过程中需要对数据进行格式化和序列化分析,需要花费大量的时间进行数据处理。RDBMS数据库中如果数据过量,则会导致读写分离现象。基于协同过滤推荐算法计算数据评分的稀疏性,也就是用户评价内容涉及的项目相关信息占总数的1-2%,所以基于Hadoop平台项目下的稀疏性选择HBase分布式数据库作为数据源。HBase需要在Map Reduce框架对数据进行处理,让存储在数据库中和平台更好地融合在一起。如表1所示,对HBase数据库修改Map Reduce程序,扩展Map Reduce里面的相关类别,方便将Map Reduce数据信息直接读取为HTable的数据包。
图表编号 | XD0015606500 严禁用于非法目的 |
---|---|
绘制时间 | 2018.10.18 |
作者 | 林慧洁 |
绘制单位 | 桂林旅游学院、广西旅游数据中心 |
更多格式 | 高清、无水印(增值服务) |