《表4 ans表:基于大数据的网络舆情实时监测系统的构建》
为支撑上述舆情管理的计算模块,需要进行数据库层级的设计和规划。采用kafka的队列服务实现舆情数据的实时写入,这些全量网页数据存储在HDFS数据库上。离线计算程序启动时,将访问这些全量数据进行处理逻辑的批计算,经过reduce环节后全量的结果将写入存储引擎中,从而提供给用户进行业务查询。而实时计算则采用例如Spark Streaming实时订阅全量数据的方式,将结果写入结构化数据引擎。最终以可视化方式展示和查询。HDFS数据库的表结构明细如表3、表4、表5所示。
图表编号 | XD00182351700 严禁用于非法目的 |
---|---|
绘制时间 | 2020.06.15 |
作者 | 曾宇 |
绘制单位 | 漳州城市职业学院电子信息工程系 |
更多格式 | 高清、无水印(增值服务) |