《表1 不同数据存储方式的应用比较》
由于智能电网中涵盖大量的非结构化数据、半结构化数据等数据类型,需针对数据进行清洗、整理、筛选处理后方可将其转变为结构数据,在此应结合不同数据类型进行存储方式的选取,以此实现对复杂数据的有效处理:(1)分布式文件系统设计,该系统主要利用物理层面上分散的多个存储节点进行数据存储、管理与分配,并为用户提供访问接口,用于存储非结构化数据。基于HDFS系统进行分布式文件系统基础架构设计,将电力大数据分割成64MB的若干数据块,并存储在分布式集群中,具备可扩展性好、容错性强、数据访问能力好等性能优势;(2)分布式数据库设计,涵盖文档数据库、图数据库等类型,用于实现数据存储、管理、查询、分析等功能。选取Hbase开源数据库进行分布式数据库设计,可提供半结构化数据存储功能,配合HDFS的底层存储与MapReduce的数据处理功能,进一步提升数据存储的可靠性与数据处理效率;(3)关系型数据库设计,该数据库主要用于管理结构化数据。选取Oracle系统进行关系型数据库设计,可有效满足对结构化数据的存储、处理需求,具有适用范围广、操作便捷度高、功能强大等性能优势[3]。鉴于智能电网涵盖的数据类型较为复杂,因此还需结合不同数据特点进行存储方式的选择,如表1所示,实现对电力大数据的安全存储与高效处理。
图表编号 | XD008136600 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.25 |
作者 | 杨梦、刘泽 |
绘制单位 | 电网有限责任公司海口供电局、电网有限责任公司儋州供电局 |
更多格式 | 高清、无水印(增值服务) |