《表1 不同数据存储方式的应用比较》

《表1 不同数据存储方式的应用比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《面向智能电网应用的电力大数据关键技术探析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

由于智能电网中涵盖大量的非结构化数据、半结构化数据等数据类型,需针对数据进行清洗、整理、筛选处理后方可将其转变为结构数据,在此应结合不同数据类型进行存储方式的选取,以此实现对复杂数据的有效处理:(1)分布式文件系统设计,该系统主要利用物理层面上分散的多个存储节点进行数据存储、管理与分配,并为用户提供访问接口,用于存储非结构化数据。基于HDFS系统进行分布式文件系统基础架构设计,将电力大数据分割成64MB的若干数据块,并存储在分布式集群中,具备可扩展性好、容错性强、数据访问能力好等性能优势;(2)分布式数据库设计,涵盖文档数据库、图数据库等类型,用于实现数据存储、管理、查询、分析等功能。选取Hbase开源数据库进行分布式数据库设计,可提供半结构化数据存储功能,配合HDFS的底层存储与MapReduce的数据处理功能,进一步提升数据存储的可靠性与数据处理效率;(3)关系型数据库设计,该数据库主要用于管理结构化数据。选取Oracle系统进行关系型数据库设计,可有效满足对结构化数据的存储、处理需求,具有适用范围广、操作便捷度高、功能强大等性能优势[3]。鉴于智能电网涵盖的数据类型较为复杂,因此还需结合不同数据特点进行存储方式的选择,如表1所示,实现对电力大数据的安全存储与高效处理。