《表1 数据中心数据处理操作分类》

《表1 数据中心数据处理操作分类》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于云医疗的数据中心架构研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

作为数据中心最核心也是最重要的数据查询和处理层,我们对其工作流程和工作任务做了进一步的分解,并归纳出以下四个步骤,如表1所示。要保证数据查询和处理的高效性和准确性,第一步就要考虑数据权限问题。数据的查询和抽取必须要有敏感数据保护机制,并进行权限和授权的处理。第二步是数据抽取,其主要操作步骤是:先选择数据库连接,再使用数据同步工具canal进行数据同步,同步数据后更新到hive数据仓库,这样可以保证抽取到的数据是实时的。患者就诊、医生看诊等数据每时每刻都在更新,有了这些技术的保证至少可以做到线上的实时。第三步则是数据聚合,我们对一些数据宽表或者来自不同数据库的表进行聚合,聚合之后重新构建数据立方体,则可以给数据查询提供快速高效的接口。第四步是数据查询,为了避免性能受到影响,该步骤需要根据实际情况定制执行计划。包括已有数据表的选择、查看,编辑执行一些SQL语句等,也可以先定制一些执行计划,比如按天、按月等。最后,还要选择数据查询结构的接收方式,包括邮件或者推送给其他数据库,推送其他数据库需要配置数据库的连接、数据表等。