《表1 数据模型分类:基于云计算的地质大数据挖掘内涵》
资料来源:文献[3]
地质大数据存储数据库的选择以及地质大数据的分布式存储、并行计算是地质大数据处理流程中的核心之一,要根据地质大数据不同的应用需求选择适合的数据模型[3]及数据存储方式[4](表1)。SQL数据库功能强大,当SQL应用接近局限性边缘时,可选择NoSQL,对可扩展性及灵活性要求较高时,NoSQL是大数据的最佳选择。结构化数据可以使用关系数据库处理,非结构化数据使用NoSQL处理,对于结构化数据,采用动态分层技术,依据数据被调用频率的大小,自动将最常用的数据搬到最高层;针对非结构化数据使用内容归档平台,集成结构化数据与非结构化数据到一个单一的动态归档架构中,利用设计好的软件和元数据库规则,给数据加标签并建立不同的维度,实现模糊查询。
图表编号 | XD0082591700 严禁用于非法目的 |
---|---|
绘制时间 | 2019.06.10 |
作者 | 李敏、傅洁、陈安蜀、李磊 |
绘制单位 | 中国地质调查局天津地质调查中心、中国地震局第一监测中心、中国地质调查局天津地质调查中心、中国地质调查局天津地质调查中心 |
更多格式 | 高清、无水印(增值服务) |