《表1 各类岩石样本数量和t-sne投影的坐标统计》

《表1 各类岩石样本数量和t-sne投影的坐标统计》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《一维到三维密度分布函数及其可视化在大数据分析中的应用——以苦橄质玄武岩等为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

在GEOROC和PETDB数据库中,样本数超过100个的岩石子类有142个,它们之间的关系如何?哪些岩石的化学成分相近?为了回答这些问题,在进行三维密度分布函数估计时,本文使用粗网格进行快速计算。由于TAS图解和硅镁图是常用的岩石分类图解,因此,本文使用SiO2、全碱和MgO指标进行分析。没有对数据库中不同样本的测量方式及其精度进行统计,但是根据数据的分布区间进行了假定。当数据分布较分散时,可以利用标准差较大的高斯函数;当数据分布较集中时,利用标准差较小的高斯函数。以SiO2为三维数据的x指标,取值范围为0%~85%,假设测量标准差为1%;以全碱(Na2O+K2O)为三维数据的y指标,取值范围为0%~21%,假设测量标准差为0.3%;以MgO含量为三维数据的z指标,取值范围为0%~50%,假设测量标准差为1%;三维网格以0.5%为网格点距,网格点数超过77万个。本文利用这3种指标,计算了142种岩石子类的各个网格点上三维密度分布函数值。142种岩石子类的密度分布函数的对比,可以视为每个网络点上密度分布函数值的对比,运用tsne(t-distributed stochastic neighbor embedding,t-分布随机邻域嵌入)技术将高维数据压缩到二维空间进行可视化[11]。表1显示了本文从GEOROC和PETDB数据库中提取的各类岩石的样本数量和tsne技术投影后的坐标。图2显示了各种岩石的相近程度,三维密度函数越接近的岩石在二维图中距离越接近。