《表2 爬虫主要代码:基于空间位置的矿产资源关联分析和预测方法:以我国西部地区为例》

《表2 爬虫主要代码:基于空间位置的矿产资源关联分析和预测方法:以我国西部地区为例》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于空间位置的矿产资源关联分析和预测方法:以我国西部地区为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

开放数据来源于全国矿产地数据库(http://ngac.org.cn/kuangchandi/index.html),即一个图形化显示全国矿产地数据的网站。如果要查看某地的某矿产的具体数据,首先要打开属性查询框,然后在地图上的目标点上点击,详细信息才会出现在属性框。于本研究而言,这种数据的查看方式效率低,可以考虑使用网络爬虫来获取相关数据。首先是要分析目标网站的html结构。通过使用Firebug(一种为浏览器安装的分析网站的插件,能够从各种不同的角度剖析页面内部的细节层面,并且是开源的,用户可以利用它除错、编辑、甚至删改任何网站的CSS、HTML、DOM以及JavaScript代码)分析发现,矿产地数据在class=“cont”的div的“attribute”字段中,目标网站在“attribute”中返回坐标信息参数,而这些参数与计算机屏幕坐标和当前电脑显示区域相对于整幅地图的位置有关,所以我们使用代码(表2)控制坐标的数值,构造URL,不断产生代表不同点的URL来访问目标网站。通过观察可以发现,如果该URL对应的点没有矿产信息,返回的信息就不会包含字段“FIELDS”。返回数据结果在FIELDS字段中,对其进行截取即可获得可用数据。