《表1 数据抓取处理结果》

《表1 数据抓取处理结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《供给侧改革视角下的档案社会存管服务研究——以广州市调研为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

国家企业信用信息公示系统的公示信息来自我国各级工商行政管理部门、其他政府部门及市场主体,内容包括各市场主体的工商信息以及商事主体公示信息,可确定各档案社会存管机构的经营状态以及范围,内容相对真实有效。为了解当前广州市档案社会存管服务机构的性质及构成,研究通过网络爬虫技术在“国家企业信用信息公示系统(广东)”(http://gd.gsxt.gov.cn/)上通过关键词搜索,获取工商注册地为广州市的档案社会存管机构经营服务范围等信息。具体步骤如下:(1)利用“集搜客”软件制定爬虫规则:在系统中检索关键词“档案”,选定登记机关所在地为“广州市”,规定抓取数据项为“机构名称”、“企业状态”以及“企业成立日期”;(2)根据企业状态清洗数据,将“吊销未注销”、“吊销已注销”、“注销”及“迁出”的数据条目排除;(3)根据机构名称清洗数据,初步删除不相关机构,如档案用品公司、档案设备公司、计算机技术有限公司、整理服务部等;(4)数据再次筛选,通过其官网、招聘简介网络信息再次筛选初筛机构,确定符合采样的对象。数据采集分析结果如表1所示。