《表1 互联网主要外部数据特征》

《表1 互联网主要外部数据特征》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《大数据背景下审计数据采集技术与方法的研究——以互联网金融企业专项审计为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

网络爬虫技术在审计领域中的应用,例如商业银行进行小微企业贷款审计,数据采集难一直是审计部门十分困扰的问题。小微企业客户贷款信息的真实一般由自己报送,客户资源的真实性、完整性、有效性亟需验证。审计部门对材料真实审查往往无从下手,通常会面临企业客户的财务信息、非财务信息搜索整合困难,尤其是小微企业的财务信息难以核实、难以识别客户资料信息造假以及来自银行内部工作人员“伪造”信息等一系列问题。网络爬虫技术作为大数据前端的数据采集技术,可以很好地解决这一系列问题。利用网络爬虫技术,配合图像识别、语音识别、语义理解等大数据技术,可以实现海量的外部高价值数据收集,包括如表1所示的政府公开数据、企业官网数据、社交数据、新闻舆情数据等。审计部门得以通过客户动态数据的获取,为客户建立“全景画像”,对客户的实际业务、运行情况以及报送材料的一致性进行全方位、细粒度的实时审查,从而使得商业银行审计部门在审计范围、时效性、前瞻性等方面得到有效改善。