《表5 一级指标“开放数据开发利用情况”下的指标初步构建结果》

《表5 一级指标“开放数据开发利用情况”下的指标初步构建结果》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《创意类开放数据竞赛作品评价指标体系构建与测定——以数字人文项目为例》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

根据对主办方人员的访谈和竞赛中数据集的浏览,笔者有以下发现:开放数据竞赛的原始数据,通常由各个主办、协办单位提供,彼此独立存储于各单位的特色数据库中,包括细粒度的元数据和经过初步挖掘和组织的数据。以2018年上海图书馆开放数据竞赛为例,主办方提供了来自于上海图书馆、CADAL项目管理中心、哈佛大学计量社会学系等机构的数百万条数据,涵盖家谱、古籍、人物传记、诗词用韵等内容(1),具有很高的开发价值。参赛者如何将来自不同数据集相互独立的信息资源进行关联融合,生产出具有一定深度的二次信息,是开放数据开发程度的考核要素。因此,本研究将“数据来源丰富度”和“数据开发深度”作为开放数据视角下的评价指标。另一方面,在提供的数据之外,互联网上存在着数量繁多的开放数据,能在原有数据集基础上起到重要的补充作用,主办方也鼓励参赛者进行外部数据的关联挖掘,并将其作为评审指标之一。开发者亦可通过超文本链接的形式[15],为用户提供这部分的信息资源,具体指标如表5所示。