《表4 疫情相关数据集名称及数据字段词频表》

《表4 疫情相关数据集名称及数据字段词频表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《重大疫情灾害中政府数据开放模式研究——以新型冠状病毒肺炎疫情为实证分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

地方政府数据开放平台公布的疫情数据中,优质数据体量较小,数据开放程度有待加强。通过对13个政府数据开放平台公开的疫情数据集名称及数据字段进行词频分析,并根据热词权重指标(Score)[29]抽取排名前20的关键词进行分析(见表4)。结果显示,“确诊”、“病例”、“医疗”、“序号”、“名称”等关键词出现频率较高。以关键词词频为视角对数据集类型及数据字段进行分析,发现当前政府开放的疫情数据整体质量欠优。首先,优质数据数量较少,且重心偏向明显。疫情相关核心数据集总数量为58个,占总数据集个数的56.86%,核心数据总量为17 589条,仅占疫情相关数据总量的12.31%,且普遍侧重于确诊病例、医疗救治机构、空间分布3个层面,对于疑似病例、出院病例以及病毒基因序列数据的开放依旧有所保留。其次,结构分布不合理,数据类型有待拓展。除福州、青岛和贵阳外,其余平台数据集覆盖信息类型均低于6种,疾控中心、教育部等相关部门的联系方式、湖北旅客安置点信息、交通信息以及其他信息数据开放并未得到及时的更新,疫情数据的覆盖范围缺乏深度和广度。