《表1 VOID词表的数据集主题分布》

《表1 VOID词表的数据集主题分布》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于VOID词表的数据集及链接语义关系分析》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

VOID词表利用资源的URI对数据集的主题进行判定,如http://dbpedia.org/resource/Person,其中“Person”最能描述数据集所涉及的主题。如果有不包括某些特定领域的主题,使用较广泛概念URI来标记数据集的主题。如http://purl.uniprot.org/core/Gene中“Gene”。主题不仅可以精确地捕获分类,而且确保这些数据集可以与来自同一领域的其他数据联系起来,增强数据集之间的关联性【9】。VOID词表中通过属性dcterms:subject对数据集的主题进行了描述,一个数据集可以有多个主题,如DBLP数据集涵盖了Computer_science、Journal和Proceedings三个主题,而Geonames数据集仅仅涉及一个Location主题。通过SPARQL对11 201个数据集进行查询,有4976个数据集具有主题,得到973个主题类型。表1将这些主题大致分为16个方向,其中行业贸易与服务、货币及金融是VOID词表中数据集产生、共享以及应用最为明显的主题方向,这些主题本身及其应用以及它们相互之间的关联关系,对于VOID词表的相关研究和实践具有重要的数据和事实支撑作用【9】。