《表5 机构实体的上位类情况的SPARQL查询语句》

《表5 机构实体的上位类情况的SPARQL查询语句》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于Wikidata的机构类目范畴树构建与优化》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

Wikidata中的每个机构实体由以Q为前缀的ID唯一标识,实体之间通过属性相连接。实例通过instance of属性与对应的实体连接,实例与实体之间存在多对一的关系。因此,我们考虑机构类目范畴树中存在这样的情况:通过subclass of连接的实体的上位类与实体之间也存在多对一的情况,即一个条目的多从属特征。为验证该想法,我们以机构类目范畴树中作为二级类的169个条目为例,用表5所示的SPARQL语句来获取169个条目的上位类数目和相应的上位类标签以及标识符。这里所指是除organization之外的上位类,将条目的除organization之外的上位类称为“额外父类”。经过检测,在169个条目中,有38个条目存在多上位类的情况,占总数的22.5%。对这38个条目的额外父类进行统计分析,发现这些条目的额外父类有两种基本情况:一种情况是条目的额外父类是机构范畴之外的条目,这样的条目有27个;另一种情况是条目的额外父类处于机构范畴内,并处于机构类目范畴树较深的层次,这样的条目有11个。相对应地,得出机构类目范畴树存在以下两个问题:一是机构实体与其他实体重叠;二是机构子类层级混乱。