《表5 机构实体的上位类情况的SPARQL查询语句》
Wikidata中的每个机构实体由以Q为前缀的ID唯一标识,实体之间通过属性相连接。实例通过instance of属性与对应的实体连接,实例与实体之间存在多对一的关系。因此,我们考虑机构类目范畴树中存在这样的情况:通过subclass of连接的实体的上位类与实体之间也存在多对一的情况,即一个条目的多从属特征。为验证该想法,我们以机构类目范畴树中作为二级类的169个条目为例,用表5所示的SPARQL语句来获取169个条目的上位类数目和相应的上位类标签以及标识符。这里所指是除organization之外的上位类,将条目的除organization之外的上位类称为“额外父类”。经过检测,在169个条目中,有38个条目存在多上位类的情况,占总数的22.5%。对这38个条目的额外父类进行统计分析,发现这些条目的额外父类有两种基本情况:一种情况是条目的额外父类是机构范畴之外的条目,这样的条目有27个;另一种情况是条目的额外父类处于机构范畴内,并处于机构类目范畴树较深的层次,这样的条目有11个。相对应地,得出机构类目范畴树存在以下两个问题:一是机构实体与其他实体重叠;二是机构子类层级混乱。
图表编号 | XD002752400 严禁用于非法目的 |
---|---|
绘制时间 | 2018.02.15 |
作者 | 贾君枝、叶壮壮 |
绘制单位 | 山西大学经济与管理学院、山西大学经济与管理学院 |
更多格式 | 高清、无水印(增值服务) |