《表2 机构实体数据集存储形式示例表》

《表2 机构实体数据集存储形式示例表》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于潜在语义索引的Wikidata机构实体聚类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

选取机构实体的名称、描述属性以及维基百科中机构实体的首段摘要三个属性值作为表征机构实体的文本描述。利用SPARQL查询并导出Wikidata中机构类下没有“Subclass of”属性的实例及其相应的属性和属性值,然后添加Wikipedia中相应的首段描述作为机构实体的附加属性。所有实例及相应的三个属性值构成一个文档集存储,每一行代表一个机构实例。选取其中500个机构实体作为机构实体数据集,处理得到的机构实体数据集存储形式如表2所示。其中,Name是机构实体的名称,Description是机构实体的描述属性,Abstract of Wikipedia是机构实体在维基百科中的摘要。