《表3“出生日期”的多样性》
本文目标旨在构建人物关系图谱,而从百科网页中获取到的实体类型繁多,因此需筛选出人物类别的实体.我们综合词条标签及基本属性,通过统计所有实体词条信息,筛选出常见的人物实体属性和标签.表2列举了几种高频人物属性及标签.统计结果可以看出,与人物实体关联的属性及标签数量可观.本文利用两者共同筛选并过滤非人物实体,最终获得人物实体数量约为111万.我们对筛选结果随机采样500条进行评估,人物词条数量占比为99.80%.
图表编号 | XD00168236600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.20 |
作者 | 杨一帆、马进、王海涛、何正球、陈文亮、张民 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |