《表4 属性值归一化示例:基于简介文本的中文人物关系图谱属性补全与纠错》
人物属性,是人物实体本身的概念.如“张三的性别是男”,“性别”即“张三”人物实体的属性.对于人物属性,其归一化包括属性名称归一化和属性值归一化.属性名称归一化是将表达相同属性意义的多个字串归并为同一字串.以“出生日期”为例,它是人物实体出现频次较高的属性之一,且出现形式多样.表3列举了表达“出生日期”的几种字串,我们令这些字串均归并为“出生日期”.对于属性值的归一化,归纳出常见的值类型,并根据每一类别总结出合理的归一化格式.部分示例如表4所示.
图表编号 | XD00168236400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.07.20 |
作者 | 杨一帆、马进、王海涛、何正球、陈文亮、张民 |
绘制单位 | 苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院、苏州大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |