《表3 单源、多源模式匹配结果》
以抓取到的北京市政务数据和企业数据为例,对数据融合的过程和结果进行展示和分析.首先,对多领域数据进行自动化模式匹配.为了多方面地对算法效果进行分析和验证,我们选取来自北京市水务局的(行政许可,行政处罚),来自北京市食品药品监督管理局的(保健食品生产单位证件信息,保健食品企业标准备案信息),以及分别来自北京市水务局和网络的(行政许可,企业信息),来自北京市食品药品监督管理局和北京市应急管理局的(食品生产企业,标准化达标信息)四组模式匹配表对作为模式匹配算法的输入,具体的匹配结果见表3.可见,无论是对于单源关系数据,还是多源关系数据,模式匹配算法均可以将匹配属性准确地检测出来,相应的匹配属性对具有较高的收益值,可以为下一步实体对齐提供可靠参考.上述多例模式匹配结果,验证了本文模式匹配算法用于单源、多源数据属性对齐发现的有效性.
图表编号 | XD00168233600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.20 |
作者 | 丁玥、王涓、卢卫、荣垂田、杜小勇 |
绘制单位 | 数据工程与知识工程教育部重点实验室(中国人民大学)、中国人民大学信息学院、数据工程与知识工程教育部重点实验室(中国人民大学)、中国人民大学信息学院、数据工程与知识工程教育部重点实验室(中国人民大学)、中国人民大学信息学院、天津工业大学计算机科学与技术学院、数据工程与知识工程教育部重点实验室(中国人民大学)、中国人民大学信息学院 |
更多格式 | 高清、无水印(增值服务) |