《表1 属性及实例数量:基于信息度量和聚类的模式集成方法》
为了验证本文方法的可行性,实验数据来自于民航旅客服务系统(PSS)中的民航旅客订座数据(PNR),以及从去哪儿和携程两大出行网站上爬取的与机票相关的字段信息。由于从网站上爬取的数据不携带模式信息只包含数据实例,因此需要根据数据实例表示语义信息人工生成相应的属性名称。经过人工处理后的这三种数据源的模式异构,不同源模式中存在相互匹配的属性,同时也选择了一些非匹配属性,用于验证方法的通用性。实验过程中根据数据的不同模式将所有数据分成三组,进行模式集成,实验数据基本信息如表1所示。
图表编号 | XD00112649400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.11.15 |
作者 | 曹卫东、胡炜 |
绘制单位 | 中国民航大学计算机科学与技术学院、中国民航大学计算机科学与技术学院 |
更多格式 | 高清、无水印(增值服务) |