《表3 纵向联邦学习:北京某保险公司B数据示例》
同样的,以两个数据孤岛为例,仍然用矩形(D)来表示每一个数据拥有方的数据集,矩形的每一行代表一个对象ID(i),每一列代表当前ID的某一种特征,根据特征集(x)预测每个ID的标签(y)。以位于同一城市的某生产嵌入式加固计算机的军工企业和某保险公司为例,军工企业所生产的嵌入式加固计算机主要供武警、部队、公安、勘探、测绘等行业以及各种野外作业人员选用,而这类人员通常又具有较高的人身和财产安全保障需求,所以同一城市的该类军工企业和保险公司具有较多的客户重叠,但是,由于这两类企业的业务类型相去甚远,他们的客户特征相同字段较少,如表3和表4所示,军工企业和保险公司特征没有交集(x),但是由于位于同一城市,客户大量重复(i),如i1,i2,i3和i4;并且两家企业只有一方包含标签(y),即“是否购买意外伤害险”。
图表编号 | XD00164973000 严禁用于非法目的 |
---|---|
绘制时间 | 2020.01.20 |
作者 | 贾延延、张昭、冯键、王春凯 |
绘制单位 | 中国再保险(集团)股份有限公司博士后科研工作站、中国科学院计算技术研究所、中国电子科技集团公司电子科学研究院、中国再保险(集团)股份有限公司信息技术中心、中国再保险(集团)股份有限公司博士后科研工作站 |
更多格式 | 高清、无水印(增值服务) |