《表3 选取的多标签数据集》
选取了14个具有代表性的、公开的多标签数据集,表3中总结了这些数据集各方面的一些基本信息。对于每个数据集,介绍了其所属的领域、含有实例的总数目、每个实例拥有的特征数目、每个实例拥有的标签数目、标签的基数或势和p值的大小。其中Cardinality表示标签的基数或势,其值可根据公式(6)进行计算,它表示为每个实例所分配到的标签的平均数目,Density为标签的密度,是标签的基数与标签总数的比值,具体的计算方式见公式(7),最后的p值为标签基数的一半,在C中它限制了为每个实例所分配标签的最大数目。选取的整个数据集大小从194到43 000多不等,其中的特征维数从19维到5 000维不等,相应的标签个数从6到370多不等,同时它们涉及到广泛的领域和特征,具有一定的代表性和说服力。
图表编号 | XD00134373600 严禁用于非法目的 |
---|---|
绘制时间 | 2020.03.01 |
作者 | 王晶晶、杨有龙 |
绘制单位 | 西安电子科技大学数学与统计学院、西安电子科技大学数学与统计学院 |
更多格式 | 高清、无水印(增值服务) |