《表3 选取的多标签数据集》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《针对弱标记数据的多标签分类算法》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

选取了14个具有代表性的、公开的多标签数据集，表3中总结了这些数据集各方面的一些基本信息。对于每个数据集，介绍了其所属的领域、含有实例的总数目、每个实例拥有的特征数目、每个实例拥有的标签数目、标签的基数或势和p值的大小。其中Cardinality表示标签的基数或势，其值可根据公式（6）进行计算，它表示为每个实例所分配到的标签的平均数目，Density为标签的密度，是标签的基数与标签总数的比值，具体的计算方式见公式（7），最后的p值为标签基数的一半，在C中它限制了为每个实例所分配标签的最大数目。选取的整个数据集大小从194到43 000多不等，其中的特征维数从19维到5 000维不等，相应的标签个数从6到370多不等，同时它们涉及到广泛的领域和特征，具有一定的代表性和说服力。

图表编号	XD00134373600 严禁用于非法目的
绘制时间	2020.03.01
作者	王晶晶、杨有龙
绘制单位	西安电子科技大学数学与统计学院、西安电子科技大学数学与统计学院
更多格式	高清、无水印（增值服务）