《表3 选取的多标签数据集》

《表3 选取的多标签数据集》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《针对弱标记数据的多标签分类算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

选取了14个具有代表性的、公开的多标签数据集,表3中总结了这些数据集各方面的一些基本信息。对于每个数据集,介绍了其所属的领域、含有实例的总数目、每个实例拥有的特征数目、每个实例拥有的标签数目、标签的基数或势和p值的大小。其中Cardinality表示标签的基数或势,其值可根据公式(6)进行计算,它表示为每个实例所分配到的标签的平均数目,Density为标签的密度,是标签的基数与标签总数的比值,具体的计算方式见公式(7),最后的p值为标签基数的一半,在C中它限制了为每个实例所分配标签的最大数目。选取的整个数据集大小从194到43 000多不等,其中的特征维数从19维到5 000维不等,相应的标签个数从6到370多不等,同时它们涉及到广泛的领域和特征,具有一定的代表性和说服力。