《表1 算法对比:基于局部结构保留的级联子空间深度聚类》
MNIST-FULL和MNIST-TEST数据集是Le Cun等人[13]提出的一个经典手写字体识别库,分别包含70 000和10 000张手写数字图像,每张均为28×28像素。所有MINST图像都是从10个手写数字中取样的。本文将每张图片转为一个784维向量。REUTERS包含了大约81 000篇带有类别树的英语新闻报道[14]。本文采用4个根本类别作为标签:企业/工业、政府/社会、市场和经济,同时排除了所有具有多个标签的文件。在此基础上随机抽取了10 000个例子的子集,并计算了2 000个最常用单词的tf-idf(term frequency inverse document frequency)的特征向量。样本数据集称之为REUTERS-10 K。表1中统计了三个数据集的信息。
图表编号 | XD00198013300 严禁用于非法目的 |
---|---|
绘制时间 | 2020.08.05 |
作者 | 熊李艳、朱宁 |
绘制单位 | 华东交通大学信息工程学院、华东交通大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |