《表2 基因表达数据集Tab.2 Gene expression dataset》

《表2 基因表达数据集Tab.2 Gene expression dataset》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《集成特征选择方法在基因表达数据上的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本研究选用白血病、结肠癌和前列腺疾病3个基因表达数据集[15],数据集具体信息如表2所示。其中Colon数据集为结肠癌数据集,正类为结肠癌样本,负类为正常组织样本。Leukemia数据集为白血病数据集,正类为急性淋巴细胞白血病(acute lymyhoblastic leubemia,ALL)样本,负类为急性髓性白血病(acute lymyhoblastic leubemia,AML)样本。Prostate数据集为前列腺疾病数据集,正类为前列腺样本,负类为正常组织样本。基因表达数据为数值型数据,列为样本,行为基因。以Colon数据集为例,是一个62列2 000行矩阵形式的数据集。为了评价特征子集的分类预测性能,使用支持向量机(support vector machine,SVM)作为分类器进行测试。在实验过程中,支持向量机的核函数选用线性核。为预防过拟合现象和人为因素的影响,对数据集进行五折交叉验证实验。