《表1 不同方法的AUC值》

《表1 不同方法的AUC值》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《数据挖掘技术在生物序列分析与识别算法上的应用》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了评估所提方法的性能,使用了来自DNA元素百科全书ENCODE项目的125个TF结合位点ChIP-seq实验,包括A549,MCF-7,H1-HESC和HUVEC。对于每种细胞类型,从峰文件中的每个记录中选择居中的101 bps作为阳性样品。为了满足模型测试要求,通过匹配正样本的大小,GC含量和重复分数,生成了相等数量的负样本。每个数据集随机分为3组:训练、验证和测试集。为了训练k-mer嵌入模型,通过将k设置为5,将跨度s设置为2来生成k-mer语料库。在Gensim包中使用Word2vec模型的Python实现来获取k-mer嵌入向量。Word2vec中的所有参数均保留其默认值。将所提方法与3种其他方法进行比较:有gkmSVM,DeepBind和CNN_ZH的超参数保持不变。如表1所示。