《表1 DCF、LR和SVM在模拟测试集上的性能比较》

《表1 DCF、LR和SVM在模拟测试集上的性能比较》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于混合深度神经网络的基因遗传变体致病性注释》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文提出的模型是用python3.6实现的,称之为深度卷积全连接(DCF),深度学习平台采用的是Google开源平台tensorflow[21]。本文同样训练了Logistic Regression(LR)和CADD的SVM模型作为对比。LR的实现采用的是开源python包scikit-learn。本文没有直接使用CADD提供的SVM模型,因为它的模型一次只能评估100 000变体而且已经在测试集中训练过了。而是使用LIBOCAS[22]库中的SVM作为替代,它们的分类效果相当。3个模型均使用训练集进行训练,同时在训练过程中用验证集对分类器进行验证。训练完之后,分别在测试集和真实数据集进行预测。在测试集上,DCF、LR和SVM的分类准确率分别是66.44%、59.77%和58.18%(表1)。文献[9]提出的DANN在该数据集的正确率是66.1%。其他的性能指标见表1和表2。