《表1 不同类别的结构域在训练集和验证集中的数目》

《表1 不同类别的结构域在训练集和验证集中的数目》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于卷积神经网络的蛋白质折叠类型最小特征提取》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

为了构建蛋白质接触图数据库,首先需要获取包含有蛋白质结构域中全部原子空间坐标的蛋白质PDB文件.通过对SCOPe(2.07版本)和ASTRAL(2.07版本)数据库[13]进行检索和筛选,共获得包含30185个蛋白质结构域的PDB文件以及它们所对应的在类层次和折叠类型层次上的SCOPe分类信息.这些结构域之间的序列相似度不超过95%,保证了训练样本的精简程度,避免因大量样本过于相似而产生的过拟合现象.蛋白质的接触图数据库被分为包含27000个蛋白质结构域的测试集和包含3185个蛋白质结构域的验证集,其中不同类的结构域数目如表1所示.在训练集和测试集中对不同折叠类型进行随机筛选,并保证两者相对比例相似,以避免数据分布带来的偏差.