《表2 实验参数设定:基于XGBoost与拓扑结构信息的蛋白质复合物识别算法》

《表2 实验参数设定:基于XGBoost与拓扑结构信息的蛋白质复合物识别算法》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于XGBoost与拓扑结构信息的蛋白质复合物识别算法》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文使用MIPS[17]标准库中顶点总数大于2的蛋白质复合物作为正样本,负样本为随机生成的子图。考虑到样本数目不足以及保证正负样本分布一致,本文将每个正样本对应随机生产大小相同的20个负样本。将正负样本结合得到模型的训练集D。构造完训练集后,将训练集作为输入放入XGBoost模型进行训练。XGBoost模型的最佳参数使用网格搜索的方法确定,本文使用的各个参数如表2,模型迭代次数设置为500次。模型训练结束后,得出各个特征在训练过程中的重要性如图1所示。