《表2 实验参数设定:基于XGBoost与拓扑结构信息的蛋白质复合物识别算法》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于XGBoost与拓扑结构信息的蛋白质复合物识别算法》
本文使用MIPS[17]标准库中顶点总数大于2的蛋白质复合物作为正样本,负样本为随机生成的子图。考虑到样本数目不足以及保证正负样本分布一致,本文将每个正样本对应随机生产大小相同的20个负样本。将正负样本结合得到模型的训练集D。构造完训练集后,将训练集作为输入放入XGBoost模型进行训练。XGBoost模型的最佳参数使用网格搜索的方法确定,本文使用的各个参数如表2,模型迭代次数设置为500次。模型训练结束后,得出各个特征在训练过程中的重要性如图1所示。
图表编号 | XD00163185800 严禁用于非法目的 |
---|---|
绘制时间 | 2020.05.10 |
作者 | 徐周波、杨健、刘华东、黄文文 |
绘制单位 | 广西可信软件重点实验室(桂林电子科技大学)、广西可信软件重点实验室(桂林电子科技大学)、广西可信软件重点实验室(桂林电子科技大学)、桂林电子科技大学机电工程学院、广西可信软件重点实验室(桂林电子科技大学) |
更多格式 | 高清、无水印(增值服务) |