《表1 筛选出的14个描述符及其意义》

《表1 筛选出的14个描述符及其意义》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于QSAR模型的有机磷化合物毒性预测》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

本文使用R语言对数据进行预处理,用R语言“caret”包的nearZeroVar函数去除接近于常数的描述符。根据描述符与描述符两两之间的相关系数,使用findCorrelation函数去除相关系数大于0.9的描述符,最终得到43个描述符。并使用R语言preProcess函数对数据中的描述符进行标准化。同样使用R语言建立线性核函数的SVM模型。本文用后退法作为变量筛选方法,以RMSE作为评价标准对预处理后的43个描述符进行筛选,最终得到14个对SVM模型贡献较大的描述符(表1)。其中5个是结构描述符(Me,Mp,RBF,nDB,n O),8个拓扑描述符(TI1,TIE,PW4,PJI2,T.N..O.,T.O..S.,T.O..P.,T.P..Cl.)和一个连接性指数(X5A)。文中用“caret”包对SVM模型筛选的描述符做了重要性分析,计算的重要性评分结果如表1,文中对重要性评分大于0.2的6个描述符进行了简单解释。