《表1 筛选出的14个描述符及其意义》
本文使用R语言对数据进行预处理,用R语言“caret”包的nearZeroVar函数去除接近于常数的描述符。根据描述符与描述符两两之间的相关系数,使用findCorrelation函数去除相关系数大于0.9的描述符,最终得到43个描述符。并使用R语言preProcess函数对数据中的描述符进行标准化。同样使用R语言建立线性核函数的SVM模型。本文用后退法作为变量筛选方法,以RMSE作为评价标准对预处理后的43个描述符进行筛选,最终得到14个对SVM模型贡献较大的描述符(表1)。其中5个是结构描述符(Me,Mp,RBF,nDB,n O),8个拓扑描述符(TI1,TIE,PW4,PJI2,T.N..O.,T.O..S.,T.O..P.,T.P..Cl.)和一个连接性指数(X5A)。文中用“caret”包对SVM模型筛选的描述符做了重要性分析,计算的重要性评分结果如表1,文中对重要性评分大于0.2的6个描述符进行了简单解释。
图表编号 | XD0089675400 严禁用于非法目的 |
---|---|
绘制时间 | 2019.10.18 |
作者 | 万金玉、刘怡飞 |
绘制单位 | 泉州医学高等专科学校药学系、福建医科大学附属第二医院 |
更多格式 | 高清、无水印(增值服务) |