《表4 随机森林和多元线性回归方法建模、预测结果》
为了对比随机森林算法和普通的多元线性回归(multivariable linear regression)算法的回归、预测能力,同样基于变量重要性度量和Pearson相关性分析的变量选择结果,多元线性回归方法建立模型的自变量也是SiO2、TiO2、CaO、MgO、MnO、K2O和P2O5元素,需预测的输出参数为La元素,所用的训练数据集与测试数据集均和随机森林相同。多元线性回归算法回归结果的均方根误差RMSE为6.63,可决系数R2为0.84;预测结果的均方根误差RMSE为5.24,可决系数系数R2为0.87。表4列出了本文分析的所有元素分别采用多元线性回归和随机森林方法的计算结果。显然,无论是对训练数据集的回归建模还是对测试数据集的预测,随机森林方法都更具优势。这可能是因为主量元素与稀土元素之间存在的是复杂或非线性关系,而随机森林作为评估变量间线性和非线性关系的智能方法,可以更准确地对主量元素与稀土元素之间的关系进行回归、预测。
图表编号 | XD0056955900 严禁用于非法目的 |
---|---|
绘制时间 | 2019.07.01 |
作者 | 洪瑾、甘成势、刘洁 |
绘制单位 | 中山大学地球科学与工程学院、中山大学地球科学与工程学院、中山大学地球科学与工程学院、广东省地质过程与矿产资源探查重点实验室 |
更多格式 | 高清、无水印(增值服务) |