《表1 常见有监督学习算法性能特征对比表》
利用已有横波资料训练学习得到预测模型,进而预测未知横波曲线属于机器学习中有监督学习的回归问题。这类问题机器学习算法主要有:线性回归、决策树、随机森林、AdaBoost与神经网络等。线性回归是一种广泛应用的算法,是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。决策树是一种用于分类和回归的非参数监督学习方法,它创建一个模型,通过从数据特性中推导出简单的决策规则来预测目标变量的值。信息增益、剪枝处理、验证集精度是决策树学习的几个关键点。决策树学习的代表性算法有ID3、C4.5和CART。随机森林是指利用多棵决策树对样本进行训练并预测的一种算法,也就是说随机森林算法是一个包含多个决策树的算法,其输出的类别由个别决策树输出类别的众树来决定。Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。神经网络模仿生物神经网络的结构和功能的数学模型或计算模型,用于对函数进行估计或近似。神经网络主要由输入层、隐藏层和输出层构成。国外学者Kevin Markham对这些常用算法性能特征的进行了对比,其对比结果见表1。
图表编号 | XD00119185800 严禁用于非法目的 |
---|---|
绘制时间 | 2019.12.25 |
作者 | 邹贤军 |
绘制单位 | 中国石化江汉油田分公司勘探开发研究院 |
更多格式 | 高清、无水印(增值服务) |