《表2 传统分类器的分类结果比较》
本实验中首先使用了三种该领域常用的机器学习分类算法,包括支持向量机(SVM)、朴素贝叶斯(NB)以及随机森林(RF)。并且对分类器中的参数进行调优。SVM分类器的参数比较多,其中最重要的是惩罚参数c和核函数参数g两个参数。首先使用RBF核函数,研究表明该核函数相对稳定,其次对于一组取定的c和g,利用十折交叉验证的方法,选取准确率最高的那组c和g作为最佳参数,SVM分类器的参数为:c=1.0,g=0.125;NB分类器中主要选择参数估计方法,有极大似然估计和贝叶斯估计。由于极大似然估计可能导致估计出的概率为0,会影响后验概率的结果,所以NB分类器使用贝叶斯估计;RF分类器中有三个比较重要的参数,分别是最大特征数max_features、子树数量n_estimators和最小样本叶min_sample_leaf,使用交叉验证的方法得到不同参数组合下的分类准确率,并选择准确率最高的参数组合作为最佳参数,RF的参数为max_features=auto、n_estimators=60、min_sample_leaf=30。三种分类器的分类结果如表2所示。从表2中可以看到,三种分类器中分类效果最好的是SVM分类器,准确率达到了91.3%,而另外两种分类器的分类准确率分别为89.7%和87.6%。但是这三种分类器无法获取输入数据更深层次的隐含信息,分类准确率无法达到理想的效果。
图表编号 | XD00119691100 严禁用于非法目的 |
---|---|
绘制时间 | 2020.02.01 |
作者 | 田程、胡廷、曹锐、相洁 |
绘制单位 | 太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学信息与计算机学院、太原理工大学信息与计算机学院 |
更多格式 | 高清、无水印(增值服务) |