《表1 波长的选择结果及模型的预测性能Tab.1 Selection results of wavelengths and predictive performance of the model》
本研究中需要处理的菠菜叶片的高光谱图像的特征维数高达256维,有必要对其进行特征选择以剔除冗余的特征,从而减少模型的运行时间,为日后在线检测设备的研制提供便利。为了选择出最优的特征波长子集和分类预测模型,本文尝试了统计学上的卡方检验特征选择方法并结合常用的4种机器学习分类算法,分别为:支持向量机(Support vector machine,SVM)、朴素贝叶斯模型(Naive bayesian model,NBM)、决策树(Decision tree)和线性判别分析(Linear discriminant analysis,LDA)。卡方检验(Chi-squared test)是分类问题常用的特征选择方法之一,该方法采用了统计学上的卡方检验,需要计算并排序各维特征与类别间的相关程度,然后只保留最相关的k维特征,k可由程序设定[24-26]。为了增加模型的稳定性,采用了10折交叉验证的方法对样本进行划分训练集和测试集,取10次交叉验证预测准确率的平均值和标准差对模型进行评估。如图7中实心浅蓝线和实心红线所示,红线的长度代表标准差的大小,标准差为0时红线消失,结合模型的预测准确率和选择的波长个数,蓝色虚线画出了各个模型的最优参与分类的特征个数占总特征个数的百分比,具体的波长选择结果及模型的预测性能如表1所示。
图表编号 | XD0017639200 严禁用于非法目的 |
---|---|
绘制时间 | 2018.12.01 |
作者 | 吉海彦、任占奇、饶震红 |
绘制单位 | 中国农业大学现代精细农业系统集成研究教育部重点实验室、中国农业大学农业部农业信息获取技术重点实验室、中国农业大学现代精细农业系统集成研究教育部重点实验室、中国农业大学农业部农业信息获取技术重点实验室、中国农业大学理学院 |
更多格式 | 高清、无水印(增值服务) |