《表1 扩充数据前后分类效果对比图(%)》

《表1 扩充数据前后分类效果对比图(%)》   提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《基于机器学习的心音识别分类研究》


  1. 获取 高清版本忘记账户?点击这里登录
  1. 下载图表忘记账户?点击这里登录

心音信号经过滤波、去波峰、降采样等处理后,运用隐半马尔科夫模型分割每个心动周期的S1、收缩期、S2、舒张期,利用时域、频域、MFCC以及小波变换算法共提取145个特征。第1~36个特征为时域特征;第36~72个特征为频域特征;第73~90个特征为MFCC特征;第91~145个特征为小波变换、时间复杂度和光谱复杂度特征,提取的特征数据集的维度为3 153×145。在正常和异常心音特征数据中随机抽取800条作为测试集,其余数据作为训练集和验证集,通过smote算法将异常的训练数据由465条扩充为1 860条,即扩充之后训练集和验证集中正常心音特征数据与异常心音特征数据分别为1 888条和1 860条,比例接近1:1。表1为在采用相同分类器Light GBM的情况下原始数据集与扩充数据集的分类效果对比,可看出扩充前的各项分类指标都较低,扩充后数据集比原始数据集在分类准确率、灵敏度、精确度、F1值上分别提高了16.05%、24.6%、12.92%、20.58%,可证明数据扩充的必要性和有效性。