《表1 扩充数据前后分类效果对比图(%)》
心音信号经过滤波、去波峰、降采样等处理后,运用隐半马尔科夫模型分割每个心动周期的S1、收缩期、S2、舒张期,利用时域、频域、MFCC以及小波变换算法共提取145个特征。第1~36个特征为时域特征;第36~72个特征为频域特征;第73~90个特征为MFCC特征;第91~145个特征为小波变换、时间复杂度和光谱复杂度特征,提取的特征数据集的维度为3 153×145。在正常和异常心音特征数据中随机抽取800条作为测试集,其余数据作为训练集和验证集,通过smote算法将异常的训练数据由465条扩充为1 860条,即扩充之后训练集和验证集中正常心音特征数据与异常心音特征数据分别为1 888条和1 860条,比例接近1:1。表1为在采用相同分类器Light GBM的情况下原始数据集与扩充数据集的分类效果对比,可看出扩充前的各项分类指标都较低,扩充后数据集比原始数据集在分类准确率、灵敏度、精确度、F1值上分别提高了16.05%、24.6%、12.92%、20.58%,可证明数据扩充的必要性和有效性。
图表编号 | XD00215133700 严禁用于非法目的 |
---|---|
绘制时间 | 2021.01.25 |
作者 | 马晶、蔡文杰、杨利 |
绘制单位 | 上海理工大学医疗器械与食品学院、上海理工大学医疗器械与食品学院、上海理工大学医疗器械与食品学院 |
更多格式 | 高清、无水印(增值服务) |