《表1 语音信号转换为语谱图的参数设置数据表》
提示:宽带有限、当前游客访问压缩模式
本系列图表出处文件名:随高清版一同展现
《HR-DCGAN方法的帕金森声纹样本扩充及识别研究》
数据集共计176个语音信号.分别将每次发音分割成时间为2s的语音片段,所以一个wav格式的语音文件可以分割为3个2s的语音片段,包括原始语音片段,可以将数据集初步扩大四倍.再对每个语音片段利用Matlab2016a进行语音信号预处理后分别生成256×256×3分辨率的JPEG格式的语谱图.已知语音信号的采样频率为44.1kHz,本文将NFFT点数设为2048,帧长为46.44ms,帧移为帧长的1/4,帧重叠部分取为帧长的3/4,此时生成的语谱图谐波纹理清晰且声纹特征明显,参数设置如表1所示.
图表编号 | XD0096857100 严禁用于非法目的 |
---|---|
绘制时间 | 2019.09.01 |
作者 | 王娟、徐志京 |
绘制单位 | 上海海事大学信息工程学院、上海海事大学信息工程学院 |
更多格式 | 高清、无水印(增值服务) |