《表1 语音信号转换为语谱图的参数设置数据表》

提示：宽带有限、当前游客访问压缩模式

本系列图表出处文件名：随高清版一同展现

《HR-DCGAN方法的帕金森声纹样本扩充及识别研究》

获取高清版本忘记账户？点击这里登录

下载图表忘记账户？点击这里登录

数据集共计176个语音信号．分别将每次发音分割成时间为2s的语音片段，所以一个wav格式的语音文件可以分割为3个2s的语音片段，包括原始语音片段，可以将数据集初步扩大四倍．再对每个语音片段利用Matlab2016a进行语音信号预处理后分别生成256×256×3分辨率的JPEG格式的语谱图．已知语音信号的采样频率为44.1kHz，本文将NFFT点数设为2048，帧长为46.44ms，帧移为帧长的1/4，帧重叠部分取为帧长的3/4，此时生成的语谱图谐波纹理清晰且声纹特征明显，参数设置如表1所示．

图表编号	XD0096857100 严禁用于非法目的
绘制时间	2019.09.01
作者	王娟、徐志京
绘制单位	上海海事大学信息工程学院、上海海事大学信息工程学院
更多格式	高清、无水印（增值服务）