《表2 基于深度学习的说话人识别算法》
近年来,随着计算能力的加强,运用深度学习方法来解决语音信号处理领域的问题正逐步得到研究人员们的重视,如语音识别[23-26]、说话人识别[27-30]。深度神经网络作为模式识别研究领域中的一种建模方法,其不仅具有强大的表征能力,还具有很强的分类能力。同时,大数据的存在为深度学习提供了充足的样本支持。本文所要研究的说话人识别任务是一个复杂的分类问题,其要求所采用的说话人模型需具有很强的表征能力,同时对于不同说话人的语音特征分布又要有一定区分能力。因此,采用DNN完成说话人识别任务有着其他机器学习方法不可相比的优势,本文按照深度学习在说话人识别中的作用方式大致分为特征表达、后端建模、端到端三类来综述国内外研究进展,并分析其特点和关键步骤,如表2所示。
图表编号 | XD00134385400 严禁用于非法目的 |
---|---|
绘制时间 | 2020.04.01 |
作者 | 曾春艳、马超峰、王志锋、朱栋梁、赵楠、王娟、刘聪 |
绘制单位 | 湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室、湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室、华中师范大学数字媒体技术系、湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室、湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室、湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室、湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室 |
更多格式 | 高清、无水印(增值服务) |