《基于全景声技术的智能语音研发与产业应用》

点击下载 ⇩

全景声技术是一种空间音频技术,在国外,基于对象的全景声技术已经应用于全景声制作领域。在中国,由于技术和播放平台受限等原因,全景声采集和播放一直以来处于探索阶段。音频领域的核心技术长时间以来由外国企业或科研机构掌握。项目研究以基于声场理念的 Ambisonics技术,它是一种声道独立的球形声场再现技术。它除了可以还放水平面信息外,还能还放自下而上的高度信息,更真实的营造出四周由远及近的音效,呈现出动态的声音效果、沉浸式的听觉感受。

主要技术创新点:

1.发明了“一种生成虚拟环绕声的方法与装置”;

2.制定了新的声场信号元数据存储规范;

3.实现了针对不同场景,不同内容,动态生成最优虚拟环绕声的音频技术;

4.创立了一套从分析,到渲染实施的整体解决方案。

通过头部跟踪器获取用户头部旋转的旋转角度,根据该旋转角度,生成旋转矩阵,根据第一音频信号,获取第一音频信号的调整参数,根据该调整参数,对第一音频信号进行调整得到第二音频信号。通过Direct-ambience signal decomposition(指向-环境信号分析)算法分析音频信号,得到音频信号包括的指向性信号的比重,也可以得到音频信号包括的非指向性信号的比重。基于全景声的技术,可以精准定位不同方位的音质来源,可实时监听,支持基于业内标准Ambisonic方式的360°全方位声场处理及全景声回放,无障碍支持Google、YouTube、Facebook平台。在输出方面,支持多种数据格式输出,最高支持24bit/96kHz的无损HD音频格式。同时开发基于麦克风阵列的降噪处理,语音唤醒、回声消除、声源定位、波束成形、定向增强等核心算法,让音质更纯粹干净,基于全景声的智能语音技术,将带来更好的临场和空间沉浸感。

已取得3项发明专利,5项软件著作权,1项外观专利,1项实用新型。全景声技术和智能声学都属于前沿科技,特别是随着人工智能被写入“十三五”规划纲要,明确人工智能作为发展新一代信息技术的主要方向。全景声技术和产品广泛应用于智能家居、智慧安防、文化旅游、数字音乐、新闻传媒、人工智能等领域。公司是中关村高新技术企业,“中关村金种子企业”称号,全景声技术和产品获得“新技术新产品”,“北京礼物”铜奖。创始人孙学京博士入选“海聚工程”北京市特聘专家称号,团队成员郭红阳入选“海英人才”、“首都精神文明建设奖”。

  1. 下载详细PDF版/Doc版

提示:为方便大家复制编辑,博主已将PDF文件制作为Word/Doc格式文件。