一种携带位置信息的语音编码方法与流程

文档序号:14720950发布日期:2018-06-17 14:36阅读:230来源:国知局

本发明涉及语言编码技术,尤其是指一种携带位置信息的语音编码方法。



背景技术:

目前声音数据格式中一般仅含音频信息,并没有单独将发声源方位信息进行编码。能够让人有方位感的音频格式为5.1或7.1音轨的音频文件。然而5.1或7.1的音频文件,需要支持多声道的声卡及多个音箱方能让人感受到声音的方位。目前虚拟5.1、虚拟7.1处理,都是需要原声音数数含5.1音源或7.1音源,否则无法重现声音的环绕效果。



技术实现要素:

本发明针对现有技术的问题提供一种携带位置信息的语音编码方法,在音频格式中携带有声源方位信息,实现在语音信息中携带位置信息。

为了解决上述技术问题,本发明采用如下技术方案:

一种携带位置信息的语音编码方法,包括:

(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;

(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;

(3)、重新编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。

其中,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号进行码速调整。

本发明的有益效果:

本发明依次通过信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。

具体实施方式

为了便于本领域技术人员的理解,下面结合实施例对本发明作进一步的说明,实施方式提及的内容并非对本发明的限定。以下对本发明进行详细的描述。

在日常生活中某些情况下,例如电影或游戏的音频中,往往需要将一些声音播放出来,使得人感觉是在某个方向发出来的。如:某电影中需要从右前方45度方向、距离3m处,发出狗叫声,那么我们可以将采集到的狗叫声,再加上此位置信息(右前方45度,3m远),进行统一编码。本发明所提供的一种携带位置信息的语音编码方法,具体包括以下步骤:

(1)、信号获取步骤:通过受话器采集语音信号,通过传感器或人工输入方式形成位置信息;(2)、转码步骤:通过A/D转换器将语音信号由语音模拟信号转换为语音数字信号,通过位置编码器将位置信息转化为固定长度的二进制位置信息;(3)、编码步骤:通过语音合成器将二进制位置信息和语音数字信号进行重新生成新的音频数据。本发明通过上述信号获取、转码以及重新编码等步骤将位置信息与语音进行统一编码,实现了在语音信息中携带位置信息。可灵活根据声卡特征进行环绕音音频恢复,无论是立体声声卡、5.1声卡还是7.1声卡都将能获取相应携带位置信息的音频数据。

在语音的编码格式中,含有位置信息字段的含义及数学模型如下:位置信息是音源的一个位置信息,是在某一坐标系内的一个坐标值。以听音者两耳中心位置为原点,可以在二维或三维空间内,进行定位,在其二维或三维的坐标系中,可以获取发音源位置的坐标数值。位置信息在二维空间内采用角度与距离值或者采用正交坐标系,在三维空间内采用三维笛卡尔坐标系。转码步骤中的位置信息无论是二维位置信息还是三维的位置信息,如(x,y)、(r,θ)、或(x,y,z)、(x,α,β)等,均可通过位置编码器将其转换为固定长度的二进制码。

在本发明中,为了使得位置信息与语音信息实现统一编码,进行编码步骤前,所述二进制位置信息缓存于缓存器BUF内,且语音数字信号通过码速调整器进行码速调整。然后,再确定声音与位置信息的一个对应方式,可以有两种不同处理方式:1)以固定时长T的语音信息匹配位置信息,T将会在编码的头部信息中进行说明,以适应不同场景的设计需求;2)以固定位宽L的语音信息匹配位置信息,L将会在编码的头部信息中进行说明,以适应不同场景的设计需求。

码速调整器将语音信息按照固定T时长或者固定位宽L的处理方式进行码速调整,然后找到二进制位置信息在语音数据流中插入的位置,语音合成器将位置信息插入语音数字信息中,实现统一编码。

以上所述,仅是本发明较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明以较佳实施例公开如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当利用上述揭示的技术内容作出些许变更或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明技术是指对以上实施例所作的任何简单修改、等同变化与修饰,均属于本发明技术方案的范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1