一种实现音频变调的方法和装置的制作方法

文档序号:2823381阅读:244来源:国知局
专利名称:一种实现音频变调的方法和装置的制作方法
技术领域
本发明涉及音频处理技术领域,特别涉及一种实现音频变调的方法和装置。
背景技术
众所周知,声音的基本要素主要有音调、音强和音色。音频变调是指在保持音频 信号的播放时间不变的前提下,改变声音的音调,将音调升高或降低。音频变调可改变声音 的特征,是音频处理中的一项热门技术,在许多方面都存在着广泛的应用,比如音乐合成、 配音、网络视频聊天以及保密电话等等,其中一种典型的应用当属卡拉0K机,其伴唱系统 中即可运用音频变调技术,通过调整伴奏音乐的音调以适合演唱者的嗓音。可以预见,随着 互联网和多媒体技术的迅速发展,对音频变调技术的需要将会越来越多。现有乐音体系中,根据振动频率的不同,可将音调划分成不同的音级,世界上普遍 采用的划分方式为12平均律。12平均律是指将一个纯八度划分为12个均等的频率成分, 即12个半音,各相邻半音的振动频率相差21/12,一个纯八度内的各半音间的振动频率最大 相差2倍。如果将各频率成分的振动频率升高2im倍,则相当于将音调升高了一个半音,反 之,如果将各频率成分的振动频率降低2"12倍,则相当于将音调降低了一个半音。基于上述介绍,假设某音频信号的原始频率为f,经过音频变调后的频率为f', 那么则有 其中,d称为变调模式,当d > 0时表示升调,反之表示降调。d的取值每增大或减 小1,表示将音调升高或降低了一个半音。基于上述f' 二忭?“ 可推导出变调因子仅^?“们二^^通常将变调因子a表
示为分数形式,即= 和p作为变调因子a的分子和分母,均为整数,且两者之
间无公约数(除1以外)。 如前所述,随着互联网和多媒体技术的迅速发展,对音频变调技术的需要将会越 来越多,但是,现有技术中还没有一种有效的音频变调方式,从而给用户的使用带来了很大 的不便。

发明内容
有鉴于此,本发明的主要目的在于提供一种实现音频变调的方法,能够有效地实 现升调或降调。本发明的另一目的在于提供一种实现音频变调的装置,能够有效地实现升调或降调。为达到上述目的,本发明的技术方案是这样实现的一种实现音频变调的方法,该方法包括
根据接收到的变调模式d,确定变调因子a,并进一步确定将所述变调因子a用 分数形式进行表示后的分子q和分母P ;针对每一音频信号输入帧X,分别进行以下处理基于所述q和p,对所述音频信号输入帧X进行时域上的重采样滤波;对进行重采样滤波后的音频信号输入帧X进行清、浊音判决,并确定所述进行重 采样滤波后的音频信号输入帧X的基音周期;根据所述变调模式d确定需要升调还是降调,如果需要升调,则基于清、浊音判决 结果,对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周期为单位的数据复 制处理,如果需要降调,则基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输 入帧X进行以所述基音周期为单位的数据删除处理。一种实现音频变调的装置,包括确定单元,用于根据接收到的变调模式d,确定变调因子a,并进一步确定将所述 变调因子a用分数形式进行表示后的分子q和分母P;处理单元,用于针对每一音频信号输入帧X,分别进行以下处理基于所述q和p,对所述音频信号输入帧X进行时域上的重采样滤波;对进行重采样滤波后的音频信号输入帧X进行清、浊音判决,并确定所述进行重 采样滤波后的音频信号输入帧X的基音周期;根据所述变调模式d确定需要升调还是降调,如果需要升调,则基于清、浊音判决 结果,对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周期为单位的数据复 制处理,如果需要降调,则基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输 入帧X进行以所述基音周期为单位的数据删除处理。可见,采用本发明的技术方案,通过改变采样频率来改变音频信号的频率,并对改 变频率后的音频信号进行数据复制和数据删除等处理,从而不但保持了音频信号的播放时 间不变,而且有效地实现了升调和降调。


图1为本发明实现音频变调的方法实施例的流程图。图2为本发明方法实施例中的重采样滤波过程示意图。图3为本发明方法实施例中的升调过程示意图。图4为本发明方法实施例中的降调过程示意图。图5为本发明实现音频变调的装置实施例的组成结构示意图。
具体实施例方式针对现有技术中存在的问题,本发明中提出一种实现音频变调的方案,通过改变 采样频率来改变音频信号的频率,并对改变频率后的音频信号进行数据复制和数据删除等 处理,从而不但保持了音频信号的播放时间不变,而且有效地实现了升调和降调。图1为本发明实现音频变调的方法实施例的流程图。如图1所示,包括以下步骤步骤11 根据接收到的变调模式d,确定变调因子a,并进一步确定将变调因子a 用分数形式进行表示后的分子q和分母P。
本步骤中,用户可根据自身需要输入变调模式d,比如,+2或-5等;然后,系统通过 查询表一,可确定出用户输入的变调模式d对应的变调因子a,以及将变调因子a用分数 形式进行表示后的分子q和分母P。
表1变调模式d、变调因子a,以及分子q和分母p的对应关系表1中的各取值均为本领域公认的经验值。当变调模式d取值为0时,表示不进 行音频变调,即既不升调也不降调。步骤12 基于q和P,对每一音频信号输入帧X进行时域上的重采样滤波。图2为本发明方法实施例中的重采样滤波过程示意图。如图2所示,首先,对音频 信号输入帧X进行p倍的线性插值;然后,将进行线性插值后的音频信号输入帧X通过低通 滤波器进行低通滤波,低通滤波器的增益为P,截止频率为n/q和n/p中的较小值,之后, 将进行低通滤波后的音频信号输入帧X进行q倍的采样。经过本步骤的处理后,进行重采样滤波后的音频信号输入帧X的采样频率将变为 音频信号输入帧X的采样频率的q/p倍。步骤13 对进行重采样滤波后的音频信号输入帧X进行清、浊音判决,并确定进行 重采样滤波后的音频信号输入帧X的基音周期。人类的发音过程通常有三类不同的激励方式,因而能产生三类不同的声音,即浊 音、清音和爆破音。当气流通过声门时声带的张力刚好使声带发生较低频率的张弛振动,形 成准周期性的空气脉冲时,这些空气脉冲便激励声道产生“浊音”;如果声道中某处面积很 小,气流高速冲过此处时产生湍流,当气流速度与横截面积之比大于某个门限(临界速度) 时,便产生“摩擦音”,即“清音”;如果声道某处完全闭合建立起气压,然后突然释放而产生 的声音就是爆破音。通常遇到最多的就是浊音和清音。基音是指产生浊音时声带振动所引起的周期性,基音周期的倒数称为基音频率。本步骤中,计算二 jN:。;其中,s(n)表示音频信号强度,N表
示进行重采样滤波后的音频信号输入帧X的长度,X表示延迟参数,为正整数,取值范围预先设定,通常,在8kHz的采样频率下,t的取值范围为[20,140],具体确定方式为现有技 术,不再赘述。确定不同的t对应的P ( T )中的最大值,并将该最大值与预先设定的阈值(经 验值)进行比较,如果该最大值小于阈值,则确定进行重采样滤波后的音频信号输入帧X为 清音帧,否则,为浊音帧,并将该最大值对应的延迟参数t确定为进行重采样滤波后的音 频信号输入帧X的基音周期。步骤14 根据变调模式d确定需要升调还是降调,如果需要升调,则基于清、浊音 判决结果,对进行重采样滤波后的音频信号输入帧X进行以基音周期为单位的数据复制处 理,如果需要降调,则基于清、浊音判决结果,对进行重采样滤波后的音频信号输入帧X进 行以基音周期为单位的数据删除处理。如果步骤11中用户输入的变调模式d的取值大于0,则说明需要升调,如果变调模 式d的取值小于0,则说明需要降调。根据需要升调或降调的不同,后续采用不同的处理方式,下面结合附图,对升调和 降调过程的具体实现分别进行详细说明。图3为本发明方法实施例中的升调过程示意图。如图3所示,包括步骤31 将进行重采样滤波后的音频信号输入帧X平均分为4个子块,确定进行 重采样滤波后的音频信号输入帧X是否为突变帧,并记录下发生突变的子块位置。本步骤中,计算每个子块的能量,并比较每两个相邻子块的能量大小,如果存在突 变,即存在后一子块的能量为与其相邻的前一子块的能量的12倍的情况,则确定进行重采 样滤波后的音频信号输入帧X为突变帧,并记录下发生突变的子块位置,比如第4子块的能 量是第3子块的能量的12倍,则记录下发生突变的子块位置为第4子块。通常一帧中只会 发生一次突变。如何计算每个子块的能量为现有技术,不再赘述。步骤32 将进行重采样滤波后的音频信号输入帧X拼接在所保存的超出前一音频 信号输出帧长度的数据之后。前一音频信号输出帧是指紧邻音频信号输入帧X的前一音频信号输入帧对应的 经过变调后的音频信号输出帧。步骤33 计算需要复制的数据的长度CL。CL = OutLen- (OL+InLen),其中,InLen表示进行重采样滤波后的音频信号 输入帧X的长度,OutLen表示音频信号输入帧X对应的音频信号输出帧X’的长度,
符号L」表示向下取整,0L表示所保存的超出前一音频信号输出帧 长度的数据的长度,初始值设置为0。步骤34 确定CL是否大于0,如果是,则执行步骤35,否则,执行步骤311。步骤35 如果进行重采样滤波后的音频信号输入帧X为浊音帧,则根据CL以及基 音周期,计算需复制基音周期的个数R,然后执行步骤36,如果为清音帧,则执行步骤310。
,其中,pitch 表示基音周期。步骤36 如果进行重采样滤波后的音频信号输入帧X为突变帧,且发生突变的子 块位置为第4子块,则执行步骤37,如果发生突变的子块位置不是第4子块,则执行步骤 38。
步骤37 以第3子块的结束位置作为复制起始点,将位于该复制起始点之前,且紧 邻该复制起始点的基音周期数据作为复制源,进行R次复制,并将第4子块的数据拼接在复 制的基音周期数据之后,之后,将本步骤中拼接后的数据进一步拼接在步骤32中拼接后的 数据之后,然后执行步骤39。步骤38 以第4子块的结束位置作为复制起始点,将位于该复制起始点之前,且紧 邻该复制起始点的基音周期数据作为复制源,进行R次复制,并将复制的基音周期数据拼 接在步骤32中拼接后的数据之后,然后执行步骤39。步骤39 计算当前拼接出的数据超出音频信号输出帧X’的长度0L,然后执行步骤 312。0L = R*pitch_CL,其中,pitch表示基音周期。音频信号输出帧X’表示音频信号 输入帧X对应的音频信号输出帧。本实施例中,在针对每一音频信号输入帧进行处理时,均需要用本次生成的0L替 换之前所保存的处理前一音频信号输入帧时生成的0L。步骤310 以第4子块的结束位置作为复制起始点,复制该复制起始点之前,且紧 邻该复制起始点的长度为CL的数据,并将复制的长度为CL的数据拼接在步骤32中拼接后 的数据之后,然后将0L设置为0,之后执行步骤313。由于本步骤中复制的数据长度就是步骤33中计算出的需要复制的数据长度,所 以0L的取值将为0。步骤311 将0L设置为CL的相反数,然后执行步骤312。本步骤中,将0L设置为-CL。步骤34中提到,如果步骤33中计算出的需要复制的数据长度CL小于0 (等于0 可按任一方式进行处理),则执行步骤311,而CL小于0,说明步骤32中拼接后的数据长度 已经超出音频信号输出帧X’的长度,超出的长度即为CL的相反数(因为CL为负数)。步骤312 将超出音频信号输出帧X’长度的数据进行保存,然后执行步骤313。步骤313 输出音频信号输出帧X’,即升调后的音频信号。图4为本发明方法实施例中的降调过程示意图。如图4所示,包括步骤41 将进行重采样滤波后的音频信号输入帧X平均分为4个子块,确定进行 重采样滤波后的音频信号输入帧X是否为突变帧,并记录下发生突变的子块位置。本步骤中,计算每个子决的能量,并比较每两个相邻子块的能量大小,如果存在突 变,即存在后一子块的能量为与其相邻的前一子块的能量的12倍的情况,则确定进行重采 样滤波后的音频信号输入帧X为突变帧,并记录下发生突变的子块位置。如何计算每个子块的能量为现有技术,不再赘述。步骤42 计算需要删除的数据的长度DL。DL = InLen-OutLen,其中,InLen表示进行重采样滤波后的音频信号输 入帧X的长度,OutLen表示音频信号输入帧X对应的音频信号输出帧X’的长度,
符号丄」表示向下取整。步骤43 如果进行重采样滤波后的音频信号输入帧X为浊音帧,则根据DL以及基 音周期,计算需复制基音周期的个数R,然后执行步骤44,如果为清音帧,则执行步骤47。
R = \_DLI/ Yc/z」+ 1,其中,pitch 表示基音周期。步骤44:如果进行重采样滤波后的音频信号输入帧X不是突变帧,则执行步骤45, 否则,执行步骤46。步骤45 将距离进行重采样滤波后的音频信号输入帧X的起始点长度为已保存的 SL的位置作为音频信号输出帧X,的起始点,输出长度为OutLen的数据,OutLen表示音频 信号输入帧X对应的音频信号输出帧X’的长度,删除未输出的其余数据(起始点之前和输 出终点之后的数据),然后计算新的SL,并利用新计算出的SL更新已保存的SL,之后执行步 骤48。SL = old_SL+R*pitch_DL,其中,old_SL表示已保存的SL,初始值设置为0。步骤46 基于DL和发生突变的子块位置,确定音频信号输出帧X’的起始点,输出 长度为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为0,之后执行步骤 48。本步骤中,如果发生突变的子块位置距离进行重采样滤波后的音频信号输入帧X 的起始点的距离小于DL,则以进行重采样滤波后的音频信号输入帧X的起始点作为音频信 号输出帧X’的起始点,否则,以距离进行重采样滤波后的音频信号输入帧X的起始点DL的 位置作为音频信号输出帧X’的起始点。步骤47 将进行重采样滤波后的音频信号输入帧X的起始点作为音频信号输出帧 X’的起始点,输出长度为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为 0,之后执行步骤48。步骤48 利用低通滤波器对音频信号输出帧X’进行低通滤波。低通滤波器的截止频率为音频信号输入帧X的采样频率的0. 5*q/p倍,音频信号 输入帧X的采样频率为已知的。通过本步骤的处理,可滤除超出降调后带宽的频谱。至此,即完成了本发明方法实施例所示流程。图5为本发明实现音频变调的装置实施例的组成结构示意图。如图5所示,包括确定单元51,用于根据接收到的变调模式d,确定变调因子a,并进一步确定将变 调因子a用分数形式进行表示后的分子q和分母P;处理单元52,用于针对每一音频信号输入帧X,分别进行以下处理基于q和p,对音频信号输入帧X进行时域上的重采样滤波;对进行重采样滤波后的音频信号输入帧X进行清、浊音判决,并确定进行重采样 滤波后的音频信号输入帧X的基音周期;根据变调模式d确定需要升调还是降调,如果需要升调,则基于清、浊音判决结 果,对进行重采样滤波后的音频信号输入帧X进行以基音周期为单位的数据复制处理,如 果需要降调,则基于清、浊音判决结果,对进行重采样滤波后的音频信号输入帧X进行以基 音周期为单位的数据删除处理。其中,处理单元52中可具体包括重采样滤波子单元521,用于对音频信号输入帧X进行p倍的线性插值,将进行线 性插值后的音频信号输入帧X通过低通滤波器进行低通滤波,低通滤波器的增益为p,截止 频率为n/q和n/p中的较小值,将进行低通滤波后的音频信号输入帧X进行q倍的采样;
14 判决子单元522,用于计算卜。㈣其中,S(n)表示音频信号
V /7=0 =0
强度,N表示进行重采样滤波后的音频信号输入帧X的长度,T表示延迟参数,为正整数, 取值范围预先设定;确定不同的延迟参数T对应的p ( T )中的最大值,并将最大值与预先 设定的阈值进行比较,如果最大值小于阈值,则确定进行重采样滤波后的音频信号输入帧 X为清音帧,否则,为浊音帧,并将最大值对应的延迟参数T确定为进行重采样滤波后的音 频信号输入帧X的基音周期;确定子单元523,用于根据变调模式d确定需要升调还是降调,如果变调模式d的 取值大于0,则确定需要升调,如果变调模式d的取值小于0,则确定需要降调;变调子单元524,用于当确定需要升调时,基于清、浊音判决结果,对进行重采样滤 波后的音频信号输入帧X进行以基音周期为单位的数据复制处理,当确定需要降调时,基 于清、浊音判决结果,对进行重采样滤波后的音频信号输入帧X进行以基音周期为单位的 数据删除处理。变调子单元524中又可进一步包括(为简化附图,未图示)升调子单元,用于基于清、浊音判决结果,对进行重采样滤波后的音频信号输入帧 X进行以基音周期为单位的数据复制处理,包括A1、将进行重采样滤波后的音频信号输入帧X平均分为4个子块,并计算每个子块 的能量,比较每两个相邻子块的能量大小,如果存在突变,即存在后一子块的能量为与其相 邻的前一子块的能量的12倍的情况,则确定进行重采样滤波后的音频信号输入帧X为突变 帧,并记录下发生突变的子块位置;A2、将进行重采样滤波后的音频信号输入帧X拼接在所保存的超出前一音频信号 输出帧长度的数据之后,前一音频信号输出帧为紧邻音频信号输入帧X的前一音频信号输 入帧对应的音频信号输出帧;A3、计算需要复制的数据的长度CL ;A4、确定CL是否大于0,如果是,则执行步骤A5,否则,执行步骤All ;A5、如果进行重采样滤波后的音频信号输入帧X为浊音帧,则根据CL以及基音周 期,计算需复制基音周期的个数R,然后执行步骤A6,如果为清音帧,则执行步骤A10 ;A6、如果进行重采样滤波后的音频信号输入帧X为突变帧,且发生突变的子块位 置为第4子块,则执行步骤A7,如果发生突变的子块位置不是第4子块,则执行步骤A8 ;A7、以第3子块的结束位置作为复制起始点,将位于复制起始点之前,且紧邻复制 起始点的基音周期数据作为复制源,进行R次复制,并将第4子块的数据拼接在复制的基 音周期数据之后,之后,将本步骤中拼接后的数据进一步拼接在步骤A2中拼接后的数据之 后,然后执行步骤A9;A8、以第4子块的结束位置作为复制起始点,将位于复制起始点之前,且紧邻复制 起始点的基音周期数据作为复制源,进行R次复制,并将复制的基音周期数据拼接在步骤 A2中拼接后的数据之后,然后执行步骤A9 ;A9、计算当前拼接出的数据超出音频信号输出帧X’的长度0L,然后执行步骤A12 ;
A10、以第4子块的结束位置作为复制起始点,复制复制起始点之前,且紧邻复制 起始点的长度为CL的数据,并将复制的长度为CL的数据拼接在步骤A2中拼接后的数据之 后,降0L设置为0,之后执行步骤A13 ;All、将0L设置为CL的相反数,然后执行步骤A12 ;A12、将超出音频信号输出帧X’长度的数据进行保存,然后执行步骤A13 ;A13、输出升调后的音频信号输出帧X’ ;降调子单元,用于基于清、浊音判决结果,对进行重采样滤波后的音频信号输入帧 X进行以基音周期为单位的数据删除处理,包括B1、将进行重采样滤波后的音频信号输入帧X平均分为4个子块,并计算每个子块 的能量,比较每两个相邻子块的能量大小,如果存在突变,即存在后一子块的能量为与其相 邻的前一子块的能量的12倍的情况,则确定进行重采样滤波后的音频信号输入帧X为突变 帧,并记录下发生突变的子块位置;B2、计算需要删除的数据的长度DL ;B3、如果进行重采样滤波后的音频信号输入帧X为浊音帧,则根据DL以及基音周 期,计算需复制基音周期的个数R,然后执行步骤B4,如果为清音帧,则执行步骤B7 ;B4、如果进行重采样滤波后的音频信号输入帧X不是突变帧,则执行步骤B5,否 则,执行步骤B6;B5、将距离进行重采样滤波后的音频信号输入帧X的起始点长度为已知的SL的位 置作为音频信号输出帧X’的起始点,输出长度为OutLen的数据,OutLen表示音频信号输 入帧X对应的音频信号输出帧X’的长度,删除未输出的其余数据,然后计算新的SL,利用新 计算的SL更新已保存的SL,之后执行步骤B8 ;B6、基于DL和发生突变的子块位置,确定音频信号输出帧X’的起始点,输出长度 为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为0,之后执行步骤B8 ;B7、将进行重采样滤波后的音频信号输入帧X的起始点作为音频信号输出帧X’的 起始点,输出长度为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为0,之 后执行步骤B8 ;B8、利用低通滤波器对音频信号输出帧X’进行低通滤波,低通滤波器的截止频率 为音频信号输入帧x的采样频率的0. 5*q/p倍。图5所示装置实施例的具体工作流程请参照图1所示方法实施例中的相应说明, 不再赘述。总之,采用本发明的技术方案,有效地实现了音频信号的升调和降调。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精 神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
1权利要求
一种实现音频变调的方法,其特征在于,该方法包括根据接收到的变调模式d,确定变调因子α,并进一步确定将所述变调因子α用分数形式进行表示后的分子q和分母p;针对每一音频信号输入帧X,分别进行以下处理基于所述q和p,对所述音频信号输入帧X进行时域上的重采样滤波;对进行重采样滤波后的音频信号输入帧X进行清、浊音判决,并确定所述进行重采样滤波后的音频信号输入帧X的基音周期;根据所述变调模式d确定需要升调还是降调,如果需要升调,则基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周期为单位的数据复制处理,如果需要降调,则基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周期为单位的数据删除处理。
2.根据权利要求1所述的方法,其特征在于,所述基于所述q和P,对所述音频信号输 入帧X进行时域上的重采样滤波包括对所述音频信号输入帧X进行p倍的线性插值;将进行线性插值后的音频信号输入帧X通过低通滤波器进行低通滤波,所述低通滤波 器的增益为P,截止频率为n/q和n/p中的较小值;将进行低通滤波后的音频信号输入帧X进行q倍的采样。
3.根据权利要求1所述的方法,其特征在于,所述对进行重采样滤波后的音频信号输 入帧X进行清、浊音判决,并确定基音周期包括波后的音频信号输入帧X的长度,t表示延迟参数,为正整数,取值范围预先设定;确定不同的延迟参数t对应的p (T)中的最大值,并将所述最大值与预先设定的阈 值进行比较,如果所述最大值小于所述阈值,则确定所述进行重采样滤波后的音频信号输 入帧X为清音帧,否则,为浊音帧,并将所述最大值对应的延迟参数T确定为所述进行重采 样滤波后的音频信号输入帧X的基音周期。
4.根据权利要求1 3中任一项所述的方法,其特征在于,所述根据所述变调模式d确 定需要升调还是降调包括如果所述变调模式d的取值大于0,则确定需要升调,如果所述变调模式d的取值小于 0,则确定需要降调。
5.根据权利要求1 3中任一项所述的方法,其特征在于,所述基于清、浊音判决结果, 对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周期为单位的数据复制处 理包括A1、将所述进行重采样滤波后的音频信号输入帧X平均分为4个子块,并计算每个子块 的能量,比较每两个相邻子块的能量大小,如果存在突变,即存在后一子块的能量为与其相 邻的前一子块的能量的12倍的情况,则确定所述进行重采样滤波后的音频信号输入帧X为 突变帧,并记录下发生突变的子块位置; ;其中,s(n)表示音频信号强度,N表示进行重采样滤A2、将所述进行重采样滤波后的音频信号输入帧X拼接在所保存的超出前一音频信号 输出帧长度的数据之后,所述前一音频信号输出帧为紧邻所述音频信号输入帧X的前一音 频信号输入帧对应的音频信号输出帧; A3、计算需要复制的数据的长度CL ;A4、确定所述CL是否大于0,如果是,则执行步骤A5,否则,执行步骤All ; A5、如果所述进行重采样滤波后的音频信号输入帧X为浊音帧,则根据所述CL以及基 音周期,计算需复制基音周期的个数R,然后执行步骤A6,如果为清音帧,则执行步骤A10 ; A6、如果所述进行重采样滤波后的音频信号输入帧X为突变帧,且发生突变的子块位 置为第4子块,则执行步骤A7,如果发生突变的子块位置不是第4子块,则执行步骤A8 ;A7、以第3子块的结束位置作为复制起始点,将位于所述复制起始点之前,且紧邻所述 复制起始点的基音周期数据作为复制源,进行R次复制,并将第4子块的数据拼接在复制的 基音周期数据之后,之后,将本步骤中拼接后的数据进一步拼接在步骤A2中拼接后的数据 之后,然后执行步骤A9;A8、以第4子块的结束位置作为复制起始点,将位于所述复制起始点之前,且紧邻所述 复制起始点的基音周期数据作为复制源,进行R次复制,并将复制的基音周期数据拼接在 步骤A2中拼接后的数据之后,然后执行步骤A9 ;A9、计算当前拼接出的数据超出音频信号输出帧X’的长度0L,然后执行步骤A12 ;所述 音频信号输出帧X’表示所述音频信号输入帧X对应的音频信号输出帧;A10、以第4子块的结束位置作为复制起始点,复制所述复制起始点之前,且紧邻所述 复制起始点的长度为CL的数据,并将复制的长度为CL的数据拼接在步骤A2中拼接后的数 据之后,将0L设置为0,之后执行步骤A13 ;All、将0L设置为CL的相反数,然后执行步骤A12 ;A12、将超出音频信号输出帧X’长度的数据进行保存,然后执行步骤A13 ;A13、输出升调后的音频信号输出帧X’。
6.根据权利要求5所述的方法,其特征在于,所述计算需要复制的数据的长度CL包括CL = 0utLen-(0L+InLen),其中,InLen表示进行重采样滤波后的音频信号输入帧X的 长度,OutLen表示音频信号输出帧X’的长度,OutLen= 彻* 」,符号L」表示向下取 整,0L表示所保存的超出前一音频信号输出帧长度的数据的长度,初始值设置为0。
7.根据权利要求5所述的方法,其特征在于,所述根据所述CL以及基音周期,计算需复 制基音周期的个数R包括R= [CL/pitch\ + 1,其中,所述pitch表示基音周期。
8.根据权利要求5所述的方法,其特征在于,所述计算当前拼接出的数据超出音频信 号输出帧X’数据的长度0L包括0L = R*pitch-CL,其中,所述pitch表示基音周期。
9.根据权利要求1 3中任一项所述的方法,其特征在于,所述基于清、浊音判决结果, 对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周期为单位的数据删除处 理包括B1、将所述进行重采样滤波后的音频信号输入帧X平均分为4个子块,并计算每个子块的能量,比较每两个相邻子块的能量大小,如果存在突变,即存在后一子块的能量为与其相邻的前一子块的能量的12倍的情况,则确定所述进行重采样滤波后的音频信号输入帧X为 突变帧,并记录下发生突变的子块位置;B2、计算需要删除的数据的长度DL ;B3、如果所述进行重采样滤波后的音频信号输入帧X为浊音帧,则根据所述DL以及基 音周期,计算需复制基音周期的个数R,然后执行步骤B4,如果为清音帧,则执行步骤B7 ;B4、如果所述进行重采样滤波后的音频信号输入帧X不是突变帧,则执行步骤B5,否 则,执行步骤B6;B5、将距离所述进行重采样滤波后的音频信号输入帧X的起始点长度为已保存的SL的 位置作为音频信号输出帧X’的起始点,输出长度为OutLen的数据,所述OutLen表示所述 音频信号输入帧X对应的音频信号输出帧X’的长度,删除未输出的其余数据,然后计算新 的SL,利用新计算出的SL更新已保存的SL,之后执行步骤B8 ;B6、基于所述DL和发生突变的子块位置,确定音频信号输出帧X’的起始点,输出长度 为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为0,之后执行步骤B8 ;B7、将所述进行重采样滤波后的音频信号输入帧X的起始点作为音频信号输出帧X’的 起始点,输出长度为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为0,之 后执行步骤B8 ;B8、利用低通滤波器对音频信号输出帧X’进行低通滤波,所述低通滤波器的截止频率 为音频信号输入帧X的采样频率的0. 5*q/p倍。
10.根据权利要求9所述的方法,其特征在于,所述计算需要删除的数据的长度DL包括DL = InLen-OutLen,其中,所述InLen表示进行重采样滤波后的音频信号输入帧X的 长度,所述OutLen表示音频信号输出帧X’的长度, 表示向 下取整。
11.根据权利要求9所述的方法,其特征在于,所述根据所述DL以及基音周期,计算需 复制基音周期的个数R包括 ,其中,所述pitch表示基音周期。
12.根据权利要求9所述的方法,其特征在于,所述计算新的SL包括SL = old_SL+R*pitch-DL,其中,所述old_SL表示已保存的SL,初始值设置为0。
13.根据权利要求9所述的方法,其特征在于,所述基于所述DL和发生突变的子块位 置,确定音频信号输出帧X’的起始点包括如果发生突变的子块位置距离所述进行重采样滤波后的音频信号输入帧X的起始点 的距离小于DL,则以所述进行重采样滤波后的音频信号输入帧X的起始点作为音频信号输 出帧X’的起始点,否则,以距离所述进行重采样滤波后的音频信号输入帧X的起始点DL的 位置作为音频信号输出帧X’的起始点。
14.一种实现音频变调的装置,其特征在于,包括确定单元,用于根据接收到的变调模式d,确定变调因子a,并进一步确定将所述变调 因子a用分数形式进行表示后的分子q和分母P;处理单元,用于针对每一音频信号输入帧X,分别进行以下处理基于所述q和P,对所述音频信号输入帧X进行时域上的重采样滤波; 对进行重采样滤波后的音频信号输入帧X进行清、浊音判决,并确定所述进行重采样 滤波后的音频信号输入帧X的基音周期;根据所述变调模式d确定需要升调还是降调,如果需要升调,则基于清、浊音判决结 果,对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周期为单位的数据复制 处理,如果需要降调,则基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输入 帧X进行以所述基音周期为单位的数据删除处理。
15.根据权利要求14所述的装置,其特征在于,所述处理单元包括 重采样滤波子单元,用于对所述音频信号输入帧X进行p倍的线性插值,将进行线性插 值后的音频信号输入帧X通过低通滤波器进行低通滤波,所述低通滤波器的增益为p,截止 频率为n/q和n/p中的较小值,将进行低通滤波后的音频信号输入帧X进行q倍的采样;判决子单元,用于 ,其中,s(n)表示音频信号强度,N表示进行重采样滤波后的音频信号输入帧X的长度,X表示延迟参数,为正整数,取值范围 预先设定;确定不同的延迟参数t对应的p ( T )中的最大值,并将所述最大值与预先设定 的阈值进行比较,如果所述最大值小于所述阈值,则确定所述进行重采样滤波后的音频信 号输入帧X为清音帧,否则,为浊音帧,并将所述最大值对应的延迟参数t确定为所述进行 重采样滤波后的音频信号输入帧X的基音周期;确定子单元,用于根据所述变调模式d确定需要升调还是降调,如果所述变调模式d的 取值大于0,则确定需要升调,如果所述变调模式d的取值小于0,则确定需要降调;变调子单元,用于当确定需要升调时,基于清、浊音判决结果,对所述进行重采样滤波 后的音频信号输入帧X进行以所述基音周期为单位的数据复制处理,当确定需要降调时, 基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输入帧X进行以所述基音周 期为单位的数据删除处理。
16.根据权利要求15所述的装置,其特征在于,所述变调子单元包括 升调子单元,用于基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输入帧 X进行以所述基音周期为单位的数据复制处理,包括A1、将所述进行重采样滤波后的音频信号输入帧X平均分为4个子块,并计算每个子块 的能量,比较每两个相邻子块的能量大小,如果存在突变,即存在后一子块的能量为与其相 邻的前一子块的能量的12倍的情况,则确定所述进行重采样滤波后的音频信号输入帧X为 突变帧,并记录下发生突变的子块位置;A2、将所述进行重采样滤波后的音频信号输入帧X拼接在所保存的超出前一音频信号 输出帧长度的数据之后,所述前一音频信号输出帧为紧邻所述音频信号输入帧X的前一音 频信号输入帧对应的音频信号输出帧; A3、计算需要复制的数据的长度CL ;A4、确定所述CL是否大于0,如果是,则执行步骤A5,否则,执行步骤All ;A5、如果所述进行重采样滤波后的音频信号输入帧X为浊音帧,则根据所述CL以及基音周期,计算需复制基音周期的个数R,然后执行步骤A6,如果为清音帧,则执行步骤A10 ; A6、如果所述进行重采样滤波后的音频信号输入帧X为突变帧,且发生突变的子块位 置为第4子块,则执行步骤A7,如果发生突变的子块位置不是第4子块,则执行步骤A8 ;A7、以第3子块的结束位置作为复制起始点,将位于所述复制起始点之前,且紧邻所述 复制起始点的基音周期数据作为复制源,进行R次复制,并将第4子块的数据拼接在复制的 基音周期数据之后,之后,将本步骤中拼接后的数据进一步拼接在步骤A2中拼接后的数据 之后,然后执行步骤A9;A8、以第4子块的结束位置作为复制起始点,将位于所述复制起始点之前,且紧邻所述 复制起始点的基音周期数据作为复制源,进行R次复制,并将复制的基音周期数据拼接在 步骤A2中拼接后的数据之后,然后执行步骤A9 ;A9、计算当前拼接出的数据超出音频信号输出帧X’的长度0L,然后执行步骤A12;所述 音频信号输出帧X’表示所述音频信号输入帧X对应的音频信号输出帧;A10、以第4子块的结束位置作为复制起始点,复制所述复制起始点之前,且紧邻所述 复制起始点的长度为CL的数据,并将复制的长度为CL的数据拼接在步骤A2中拼接后的数 据之后,降0L设置为0,之后执行步骤A13 ;All、将0L设置为CL的相反数,然后执行步骤A12 ;A12、将超出音频信号输出帧X’长度的数据进行保存,然后执行步骤A13 ;A13、输出升调后的音频信号输出帧X’ ;降调子单元,用于基于清、浊音判决结果,对所述进行重采样滤波后的音频信号输入帧 X进行以所述基音周期为单位的数据删除处理,包括B1、将所述进行重采样滤波后的音频信号输入帧X平均分为4个子块,并计算每个子块 的能量,比较每两个相邻子块的能量大小,如果存在突变,即存在后一子块的能量为与其相 邻的前一子块的能量的12倍的情况,则确定所述进行重采样滤波后的音频信号输入帧X为 突变帧,并记录下发生突变的子块位置; B2、计算需要删除的数据的长度DL ;B3、如果所述进行重采样滤波后的音频信号输入帧X为浊音帧,则根据所述DL以及基 音周期,计算需复制基音周期的个数R,然后执行步骤B4,如果为清音帧,则执行步骤B7 ;B4、如果所述进行重采样滤波后的音频信号输入帧X不是突变帧,则执行步骤B5,否 则,执行步骤B6;B5、将距离所述进行重采样滤波后的音频信号输入帧X的起始点长度为已知的SL的位 置作为音频信号输出帧X’的起始点,输出长度为OutLen的数据,所述OutLen表示所述音 频信号输入帧X对应的音频信号输出帧X’的长度,删除未输出的其余数据,然后计算新的 SL,利用新计算的SL更新已保存的SL,之后执行步骤B8 ;B6、基于所述DL和发生突变的子块位置,确定音频信号输出帧X’的起始点,输出长度 为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为0,之后执行步骤B8 ;B7、将所述进行重采样滤波后的音频信号输入帧X的起始点作为音频信号输出帧X’的 起始点,输出长度为OutLen的数据,删除未输出的其余数据,并将已保存的SL设置为0,之 后执行步骤B8 ;B8、利用低通滤波器对音频信号输出帧X’进行低通滤波,所述低通滤波器的截止频率为音频信号输入帧X的采样频率的0. 5*q/p倍。
全文摘要
本发明提供了一种实现音频变调的方法和装置根据接收到的变调模式d,确定变调因子α,以及变调因子α用分数形式进行表示后的分子q和分母p;针对每一音频信号输入帧X基于q和p,对音频信号输入帧X进行时域上的重采样滤波;对进行重采样滤波后的音频信号输入帧X进行清、浊音判决,并确定进行重采样滤波后的音频信号输入帧X的基音周期;根据变调模式d确定需要升调还是降调,如果需要升调,则基于清、浊音判决结果,对进行重采样滤波后的音频信号输入帧X进行以基音周期为单位的数据复制处理,如果需要降调,则基于清、浊音判决结果,对进行重采样滤波后的音频信号输入帧X进行以基音周期为单位的数据删除处理。应用本发明所述方案,能够有效地实现升调或降调。
文档编号G10L19/14GK101847404SQ20101012914
公开日2010年9月29日 申请日期2010年3月18日 优先权日2010年3月18日
发明者李靓, 潘兴德 申请人:北京天籁传音数字技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1