转码方法、装置和通信设备的制作方法

文档序号:2831970阅读:400来源:国知局
专利名称:转码方法、装置和通信设备的制作方法
技术领域
本发明关于网络通信技术,特别关于转码方法及其装置。
背景技术
基于码激励线性预测(CELP :Code-Excited Linear Prediction)的语音编码是当今语音在因特网协议中的应用(VoIP:Voice on Internet Protocol)和移动通信系统中的核心技术之一,为了实现不同供应商之间通信设备的兼容与互通,需要进行不同CELP语音编码标准间的转码工作。 目前,解决这种问题的方法包括直接转码(DTE :Decode Then Encode),即用发送端的解码器将传输的比特流进行解码后恢复出重建语音,再应用接收端的编码器对重建语音进行编码,生成接收端解码器可以解码的比特流,再传送至接收端。发明人在实现本发明的过程中发现现有技术的缺陷在于降低了合成语音质量,增加了计算复杂度和总的延迟。[OO(H] 在涉及到非连续性传输(DTX-Discontinuous Transmission)的转码算法中,发明人在实现本发明的过程中发现现有技术的缺陷在于需要在媒体网关或基站中要恢复成合成语音,且对于目标端非语音参数的求取均要采用DTE方法求得,这些操作增加了转码部分的计算复杂度及总的延迟、增加成本且效率降低。 此外,目前所涉及的非连续性传输(DTX)转码算法仅仅针对发送端和目标端都打开DTX情况下提出了解决方案,但是无法满足发送端或目标端只有一方打开非连续传输情况、或者在不知道发送端是否打开非连续性传输的情况下的转码操作。因为在发送端不打开DTX而目标端打开DTX转码情况下,源比特流的帧类型信息均为语音帧,这样,无法确定目标帧的类型信息;在发送端打开DTX而目标端不打开DTX的情况下,则不需要确定目标帧类型,此时目标帧的类型信息均为语音帧,目前无法获知从SID帧或者不传输帧向语音帧转码的方式。

发明内容
本发明实施例的目的在于提供一种转码方法、装置和通信设备,根据接收端使用非连续性传输DTX属性、输入的比特流的帧类型对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。 为实现上述目的,本发明实施例提供一种转码方法,该方法包括接收发送端输入
的比特流;确定接收端使用非连续性传输属性、以及所述输入的比特流的帧类型;根据确
定的结果采用相应的处理方式对所述输入的比特流进行转码。
为实现上述目的,本发明实施例提供一种转码装置,该装置包括 接收单元,所述接收单元用于接收发送端输入的比特流; 确定单元,所述确定单元用于确定接收端使用非连续性传输属性、以及所述输入的比特流的帧类型; 第一处理单元,所述第一处理单元用于根据确定的结果采用相应的处理方式对所述输入的比特流进行转码。 为实现上述目的,本发明实施例提供一种通信设备,该通信设备包括权利要求14至16的任意一项权利要求的转码装置。 本发明实施例的有益效果在于,本发明实施例根据接收端使用非连续性传输DTX属性、以及输入的比特流的帧类型对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。


此处所说明的附图用来提供对本发明实施例的进一步理解,构成本申请的一部分,并不构成对本发明实施例的限定。在附图中
图1是本发明实施例1的转码方法流程图; 图2是本发明实施例2的在发送端不使用DTX且接收端使用DTX的情况下步骤103的处理流程图; 图3是本发明实施例2的在发送端使用DTX且接收端不使用DTX的情况下步骤103的处理流程图; 图4是本发明实施例2的在发送端使用DTX且接收端使用DTX的情况下步骤103的处理流程图; 图5是本发明实施例2的图4的步骤403中目标帧为非语音帧时的处理流程 图6是本发明实施例3的转码方法流程 图7是本发明实施例3中FEC算法流程 图8是本发明实施例4的转码装置构成示意 图9是本发明实施例5的转码装置构成示意图。
具体实施例方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图,对本发明实施例作进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
实施例1 本发明实施例提供一种转码方法,如图1所示,该方法包括接收发送端输入的比特流(见步骤101);确定接收端使用非连续性传输属性、以及该输入的比特流的帧类型(见步骤102);根据确定的结果采用相应的处理方式对该输入的比特流进行转码(见步骤103)。 在本发明实施例中,在步骤102中,确定接收端是否使用非连续性传输、以及该输入的比特流的帧类型可包括以下几种情况接收端使用DTX且该输入的比特流的帧类型为语音帧或非语音帧、接收端不使用DTX且该输入的比特流的帧类型为语音帧或非语音帧。
6这样,可对各种类型的输入的比特流进行处理,并能够按照接收端的要求对输入的比特流
进行相应的转码。并且该方法对发送端使用或不使用DTX的情况均适用。 由上述实施例可知,该方法根据接收端使用非连续性传输DTX属性、以及该输入
的比特流帧类型,对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比特
流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降低
合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。 实施例2 本发明实施例提供一种转码方法,该方法所采用的步骤如图1所示。 在步骤102中,确定接收端使用非连续性传输属性、以及该输入的比特流的帧类
型可采用如下方式 可根据预先配置的参数确定该接收端是否使用非连续性传输DTX。例如,根据DTX开关,即DTX_0N或者DTX_0FF来确定该接收端是否使用非连续性传输。
可通过对该输入的比特流的帧类型进行解码,以获取输入的比特流的帧类型,该帧类型包括语音帧和非语音帧,其中,该非语音帧可包括非传输帧(N0_DATA)和静音插入描述帧(SID:Silence Insertion Descriptor)。其中,可根据当前帧的帧类型标识确定当前帧的帧类型。例如,在G. 729ab中应用的帧类型FrameType有三类,分别由0,1,2来代表。O表示当前帧为不传输帧(N0_DATA Frame) , 1表示当前帧为语音帧(Active SpeechFrame),2代表当前帧为舒适噪声插入帧(SID Frame)。 以下参考附图对步骤103中的根据确定的结果采用相应的处理方式对处理后的该输入的比特流进行转码进行详细说明。 第一种接收端使用DTX且该输入的比特流的帧类型为语音帧。
以下以从AMR码流向G. 729ab码流转码为例进行详细说明。
如图2所示,可采用如下方式对输入的比特流进行转码。
步骤201,对输入的比特流进行解码后生成合成语音; 在本实施例中,可采用与该发送端相应的编码方式对该输入的比特流进行解码并生成合成语音,这样,可根据该合成语音用于判断目标语音激活检测(VAD :Voice ActivityDetector)结果。其中,该解码算法和生成合成语音的方法可采用现有的任何一种,此处不再赘述。 步骤202,根据该合成语音判断目标帧类型; 在本实施例中,可采用AMR-VADl算法和接收端的非连续性传输(DTX)算法确定该目标帧的类型。例如,可根据该合成语音应用自适应多速率窄带编码器(AMR-NB)编码中的VAD算法(AMR-VAD1)来确定目标帧VAD结果,即判断该目标帧是语音帧还是静音帧),结合VAD结果及接收端(如AMR向729转码,接收端指729)DTX算法确定目标帧类型。在这种情况下,从AMR向G. 729ab转码算法中,使用AMR中所使用的VAD1检测算法来代替729的VAD算法具有以下效果(l)该算法不需要LPC分析的部分结果,只需要输入语音,且其计算复杂度与729ab中所用的计算复杂度相当;(2)AMR所用的VAD1算法针对输入160个样点做一次VAD判决,原729ab针对输入80个样点做一次VAD判决。应用AMR VAD1算法可以节省VAD判决部分一半的计算复杂度。但不限于此,还可采用其它算法确定目标帧类型。
步骤203,若该目标帧类型为语音帧,则采用语音帧参数转码算法对该合成语音进行转码,以获得输出的比特流;其中,该语音帧参数转码算法可采用现有技术的任何一种,此处不再赘述。 步骤204,若该目标帧类型为非语音帧,并确定该非语音帧为非传输帧,或者为静音插入描述(SID)帧。 步骤205,若该非语音帧为非传输帧,即N0_DATA帧,则将该非传输帧,N0_DATA的帧类型传出。 步骤206,若该非语音帧为静音插入描述帧(SID),则对该目标帧,即SID帧需要的参数信息进行转码。 在本实施例中,该参数信息可包括线谱对(LSP :Line Spectrum Pair)参数和能量参数。其中, 对该LSP参数转码将原比特流,即输入的比特流中LSP信息解码后按照目标编码器量化方法重新量化后写入输出的比特流。 对该能量参数转码由于AMR-NB与G. 729ab所量化的能量信息所衡量的信号域不同,因此,在能量参数转码时,需要进行一定的转换,步骤如下 1)将解码部分参数得到的AMR-NB各帧的激励信号传出(因为接收端VAD需要合成语音,因此,激励信号是可以得到的)。 2)以80个样点为单位,求取激励信号的平均增益值Gare :
"ve ,^ - " 但不限于此,还可根据实际需要采用其它数量的样点。
3)计算用于729ab内SID帧的能量值POWER :POWER = 101ogl。 (Gave)2
4)按照目标端能量量化方法,如729,进行量化后写入输出的比特流。
步骤207,将获得的输出的比特流进行输出。 由上述可知,以从AMR码流向729码流转码为例进行详细说明。下面参照附图2对从G. 729ab码流向AMR码流转码的情况进行说明。 在步骤202中,目标帧类型的确定可采用如下方式可使用目标编码器中所提供的VAD检测算法VAD1或者VAD2,其中该VAD1或VAD2算法为AMR的两种VAD判决方法。应用该VAD算法来确定目标帧是否属于语音帧。 步骤203、204、205与上述类似,在步骤206中,若该非语音帧为SID帧,且该SID帧为SID_FIRST帧或SID_UPDATE帧,则需要针对接收端SID的要求将各个参数信息进行转码,可采用如下方式 1)根据DTX机制判断是否需要HANGOVER控制,如果需要,则需要进行缓存处理,用于SID_FIRST帧时提供相应的信息;2)若当该目标帧类型被判定为SID_UPDATE帧,则需要将目标帧,即SID帧需要的参数信息进行转码操作,该参数信息包括LSP参数和能量参数;
其中,LSP参数转码将原比特流,即输入的比特流中LSP信息解码后按照目标编码器量化方法重新量化后写入输出的比特流; 能量参数转码由于AMR-NB与G. 729ab对能量信息进行计算的信号域不同,因此,在能量参数转码时,需要进行一定的转换。由于接收端用于VAD算法时需要合成语音,因此,在能量参数转码时,采用采用AMR-NB或者G. 729ab的能量参数求取方法的方法进行转码操作。
第二种接收端不使用DTX、输入的比特流的帧类型为非语音帧。
在这种情况下,可先获得目标帧所需要的参数信息;然后采用接收端的参数编码
算法,对获得的该目标帧所需要的参数信息进行编码并写入输出的比特流。
如图3所示,该方法包括 步骤301,对该输入的比特流进行解码,以提取出该输入的非语音帧所包含的LSP参数和能量参数。在本实施例中,采用DTX解码算法提取该输入的非语音帧所包含的LSP参数和能量参数。 步骤302,对该LSP参数和能量参数进行转码,生成目标帧所需要的LSP参数信息和代数码书增益信息。 在本实施例中,对该LSP参数进行转码可根据实际情况采用上述方式进行转码。
在本实施例中,可采用如下方式将能量参数向代数码书增益信息进行转码
1)将由输入的比特流转换为参数得到AMR-NB各子帧的激励信号传出;
2)以40个样点为单位,求取激励信号的平均增益值Gare :
n~~^G,二」一Zexc —画K02 但不限于此,还可根据实际需要采用其它数量的样点进行计算。
3)对平均增益值进行幅度调整后得到目标域代数码书增益G' _ :
G' are = 3XGare 4)按照接收端代数码书量化方法进行量化后写入输出的比特流。 步骤303,使用基音延迟产生算法、增益产生算法和代数码书产生算法分别生成目
标帧所需要的基音、码书增益和代数码书参数信息;其中,该基音延迟产生算法、增益产生
算法和代数码书产生算法可采用现有的任何一种,此处不再赘述。 其中,该步骤303可与步骤302同时进行。 步骤304,在获得上述全部目标语音帧所需要的参数后,使用接收端的参数编码算法对获得的各个参数进行编码处理后写到输出比特流中。
步骤305,将输出比特流进行输出。 第三种接收端使用DTX且输入的比特流的帧类型为非语音帧。
以下参考附图4对这种情况下的转码方法进行说明。
步骤401,对输入的比特流进行解码后生成合成语音;
步骤402,根据该合成语音判断目标帧类型; 其中,步骤401、402与第一种情况中的步骤201、202类似,此处不再赘述。
步骤403,根据该目标帧类型对该输入的比特流进行相应的转码。
步骤404,对获得的输出的比特流进行输出。 在本实施例中,若该目标帧为语音帧,在步骤403中,该根据目标帧类型对该输入的比特流进行相应的转码可采用如图3所示的第二种情况的流程,即接收端不使用DTX且输入的比特流的帧类型为非语音帧的情况进行处理,此处不再赘述。 在本实施例中,若该目标帧为非语音帧,获得目标帧所需要的参数信息;采用接收端的参数编码算法对获得的目标帧所需要的参数信息进行编码并写入输出的比特流。如图5所示,包括 步骤501,采用非连续性传输解码(DTX)算法提取该输入的比特流中包含的LSP参 数和能量参数; 步骤502,对该LSP参数和该能量参数进行转码,以获取目标帧所需要的LSP参数 信息和能量参数信息; 步骤503,采用接收端的参数编码算法对获得的该目标帧所需要的参数信息进行 编码并写入输出的比特流。 第四种,接收端未使用非连续性传输且输入的比特流的帧类型为语音帧。 这种情况可采用语音帧参数转码算法对该输入的比特流进行转码。 由上述实施例可知,该方法根据接收端使用非连续性传输DTX属性、以及输入比
特流的帧类型的四种情况对输入的比特流进行相应的转码操作,这样,可对各种类型的输
入的比特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可
在不降低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。 实施例3 本发明实施例提供一种转码方法,在实施例2的基础上进一步考虑到丢帧的情
况,如图6所示,该方法包括 步骤601,接收发送端输入的比特流; 步骤602,判断该输入的比特流是否丢帧。 步骤603,若判断结果为未丢帧,则确定接收端使用非连续性传输属性、以及所述 输入的比特流的帧类型; 在本实施例中,确定接收端使用非连续性传输属性、以及输入的比特流的帧类型 可采用实施例2的方式,此处不再赘述。 步骤604,根据确定的结果采用相应的处理方式对该输入的比特流进行转码。这
时,可采用实施例2的四种情况下的转码过程进行处理,此处不再赘述。 步骤605,在步骤602中,若判断结果为丢失帧,则采用FEC算法对丢失帧的输入的
比特流进行处理。 步骤606,确定接收端使用DTX属性; 步骤607,根据确定的结果采用相应的处理方式对处理后的该输入的比特流进行 转码。在本实施例中,该确定的结果为接收端是否使用DTX、输入的比特流的帧类型,其中, 该比特流的帧类型在采用FEC算法对丢帧的比特流进行处理时已经确定。可采用实施例2 的四种情况下的转码过程进行处理,此处不再赘述。 其中,步骤605、606的顺序仅仅为本发明实施例,可先执行步骤606、再执行步骤 605. 步骤608,将转码后的输出的比特流进行输出。 在本实施例中,在步骤605中,对丢失帧的输入的比特流进行处理可采用如下方 式,如图7所示,包括 步骤701,判断发生丢帧的输入的比特流的帧类型; 在本实施例中,对当前帧的帧类型进行判断可采用如下方式如果当前帧发生丢 失,若前一个帧的类型为语音帧,则当前帧的类型也判定为语音帧。若前一个丢失帧的类型
10是SID帧或者N0_DATA帧,则当前帧的类型被定为SID帧或N0_DATA帧。这是因为N0_DATA
帧内不包含任何有用信息,因此,该N(U)ATA帧的丢失不会对解码造成影B向。步骤702,若发
生丢帧的输入的比特流的帧类型为语音帧,则对待转码的参数进行恢复。 步骤703,若发生丢帧的输入的比特流的帧类型为非语音帧,判断该非语音帧为非
传输帧或SID帧, 步骤704,若为非传输帧,则对该发生丢帧的输入的比特流不作处理。 步骤705,若为静音插入描述帧,则对待转码的参数进行恢复。 在步骤702中,当判断该丢失帧的输入的比特流的帧类型为语音帧时,以下分别
对从AMR码流向729ab码流转码、从729ab码流向AMR码流进行转码时对待转码参数进行
恢复进行说明。 第一种情况在从AMR码流向729ab码流转码的情况,需要恢复的参数可包括LSP 参数、基音参数、代数码书参数和增益参数,对这些参数进行恢复可采用如下方式
l)LSP参数的恢复 丢失帧的LSP参数lsp_ql、 lsp_q2由前一个帧的LSP参数past_lsp_q和LSP参 数均值meanjsp决定,如下式 lsp_ql(i) =lsp_q2(i) = 0. 9 Xpast_lsp_q (i)+0. 1 Xmean_lsp (i) , i = 0____9 上式中的插值因子取值为0.9。在非AMR122模式下,只恢复出一组LSP参数;在 AMR122模式下,恢复出两组相同的LSP参数。其中pastjsp—q(i)为前一个帧量化后的LSP 参数,mean—lsp(i)为LSP参数的均值。用于偏移平均(MA :Moving Average)()预测的历 史状态的更新与正常解码时相同。
2)基音参数的恢复 在发生帧丢失时,通常用前一个帧的基音信息作为当前丢失帧的基音值。当前丢 失帧的基音值的精度直接影响着合成语音的质量。由丢失帧之前多帧的信息来恢复当前的 丢失帧信息比只用丢失帧前一个帧信息来恢复当前丢失帧信息的性能会更加好。在本实施 例中,应用线性预测的方法来得到当前帧的基音信息。预测模型如下
Pitch' (i) = x+yXi 其中Pitch(i), i = 0,1,2,3,4为丢失帧之前各帧的基音值,Pitch(0)是最早的 基音值。
当前丢失帧Pitch' (5)由下式得到
Pitch' (5) = x+5y 为了确定系数a和b,采用均方误差最小准则推倒出a, b的值
4 4
五=Z [乃Yc//(0 —尸//(^(/)]2 = Z [X +少X Z'—尸Z'/C/Z(/)]2
Z=0 '.=0
使服/& = 0和朋/^ = 0,得到
4 4 3Z尸"A(0 — x
》x賜(/)-2Z賜(/)
少_
0130] 3)代数码书参数的恢复
0131] 代数码书参数采用随机生成的方法,在所提出的非DTX转码算法中,只在AMR795 和AMR74两个模式下需要对代数码书参数进行恢复。生成两个随机数,第一个随机数由13 比特构成,按3,3,3,4比特进行截断,分别对应各个轨道上脉冲的位置;第二个随机数由4 比特构成,分别代表4个轨道上脉冲的符号。
0132] 4)增益参数的恢复
0133] 根据解码端的转码情况,对增益参数gP、 gE采用下述的恢复方法,见下式
0134]gP叫 —一
0135] 其中,mean_gp_past5代表历史5点自适应码书增益量化后的均值,state为解 码端确定的状态号,P(l) = P(2) = 0. 98, P(3) = 0. 8, P(4) = 0. 3, P(5) = P(6) = 0. 2。 gp(-l)代表上一帧量化后得到的自适应码书增益值。
0136]g( = <j — 一
0137] 其中,mean_gC_paSt5代表历史5点代数码书增益量化后的均值,state为解码端 确定的状态号,C(l) = C(2) = C(3) = C(4) = C(5) = 0. 98, C(6) = 0. 7。 gc(_l)代表上 一帧量化后得到的代数码书增益值。
0138] 针对增益参数量化时MA预测用的历史需要进行更新,将历史残差的均值对当前 历史ener(O)进行更新,如下式
第二种情况在从729ab码流向AMR码流转码的情况,需要恢复的参数可包括如下 l)LSP参数的恢复
LSP参数由上一个接收到的好帧的LSP参数替代,用于LSP参数量化的MA预测器 的状态由下式更新
酬/,=[《)-i> -i>a) i ="…",10
0144] 其中,MA预测器的系数Pi,k是由上一个好帧来代替的。 0145] 2)基音参数的恢复
0146] 对基音参数进行恢复时,如果是第一个坏帧,则用上一个好帧第二子帧的整数基 音作为当前丢失帧的整数基音延迟,分数基音延迟置零;此后将上一个好帧第二子帧的整 数基音值加1存储起来,在发生连续错帧时,则用加1后的基音值进行代替即可。自加后的 基音值上限规定为143,但不限于此。
3)代数码书参数的恢复
0139]
0140]
参数 0141] 0142]
12
对代数码书参数进行恢复时,生成两个随机数,第一个随机数由13比特构成,按 3,3,3,4比特进行截断,分别对应各个轨道上脉冲的位置;第二个随机数由4比特构成,分 别代表4个轨道上脉冲的符号。
4)增益参数的恢复对于增益参数gf0 、 gr的恢复,均采用将上一帧增益参数值的衰减值作 为当前帧的增益参数,见下式 其中g。代表代数码书增益,m代表当前帧,m-1代表上一帧。g,)二0.9《-" 其中gp代表自适应码书,m代表当前帧,m-l代表上一帧。 针对增益参数量化时MA预测用的历史需要进行更新,将历史残差的均值进行衰 减后对当前历史进行更新,如下式 =(0.25t"(w—')) —4.0
/ = 1 5)激励信号的构成 激励信号由上述生成基音延迟并且插值后的自适应码书和上述随机生成的代数 码书构成,分别再乘以上述的恢复得到的自适应码书和代数码书增益。 由上述可知,对待转码的参数进行恢复后,可采用实施例2中的第一种或第四种 情况对应的处理过程对恢复后的输入的比特流进行处理,处理过程如实施例2所述,此处 不再赘述。 在步骤705,若为静音插入描述帧(SID),以下分别对从AMR码流向729ab码流转 码、从729ab码流向AMR-NB码流进行转码时对待转码的参数进行恢复的两种情况进行说 明。 第一种情况在从AMR码流向729ab码流转码的情况 可直接应用前一个SID帧的LSP参数代替当前帧的LSP参数,前一个SID帧的能
量参数代替当前SID帧的能量参数。 第二种情况从729ab码流向AMR-NB码流进行转码的情况
若当丢失帧为SID帧时,则需要分以下两种情况进行讨论 (1)如果丢失的SID帧不是非语音段的第一个SID帧,则可以用前一个SID帧的 LSP参数代替当前帧的LSP参数,前一个SID帧的能量参数代替当前SID帧的能量参数;
(2)如果丢失的SID帧是非语音段的第一个SID帧,LSP参数则由上一个好帧的 LSP参数替代;将上一个好帧的激励信号能量经过SID增益量化后的增益值作为当前丢失 SID帧的能量参数。 由上述可知,对待转码的参数进行替换后,可采用实施例2中的第二种或第三种 情况对应的处理过程对代替后的输入的比特流进行处理,处理过程如实施例2所述,此处 不再赘述。 由上述实施例可知,该方法根据接收端使用非连续性传输DTX属性、以及输入的
13比特流的帧类型对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比特 流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降低 合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。
实施例4 本发明实施例提供一种转码装置。如图8所示,该装置包括接收单元801 、确定单 元802和第一处理单元803 ;该接收单元801用于接收发送端输入的比特流;该确定单元 802用于确定接收端使用非连续性传输属性、以及该输入的比特流的帧类型;该第一处理 单元803用于根据确定的结果采用相应的处理方式对该输入的比特流进行转码。
在本实施例中,该确定单元802确定该接收端是否使用连续性传输(DTX)、该输入 的比特流的帧类型的确定方式以及确定结果如实施例2、3所述,此处不再赘述。
该转码装置的工作流程与实施例1类似,此处不再赘述。
该装置可单独使用,也可与基站或媒体网关集成在一起使用。 由上述实施例可知,该装置可根据接收端使用非连续性传输DTX属性、以及输入 的比特流的帧类型对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比 特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降 低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。
实施例5 本发明实施例提供一种转码装置。如图9所示,该装置包括接收单元801 、确定单 元802和第一处理单元803,其作用与实施例4类似。 此外,如图9所示,该装置还包括输出单元901 ,该输出单元901用于输出转码后的 输出的比特流。 在该第一处理单元803进行处理之前,还可对输入的比特流进行检测,检测该输 入的比特流是否丢失帧,因此,该装置还包括检测单元902和第二处理单元903 ;其中,该检 测单元902与该确定单元802和该第一处理单元803连接,用于检测该输入的比特流是否 丢失帧;若检测结果为未丢失帧,则该第一处理单元803根据确定的结果采用相应的处理 方式对该输入的比特流进行转码;若该检测单元902检测结果为丢失帧,则该第二处理单 元903采用帧擦除掩蔽(FEC)算法对该输入的比特流进行处理; 并且该第一处理单元803用于根据确定的结果采用相应的处理方式对该第二处 理单元903处理后的该输入的比特流进行转码。 在本实施例中,该第一处理单元803可根据确定单元802确定的不同情况对输入
的比特流进行处理,该处理过程如实施例2的四种情况所述,此处不再赘述。 在本实施例中,该第二处理单元903采用FEC算法进行处理,该处理过程如实施例
3所述,此处不再赘述。 由上述实施例可知,该装置可根据接收端使用非连续性传输DTX属性、以及输入 的比特流的帧类型对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比 特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降 低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。并且对 于发送端使用和不使用DTX的情况均适用。
实施例6
14
本发明实施例还提供一种通信设备,该设备可包括转码装置,其中该转码装置可
采用实施例4、实施例5中的任何一种,此处不再赘述。 在本实施例中,该通信设备可以为基站或媒体网关等通信设备。 由上述实施例可知,该通信设备可根据接收端使用非连续性传输DTX属性、以及
输入的比特流的帧类型对输入的比特流进行相应的转码操作,这样,可对各种类型的输入
的比特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在
不降低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。并
且对于发送端使用和不使用DTX的情况均适用。 以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详 细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保 护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本 发明的保护范围之内。
权利要求
一种转码方法,其特征在于,所述方法包括接收发送端输入的比特流;确定接收端使用非连续性传输属性、以及所述输入的比特流的帧类型;根据确定的结果采用相应的处理方式对所述输入的比特流进行转码。
2. 根据权利要求1所述的方法,其特征在于,所述确定接收端是否使用非连续性传输, 包括根据配置的参数判断所述接收端是否使用非连续性传输;所述确定输入的比特流的帧类型,包括 对所述输入的比特流进行解码,以获取帧类型信息;根据所述帧类型信息确定所述输入的比特流的帧类型;所述帧类型包括语音帧和非语 音帧。
3. 根据权利要求1所述的方法,其特征在于,若确定所述接收端使用非连续性传输且 所述输入的比特流的帧类型为语音帧,则所述根据确定的结果采用相应的处理方式对所述 输入的比特流进行转码,包括对所述输入的比特流进行解码后生成合成语音; 根据所述合成语音判断目标帧类型;若所述目标帧类型为语音帧,则采用语音帧参数转码算法对所述合成语音进行转码; 若所述目标帧类型为非语音帧且为非传输帧,则将所述非传输帧的帧类型传出; 若所述目标帧类型为非语音帧且为静音插入描述帧,则对所述目标帧需要的参数信息 进行转码。
4. 根据权利要求1所述的方法,其特征在于,若确定所述接收端不使用非连续性传输 且所述输入的比特流的帧类型为非语音帧,则所述根据确定的结果采用相应的处理方式对 所述输入的比特流进行转码,包括获得目标帧所需要的参数信息;采用接收端的参数编码算法对获得的所述目标帧所需要的参数信息进行编码并写入 输出的比特流。
5. 根据权利要求1所述的方法,其特征在于,若确定所述接收端使用非连续性传输且 所述输入的比特流的帧类型为非语音帧,则所述根据确定的结果采用相应的处理方式对所 述输入的比特流进行转码,包括对所述输入的比特流进行解码后生成合成语音; 根据所述合成语音判断目标帧类型;根据所述目标帧类型对所述输入的比特流进行相应的转码。
6. 根据权利要求5所述的方法,其特征在于,若所述目标帧为语音帧,则所述根据目标 帧类型对所述输入的比特流进行相应的转码,包括获取目标帧所需要的参数信息;采用接收端的参数编码算法对获取的所述目标帧所需要的参数信息进行编码并写入 输出的比特流。
7. 根据权利要求4或6所述的方法,其特征在于,所述获得目标帧所需要的参数信息, 包括采用非连续性传输解码算法提取所述输入的比特流中包含的LSP参数和能量参数;对所述LSP参数和所述能量参数进行转码,以获取目标帧所需要的LSP参数信息和代 数码书增益信息;生成目标帧所需要的基音、码书增益和代数码书参数信息。
8. 根据权利要求5所述的方法,其特征在于,若所述目标帧为非语音帧,则所述根据目 标帧类型对所述输入的比特流进行相应的转码,包括采用非连续性传输解码算法提取所述输入的比特流中包含的LSP参数和能量参数; 对所述LSP参数和所述能量参数进行转码,以获取目标帧所需要的参数信息; 采用接收端的参数编码算法对获得的所述目标帧所需要的参数信息进行编码并写入 输出的比特流。
9. 根据权利要求1所述的方法,其特征在于,若确定所述接收端未使用非连续性传输 且所述输入的比特流的帧类型为语音帧,则所述根据判断结果采用相应的处理方式对所述 输入的比特流进行转码,包括采用语音帧参数转码算法对所述输入的比特流进行转码。
10. 根据权利要求1所述的方法,其特征在于,在所述接收输入的比特流之后,所述方 法还包括判断所述输入的比特流是否丢失帧;若判断结果为未丢失帧,则根据确定的结果采用相应的处理方式对所述输入的比特流 进行转码。
11. 根据权利要求io所述的方法,其特征在于,若判断结果为丢失帧,则所述方法还包括采用帧擦除掩蔽算法对所述输入的比特流进行处理;并且所述根据确定的结果采用相应的处理方式对所述输入的比特流进行转码,包括 根据确定的结果采用相应的处理方式对处理后的所述输入的比特流进行转码。
12. 根据权利要求11所述的方法,其特征在于,若确定发生丢帧的输入的比特流的帧 类型为语音帧、或者为非语音帧且为静音插入描述帧,所述对输入的比特流进行处理,包括对待转码的参数进行恢复。
13. 根据权利要求11所述的方法,其特征在于,若确定发生丢帧的输入的比特流的帧 类型为非语音帧且为非传输帧,则所述对输入的比特流进行处理,包括对所述发生丢帧的 输入的比特流不作处理。
14. 一种转码装置,其特征在于,所述装置包括 接收单元,所述接收单元用于接收发送端输入的比特流;确定单元,所述确定单元用于确定接收端使用非连续性传输属性、以及所述输入的比 特流的帧类型;第一处理单元,所述第一处理单元用于根据确定的结果采用相应的处理方式对所述输 入的比特流进行转码。
15. 根据权利要求14所述的装置,其特征在于,所述装置还包括检测单元,所述检测单元与所述确定单元和所述第一处理单元连接,用于检测所述输 入的比特流是否丢失帧;若检测结果为未丢失帧,则所述第一处理单元根据确定的结果采 用相应的处理方式对所述输入的比特流进行转码;第二处理单元,若所述检测单元检测结果为丢失帧,则所述第二处理单元采用帧擦除掩蔽算法对所述输入的比特流进行处理;并且所述第一处理单元用于根据确定的结果采用相应的处理方式对所述第二处理单元处理后的所述输入的比特流进行转码。
16. 根据权利要求14所述的装置,其特征在于,所述装置还包括输出单元,所述输出单元用于输出转码后的输出的比特流。
17. —种通信设备,其特征在于,所述通信设备包括权利要求14至16的任意一项权利要求的转码装置。
全文摘要
本发明提供一种转码方法、装置和通信设备。该方法包括接收发送端输入的比特流;确定接收端使用非连续性传输属性、以及所述输入的比特流的帧类型;根据确定的结果采用相应的处理方式对所述输入的比特流进行转码。本发明实施例根据接收端使用非连续性传输DTX属性、以及输入比特流的帧类型的情况对输入的比特流进行相应的转码操作,这样,可对各种类型的输入的比特流进行处理,并能够按照接收端的要求对输入的比特流进行相应的转码。因此,可在不降低合成语音质量的前提下,将平均计算复杂度和最坏计算复杂度进行有效地降低。
文档编号G10L19/00GK101783142SQ20091000964
公开日2010年7月21日 申请日期2009年1月21日 优先权日2009年1月21日
发明者唐繁荣, 徐昊, 胡翔宇, 鲍长春 申请人:北京工业大学;华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1