基于对象的音频编解码器中不连续传输的方法和设备与流程

文档序号:42297036发布日期:2025-06-27 18:35阅读:46来源:国知局
技术特征:

1.一种用于基于对象的音频编解码器中的音频对象的不连续传输dtx的设备,所述音频对象包括各自的音频流,所述设备包括:

2.根据权利要求1所述的不连续传输设备,其中,所述活动信息包括每个音频对象的活动检测标志,并且其中,当所述音频对象的所述活动检测标志被设置为给定值时,所述dtx控制器检测到dtx信号段。

3.根据权利要求1或2所述的不连续传输设备,其中,在检测到dtx信号段时,所述dtx控制器将dtx标志设置为给定值。

4.根据权利要求1至3中任一项所述的不连续传输设备,其中,所述dtx控制器通过响应于所述全局sid计数器的特定值将sid标志设置为给定值来用信号通知在所述dtx信号段内检测到的sid帧。

5.根据权利要求1至4中任一项所述的不连续传输设备,其中,响应于所述全局sid计数器等于“0”,所述dtx控制器用信号通知检测到的sid帧。

6.根据权利要求1至5中任一项所述的不连续传输设备,其中,所述dtx控制器在每个活动帧中重置所述全局sid计数器。

7.根据权利要求1至6中任一项所述的不连续传输设备,其中,所述dtx控制器在每个非活动帧中将所述全局sid计数器进行递增直到与sid更新速率相对应的值。

8.根据权利要求7所述的不连续传输设备,其中,当所述全局sid计数器达到与所述sid更新速率相对应的值时,所述dtx控制器重置所述全局sid计数器。

9.根据权利要求1至8中任一项所述的不连续传输设备,其中,所述dtx控制器使用所述音频对象的附加分类阶段来改变所述dtx标志。

10.根据权利要求9所述的不连续传输设备,其中,所述附加分类阶段将所述音频对象上的长期背景噪声的平均值和所述音频对象上的长期背景噪声变化的平均值与各自的阈值进行比较。

11.根据权利要求9所述的不连续传输设备,其中,所述附加分类阶段使用所述音频对象中的背景噪声的能量。

12.根据权利要求1至11中任一项所述的不连续传输设备,其中,所述音频对象每个包括具有元数据的音频流,并且其中,所述sid帧编码器包括用于使用绝对编解码对所述音频对象的元数据进行编码的元数据编码器。

13.根据权利要求1至11中任一项所述的不连续传输设备,其中,所述音频对象每个包括具有元数据的音频流,并且其中,所述dtx控制器为每个音频对象计算元数据md标志,所述md标志指示md参数不变,以避免所述sid帧编码器对所述音频对象的元数据进行编解码和传输,从而节省sid比特预算。

14.根据权利要求1至11中任一项所述的不连续传输设备,其中,所述音频对象每个包括具有元数据的音频流,并且其中,所述dtx控制器估计用于量化所述元数据的比特预算,并将所估计的比特预算与可用于量化所述元数据的比特预算进行比较,以选择sid帧编解码或活动帧编解码。

15.根据权利要求14所述的不连续传输设备,其中,当所估计的比特预算高于可用于量化所述元数据的比特预算时,所述dtx控制器将所述dtx标志设置为第一给定值,并且选择活动帧编解码来对所述元数据进行编解码。

16.根据权利要求14或15所述的不连续传输设备,其中,当所估计的比特预算低于可用于量化所述元数据的比特预算时,所述dtx控制器将所述dtx标志设置为第二给定值,并且选择sid帧编解码来对所述元数据进行编解码。

17.根据权利要求1至16中任一项所述的不连续传输设备,其中,所述音频对象每个包括具有元数据md的音频流,并且其中,所述dtx控制器使md值的分辨率取决于音频对象的数量。

18.一种用于解码不连续传输dtx操作期间的音频对象的设备,所述音频对象每个包括具有元数据md的音频流,所述md包括至少一个md参数,所述设备包括:

19.根据权利要求18所述的音频对象解码设备,其中,为了降低md参数值的差异,所述元数据解码器通过在当前帧中的md参数的值与前一帧中的md参数的值之间进行插值来平滑所述md参数。

20.根据权利要求19所述的音频对象解码设备,其中,所述元数据解码器在静音插入描述符sid帧之后的帧中平滑所述md参数,由此所述md参数的值平滑地演变。

21.根据权利要求18至20中任一项所述的音频对象解码设备,其中,所述元数据解码器降低所述md参数的差异,使得两个相邻帧之间的所述md参数的最大差异低于给定阈值。

22.根据权利要求19或20所述的音频对象解码设备,其中,所述元数据解码器将应用平滑的最大帧数限制为给定阈值。

23.根据权利要求22所述的音频对象解码设备,其中,当当前帧中的md参数的值与前一帧中的md参数的值之间的差异的绝对值高于平滑步长值乘以给定阈值时,所述元数据解码器跳过活动帧中的md参数的平滑。

24.一种用于基于对象的音频编解码器中的音频对象的不连续传输dtx的方法,所述音频对象包括各自的音频流,所述方法包括:

25.根据权利要求24所述的不连续传输方法,其中,所述活动信息包括每个音频对象的活动检测标志,并且其中,所述段和帧检测包括:当所述音频对象的所述活动检测标志被设置为给定值时,检测到dtx信号段。

26.根据权利要求24或25所述的不连续传输方法,其中,在检测到dtx信号段时,所述段和帧检测包括将dtx标志设置为给定值。

27.根据权利要求24至26中任一项所述的不连续传输方法,包括:响应于所述全局sid计数器的特定值,通过将sid标志设置为给定值来用信号通知在所述dtx信号段内检测到的sid帧。

28.根据权利要求24至27中任一项所述的不连续传输方法,包括:响应于所述全局sid计数器等于“0”,用信号通知所述检测到的sid帧。

29.根据权利要求24至28中任一项所述的不连续传输方法,包括在每个活动帧中重置所述全局sid计数器。

30.根据权利要求24至29中任一项所述的不连续传输方法,包括:在每个非活动帧中将所述全局sid计数器进行递增直到与sid更新速率相对应的值。

31.根据权利要求30所述的不连续传输方法,包括:当所述全局sid计数器达到与所述sid更新速率相对应的值时,重置所述全局sid计数器。

32.根据权利要求24至31中任一项所述的不连续传输方法,包括:使用所述音频对象的附加分类阶段来更改所述dtx标志。

33.根据权利要求32所述的不连续传输方法,其中,所述附加分类阶段将所述音频对象上的长期背景噪声的平均值和所述音频对象上的长期背景噪声变化的平均值与各自的阈值进行比较。

34.根据权利要求32所述的不连续传输方法,其中,所述附加分类阶段使用所述音频对象中的背景噪声的能量。

35.根据权利要求24至34中任一项所述的不连续传输方法,其中,所述音频对象每个包括具有元数据的音频流,并且其中,所述sid帧编码包括使用绝对编解码来对所述音频对象的元数据进行编码。

36.根据权利要求24至34中任一项所述的不连续传输方法,其中,所述音频对象每个包括具有元数据的音频流,并且其中,所述段和帧检测包括:计算每个音频对象的元数据md标志,所述md标志指示md参数不变以避免对所述音频对象的元数据进行编解码和传输,从而节省sid比特预算。

37.根据权利要求24至34中任一项所述的不连续传输方法,其中,所述音频对象每个包括具有元数据的音频流,并且其中,所述段和帧检测包括:估计用于量化所述元数据的比特预算,并将所估计的比特预算与可用于量化所述元数据的比特预算进行比较,以选择sid帧编解码或活动帧编解码。

38.根据权利要求37所述的不连续传输方法,其中,所述段和帧检测包括:当所估计的比特预算高于可用于量化所述元数据的比特预算时,将所述dtx标志设置为第一给定值,并且选择活动帧编解码来对所述元数据进行编解码。

39.根据权利要求37或38所述的不连续传输方法,其中,所述段和帧检测包括:当所估计的比特预算低于可用于量化所述元数据的比特预算时,将所述dtx标志设置为第二给定值,并且选择sid帧编解码来对所述元数据进行编解码。

40.根据权利要求24至39中任一项所述的不连续传输方法,其中,所述音频对象每个包括具有元数据md的音频流,并且其中,所述方法包括使md值的分辨率取决于音频对象的数量。

41.一种用于解码不连续传输dtx操作期间的音频对象的方法,所述音频对象每个包括具有元数据md的音频流,所述md包括至少一个md参数,所述方法包括:

42.根据权利要求41所述的音频对象解码方法,其中,解码所述元数据包括:为了降低md参数值的差异,通过在当前帧中的md参数的值与前一帧中的md参数的值之间进行插值来平滑所述md参数。

43.根据权利要求42所述的音频对象解码方法,其中,解码所述元数据包括:在静音插入描述符sid帧之后的帧中平滑所述md参数,由此所述md参数的值平滑地演变。

44.根据权利要求41至43中任一项所述的音频对象解码方法,其中解码所述元数据包括降低所述md参数的差异,使得两个相邻帧之间的所述md参数的最大差异低于给定阈值。

45.根据权利要求42或43所述的音频对象解码方法,其中,解码所述元数据包括:将应用平滑的最大帧数限制为给定阈值。

46.根据权利要求45所述的音频对象解码方法,其中,解码所述元数据包括:当当前帧中的md参数的值与前一帧中的md参数的值之间的差异的绝对值高于平滑步长值乘以给定阈值时,跳过活动帧中的md参数的平滑。

47.一种用于基于对象的音频编解码器中的音频对象的不连续传输dtx的设备,所述音频对象包括各自的音频流,所述设备包括:

48.一种用于基于对象的音频编解码器中的音频对象的不连续传输dtx的设备,所述音频对象包括各自的音频流,所述设备包括:

49.一种用于解码不连续传输dtx操作期间的音频对象的设备,所述音频对象每个包括具有元数据md的音频流,所述md包括至少一个md参数,所述设备包括:

50.一种用于解码不连续传输dtx操作期间的音频对象的设备,所述音频对象每个包括具有元数据md的音频流,所述md包括至少一个md参数,所述设备包括:


技术总结
一种用于基于对象的音频编解码器中的音频对象的不连续传输(DTX)的方法和设备,该音频对象包括各自的音频流,该设备包括用于产生关于音频对象的语音或信号活动信息的音频流的分析器。DTX控制器响应于关于音频对象的活动信息来检测音频对象的DTX信号段和DTX信号段内的SID帧。DTX控制器(a)更新非活动帧的全局SID计数器,以及(b)取决于全局SID计数器的值用信号通知DTX信号段内的SID帧。编码器对SID帧进行编码。在用于解码不连续传输(DTX)操作期间的音频对象的设备中,音频对象每个包括具有元数据(MD)的音频流,元数据(MD)包括至少一个MD参数,元数据解码器用于解码元数据并调整MD参数的值以降低帧之间MD参数的差异,并且音频流解码器解码音频流。

技术研发人员:V·埃克斯勒
受保护的技术使用者:沃伊斯亚吉公司
技术研发日:
技术公布日:2025/6/26
当前第2页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!