音频解码器和编码器、提供解码的音频信号的方法、提供编码的音频信号的方法、使用流标识符的音频流、音频流提供器和计算机程序与流程

文档序号:36002800发布日期:2023-11-16 17:00阅读:40来源:国知局
音频解码器和编码器、提供解码的音频信号的方法、提供编码的音频信号的方法、使用流标识符的音频流、音频流提供器和计算机程序与流程

根据本发明的实施例涉及一种基于编码的音频信号表示来提供解码的音频信号表示的音频解码器。根据本发明的其他实施例涉及一种提供编码的音频信号表示的音频编码器。根据本发明的其他实施例涉及一种提供解码的音频信号表示的方法。根据本发明的其他实施例涉及一种提供编码的音频信号表示的方法。根据本发明的其他实施例涉及音频流。根据本发明的其他实施例涉及音频流提供器。根据本发明的其他实施例涉及执行这些方法之一的计算机程序。


背景技术:

1、在下文中,将描述本发明各个方面背后的问题和根据本发明的实施例的可能的使用场景。

2、存在在不同音频流之间或不同编码的音频帧序列之间转换的情况。例如,不同的音频帧序列可以包括不同的音频内容,在这些音频内容之间应该进行转换。

3、例如,当在自适应流式传输用例中采用mpeg-d usac(iso/iec 23003-3+amd.1+amd.2+amd.3)时,可能发生所谓的自适应集合(例如,其可以使用户可以在其中切换的两个或更多个流形成组)内的两个流具有完全相同的配置结构(即使它们的比特率不同)的情况。例如,如果编码器仅选择使用针对两种比特率设置的完全相同的编码工具来操作编码器,则会发生这种情况。

4、例如,音频编码器可以使用相同的基本编码设置(其也被发信号通知给音频解码器),但是仍然可以提供音频值的不同表示。例如,当希望实现较低的比特率时,即使基本编码器设置或解码器设置保持不变,音频编码器也可以使用较粗略的频谱值量化,这导致较小的比特需求。

5、然而,这(例如,即使自适应集合内的两个流的比特率不同,这两个流具有完全相同的配置结构的情况的出现)也不是问题。

6、然而,已经发现,在自适应流式传输用例中,解码器应该知道随后接收的接入单元(或“帧”)是否源自相同的流或者是否发生了流改变。

7、已经发现,如果已经检测到流的改变,则音频解码器将在某些情况下运行指定的操作步骤序列,以确保以下步骤:

8、·正确关闭一个解码器实例,并将临时内部存储的解码的信号部分馈送到解码器输出——称为“刷新”的过程。

9、·解码器将使用与改变的流相关联的配置信息重新实例化并重新配置自身。

10、·解码器将“预滚动”嵌入式接入单元,这些接入单元搭载在立即播出帧(ipf)中。这种接入单元的预滚动使解码器处于完全初始化状态,使得解码第一帧的输出产生完全兼容的解码的音频信号。

11、·可选地,例如,取决于相应的比特流信令元素,来自解码器刷新过程的音频输出和来自解码重新配置的解码器的第一接入单元的输出在很短的时间段内淡入淡出。

12、例如,可以运行所有上述步骤以实现获得从一个流的解码的音频到另一个流的解码的音频的“无缝”转换的唯一目标。“无缝”意味着流转换本身没有可听见的伪声和小故障。事实上,流转换可能在感知上是显而易见的,因为——例如——整体编码质量或音频带宽或音色的变化。然而,转换的实际点(时间点)本身不会引起听觉印象。换句话说,在转换点没有“点击”或“噪声突发”或类似的令人不安的声音。

13、已经发现,可以通过分析嵌入在立即播出帧中的配置结构并将其与当前解码的流的配置进行比较来获得是否已经发生流改变的信息。例如,当且仅当接收的配置与当前配置不同时,音频解码器才可以假设流的改变。

14、例如,如果解码器接收具有变化比特率的流的立即播出帧(ipf),则解码器检测音频预滚动扩展有效载荷的存在,提取配置结构并进行该新配置和当前配置之间的比较。有关更多详细信息,另请参见iso/iec 23003-3:2012/amd.3,子条款“比特率自适应”。

15、然而,已经发现,如果当前配置结构和新配置结构两者相同,则解码器将无法识别出它正在从与之前不同的流中接收接入单元,因此将既不重新配置解码器且解码器也不会解码驻留在ipf的扩展有效载荷中的音频预滚动。

16、相反,解码器将尝试继续解码,就像其已从先前活跃流接收到继续的接入单元一样。这将(例如,在没有使用或评估streami d的传统情况下)导致窗口边界和最后解码的帧的编码模式与新流的新帧不对应的可能情况,这继而又导致听觉伪音,如咔嗒声或噪音突发。这将挫败ipf的主要目的和自适应音频流传输理念,该理念基于流之间无缝转换的概念。

17、在下文中,将描述一些传统方法。

18、应该注意,对于统一语音和音频编码(usac),没有已知的解决方案。

19、在mpeg-h 3d音频(iso/iec 23008-3+所有修改)中,如果通过mpeg-h音频流(“mhas”)打包流格式来发送音频数据,则可以解决该问题。mhas包包含了可以在流之间不同的分组标签,因此可以用于区分配置。但是,没有针对mpeg-d usac指定mhas格式。

20、在mpeg-4he-aac(iso/iec 14496-3+所有修改)中,有一种解决方法需要编码器确保在潜在的转换点(所谓的流接入点(sap))处所有流都具有相同的窗口形状和窗口序列以及针对所采用的信号处理工具的其他约束。这会对最终的音频质量产生不利影响。上面提到的i pf的设计完全是为了释放新编解码器的所有这些约束。

21、总之,需要一种允许在不同音频流之间进行切换的概念,并且该概念在开销量和易于实现之间提供了改进的折衷。


技术实现思路

1、根据本发明的实施例创建了一种音频解码器,用于根据编码的音频信号表示来提供解码的音频信号表示。音频解码器被配置为根据配置信息调整解码参数。音频解码器被配置为使用当前配置(例如,使用当前活动的配置信息)解码一个或多个音频帧。此外,音频解码器被配置为将与要解码的一个或多个帧相关联的配置结构中的配置信息与当前配置信息进行比较,并且如果与要解码的一个或多个帧相关联的配置结构中的配置信息、或者与要解码的一个或多个帧相关联的配置结构中的配置信息的相关部分(例如,直到并且包括流标识符的部分)与当前配置信息不同,则进行转换以使用与要解码的一个或多个帧相关联的配置结构中的配置信息作为新配置信息来进行解码。其中音频解码器被配置为在比较配置信息时考虑包括在配置结构中的流标识符信息,使得先前由音频解码器获取的流标识符和与要解码的一个或多个帧相关联的配置结构中的流标识符信息表示的流标识符之间的差异导致进行所述转换。

2、根据本发明的该实施例基于以下思想:即使在实际解码配置(例如,可以通过配置结构中的其余配置信息描述)对于两个流相同的情况下,包括在配置结构中的流标识符信息的存在和评估允许在音频解码器侧区分不同流,并且由此也允许转换的执行。因此,流标识符可以用作区分可以在其之间进行转换的不同流的标准。由于流标识符信息被包括在配置结构中(例如,与调整音频解码器的解码参数的其他配置信息一起),因此在决定是否应该进行转换时,不必评估来自不同协议层的任何信息。例如,流标识符信息被包括在定义解码参数(“配置结构”)的数据结构的子数据结构中,使得不必将来自分组级别的任何信息转发到实际音频解码器。通过将流标识符信息包括在配置结构中,其允许音频解码器识别从第一流到第二流的转换,而当解码单个流的连续部分时对解码参数没有任何影响,即使在不同流中使用相同解码参数的情况下,也可以在音频解码器侧识别不同流之间的切换而不需要访问来自不同协议级别的信息。而且,不必在不同流中在允许不同流之间的切换的位置处使用相同的解码参数。

3、总之,由本技术实施例定义的概念允许以中等实现复杂度来识别不同流之间的切换(例如,无需从不同协议级别提取专用信令信息并将其转发到音频解码器),同时避免需要在转换点强制执行特定的编码/解码设置(例如选择窗口等)。因此,也可以避免过度的开销和音频质量的下降。

4、在优选实施例中,音频解码器被配置为检查配置结构是否包括流标识符信息,并且如果流标识符信息被包括在配置结构中,则在比较中选择性地考虑流标识符信息。因此,不必在每个配置结构中包括流标识符信息。相反,可以在不需要在不同流之间进行切换的可能性的音频帧的配置结构中省略流标识符。因此,可以节约一些比特,并且可以在不允许不同流之间的切换的点处避免对流标识符信息的评估。

5、在优选实施例中,音频解码器被配置为检查配置结构是否包括配置扩展结构并检查配置扩展结构是否包括流标识符。如果流标识符信息被包括在配置扩展结构中,则音频解码器可以被配置为在比较中选择性地考虑流标识符信息。

6、因此,流标识符可以被放置在配置扩展结构中,配置扩展结构的存在是可选的,其中即使存在配置扩展结构,流标识符信息的存在甚至也可以被认为是可选的。因此,音频解码器可以灵活地识别是否存在流标识符信息,这给音频编码器提供了避免包含不必要信息的可能性。将流标识符放置在可以被激活和去激活的数据结构中(例如,通过配置结构的固定(始终存在)部分中的标志),流标识符信息可以被准确地放置在需要的位置,而如果不需要流标识符信息则节省比特。这是有利的,因为对于具有配置结构的每个帧也不必包括流标识符信息,因为流之间的切换通常仅在指定时间才可能。

7、在优选实施例中,音频解码器被配置为接受配置扩展结构中的配置信息项的可变排序。例如,音频解码器被配置为:当将与要解码的一个或多个帧相关联的配置结构中的配置信息与当前配置信息进行比较时考虑在配置扩展结构中布置在流标识符信息之前(例如,在名为“streamld”的项目之前)的配置信息项(例如,配置扩展)(例如,以及流标识符信息)。此外,音频解码器可以被配置为:在将与要解码的一个或多个帧相关联的配置结构中的配置信息与当前配置信息进行比较时,不考虑在配置扩展结构(例如“usacconfigextension()”)中布置在流标识符信息之后的配置信息项(例如,配置扩展)。

8、通过使用这样的概念,可以以非常灵活的方式检测不同流之间的转换。例如,指示音频流的“显著”变化的所有这样的配置信息项可以放置在配置扩展结构中流标识符信息之前,使得这些参数的改变触发从一个流到另一个流的转换。另一方面,在将与要解码的一个或多个帧相关联的配置结构中的信息与当前配置信息进行比较时,通过不考虑一些配置信息项,可以改变音频解码器的“次要”配置参数而不会触发“转换”,即从一个流切换到另一个流,这可以与重新初始化关联。换句话说,通过仅评估在配置扩展结构中布置在流标识符信息之前的配置信息项和流标识符信息本身,在比较中,可以避免“次要”解码参数的任何改变触发“转换”。相反,音频编码器可以在配置扩展结构中在流标识符信息之后放置这样的“次要”配置信息项(其与次要解码参数有关)。然后,音频编码器可以改变流内的这种“次要”配置信息项,而不会由于每个改变而触发“转换”(或重新初始化)。另一方面,在流中保持不变的那些配置信息项可以放置在配置扩展结构中的流标识符信息之前,并且改变这种“高度相关”的配置信息项(例如,可以指示音频流的“显著”变化)将导致“转换”(并且通常在音频解码器的重新初始化中)。由于音频解码器还可以接受配置扩展结构中的配置信息项的可变排序,因此音频编码器可以根据信号特性或根据其他标准来决定哪些配置信息项的改变应该触发“转换”或者音频解码器的重新初始化,以及在流内哪些配置信息项应该可以改变而不会触发“转换”或音频解码器的重新初始化。

9、在优选实施例中,音频解码器被配置为基于相应配置信息项之前的一个或多个配置扩展类型标识符来识别配置扩展结构中的一个或多个配置信息项。通过使用这种配置扩展类型标识符,可以实现配置信息项的可变排序。

10、在优选实施例中,配置扩展结构是配置结构的子数据结构,其中配置扩展结构的存在由音频解码器评估的配置结构的比特来指示。流标识符信息是配置扩展结构的子数据项,其中流标识符信息的存在由音频解码器评估的与流标识符信息相关联的配置扩展类型标识符来指示。因此,可以灵活地决定何时应该将流标识符信息添加到音频流,并且音频解码器可以容易地确定何时这样的流标识符信息可用。因此,在可以在不同流之间切换的点处包括音频流的流标识符信息(其需要多个比特)就足够了。在连续音频流内的立即播放帧(ipf)在不可能在不同流之间切换的位置处不需要携带流标识符信息,这节省了比特率。

11、在优选实施例中,音频解码器被配置为获得并处理包括随机接入信息(例如,“音频预滚动扩展有效载荷”,也称为“audiopreroll()”)的音频帧表示(例如,立即播出帧,ipf)。随机接入信息包括配置结构(例如,称为“config()”)和用于使音频解码器的处理链的状态处于期望状态的信息(例如,用“accessunit()”表示)。音频解码器被配置为:如果音频解码器发现随机接入信息(例如,立即播出帧,ipf)的配置结构(例如,“config()”)中的配置信息、或者随机接入信息的配置结构中的配置信息的相关部分与当前配置信息不同,则在使用随机接入信息的配置结构初始化音频解码器之后以及在使用用于使处理链状态处于期望状态的信息来调整所述音频解码器的状态之后,在由在到达包括随机接入信息的音频帧表示之前处理的(解码的)音频帧所表示的音频信息和基于包括随机接入信息的音频帧表示而获得的音频信息之间进行淡入淡出。例如,如果值“numprerollframes”为零,则可以省略对预滚动帧的解码。

12、换句话说,通过评估配置结构中的配置信息或其相关部分(例如,直到并包括流标识符信息),音频解码器可以识别是否存在不同流之间的转换,并且在不同流之间转换的情况下,音频解码器可以利用随机接入信息。随机接入信息可以帮助使音频解码器的处理链处于适当的状态(通常,在没有转换的情况下,由一个或多个先前的帧实现),从而避免转换处的伪音。总之,该概念允许在不同流之间进行无伪音切换,其中音频解码器不需要除了帧表示序列之外的来自不同协议级别的任何信息。

13、在优选实施例中,音频解码器被配置为:如果所述音频解码器已经解码了紧接在由包括随机接入信息(例如,立即播出帧,ipf)的音频帧表示所表示的音频帧之前的音频帧,以及如果音频解码器发现所述随机接入信息的配置结构中的配置信息的相关部分与当前配置信息相同,则继续进行解码而不执行所述音频解码器的初始化以及不使用使所述音频解码器的处理链的状态处于期望状态(例如,预滚动扩展播放)的信息。因此,如果音频解码器通过将配置结构中的配置信息的相关部分与当前配置信息进行比较来识别出不同流之间没有转换而是相同流的连续播出,则避免了将由执行音频解码器的初始化引起的开销(例如,处理开销或计算开销)。因此,实现了高效率,并且仅在需要时才执行音频解码器的初始化。

14、在优选实施例中,音频解码器被配置为:如果音频解码器尚未解码紧接在由包括随机接入信息的音频帧表示所表示的音频帧之前的音频帧,则使用所述随机接入信息的配置结构执行音频解码器的初始化,以及使用使处理链的状态处于期望状态的信息来调整音频解码器的状态。换句话说,如果存在实际的“随机接入”(其中音频解码器知道尚未解码前一音频帧),则还执行初始化。因此,在真实“随机接入”的情况下(即,当跳转到某个帧时)和在不同流之间切换时使用随机接入信息(其中“真实”随机接入可以被发信号通知给音频解码器,并且其中,不同流之间的切换可以仅由音频解码器通过评估流标识符信息来识别)。

15、应当注意,这里讨论的音频解码器可以可选地通过本文描述的任何特征、功能和细节单独地或组合地补充。

16、根据本发明的实施例创建了用于提供编码的音频信号表示的音频编码器。音频编码器被配置为使用编码参数对音频信号的重叠或非重叠帧进行编码,以获得编码的音频信号表示。音频编码器被配置为提供描述编码参数(或等效地,音频解码器要使用的解码参数)的配置结构。配置结构还包括流标识符。

17、因此,音频编码器提供可由上述音频解码器很好地使用的音频信号表示。例如,音频编码器可以在不同流的配置结构中包括不同的流标识符。因此,流标识符可以是不描述音频解码器要使用的解码器配置(或解码参数)而是识别流的信息。因此,编码的音频信号表示包括流标识符,并且基于编码的音频信号信息本身可以识别不同的流,而不需要来自不同协议级别的任何信息。例如,由于流标识符信息是音频信号表示的必需部分,或者是包括在音频信号表示内的配置结构的必需部分,因此不需要使用在分组级别上提供的信息。因此,如本文所讨论的,音频解码器可以识别不同流之间的切换,即使解码器的实际配置参数保持不变。

18、在优选实施例中,音频编码器被配置为在配置结构的配置扩展结构中包括流标识符,其中包括流标识符的配置扩展结构可以由音频编码器启用和禁用。因此,可以在音频编码器侧灵活地决定是否应该包括流标识符信息。例如,对于音频编码器知道将不存在流切换的音频帧,可以选择性地省略包括流标识符信息。

19、在优选实施例中,音频编码器被配置为在配置扩展结构中包括指定流标识符的配置扩展类型标识符,以发信号通知在配置扩展结构中存在流标识符。因此,如果在配置扩展结构中存在其他配置扩展信息,则甚至可以省略流标识符信息。换句话说,并非每个配置扩展结构都必须包括流标识符,这有助于节省比特。

20、在优选实施例中,音频编码器被配置为提供包括所述流标识符的至少一个配置结构和不包括所述流标识符的至少一个配置结构。因此,如果音频编码器认识到这是必要的,则流标识符仅被包括在配置结构中。例如,音频编码器仅需要将流标识符包括在可以进行流之间的切换的帧的配置结构中。通过这样做,比特率可以保持为相当小。

21、在优选实施例中,音频编码器被配置为在由第一音频帧序列表示的第一编码音频信息和由第二音频帧序列表示的第二编码音频信息的提供之间进行切换;其中,在呈现第一音频帧序列的最后帧之后正确地呈现所述第二音频帧序列的第一音频帧需要重新初始化音频解码器。在这种情况下,音频编码器被配置为在表示第二音频帧序列的第一帧的音频帧表示中包括配置结构,该配置结构包括与第二音频帧序列相关联的流标识符。与第二音频帧序列相关联的流标识符被选择为和与第一帧序列相关联的流标识符不同。因此,音频编码器可以在配置结构内提供允许音频解码器区分不同流并且识别何时应该执行重新初始化(也称为“转换”)的信令。

22、在优选实施例中,除流标识符之外,音频编码器不提供指示从第一音频帧序列切换到第二音频帧序列的任何其他信令信息。因此,比特率可以保持为相当小。特别地,可以避免除了编码的音频信息之外的信令被包括在不同协议级别中。此外,音频编码器事先不知道何时实际发生从第一音频帧序列到第二音频帧序列的切换。例如,音频解码器可首先请求来自第一音频帧序列的音频帧,并且当音频解码器识别出某些需要时(例如,当可用比特率增加或减少时)音频解码器(或控制音频帧的提供的任何其他控制设备)可以决定现在应该由音频解码器处理来自第二流的音频帧。然而,在某些情况下,音频解码器可能不知道何时(或确切地何时)在提供来自第一序列的音频帧和提供来自第二序列的音频帧之间切换,并且仅能够通过评估配置结构中包括的流标识符来识别当前接收的音频帧源自哪个音频帧序列。

23、在优选实施例中,音频编码器被配置为使用不同的比特率来提供第一音频帧序列(例如,第一流)和第二音频帧序列(例如,第二流)(其中第一流和第二流可以表示相同的音频内容)。此外,音频编码器可以被配置为:向音频解码器发信号通知除了不同的比特流标识符之外的用于解码第一音频帧序列以及用于解码第二音频帧序列的相同的解码器配置信息。换句话说,音频编码器可以向音频解码器发信号以使用相同的解码器参数,但是第一流和第二流仍然可以包括不同的比特率。例如,这可以由在提供第一音频流和第二音频流时使用不同的量化分辨率或不同的心理声学模型引起。然而,这些不同的量化分辨率或不同的心理声学模型不影响音频解码器要使用的解码参数,而仅影响实际比特率。因此,不同的比特流标识符可以是音频解码器区分要解码的音频帧是来自第一流还是来自第二流的唯一可能性,并且比特流标识符的评估还允许音频解码器识别何时应进行转换(或重新初始化)。

24、因此,音频编码器可以在可能发生可用比特率变化的环境中服务,并且信令开销可以保持为相当小。

25、此外,应该注意,这里讨论的音频编码器可以可选地由本文描述的任何特征和功能和细节来补充。

26、根据本发明的另一个实施例涉及一种用于基于编码的音频信号表示来提供解码的音频信号表示的方法。该方法包括:根据配置信息调整解码参数,并且该方法包括:使用当前配置信息(例如,当前活动的配置信息)解码一个或多个音频帧。此外,该方法还包括:将与要解码的一个或多个帧相关联的配置结构中的配置信息与当前配置信息进行比较,并且该方法包括:如果与要解码的一个或多个帧相关联的配置结构中的配置信息、或者与要解码的一个或多个帧相关联的配置结构中的配置信息的相关部分(例如,直到并且包括流标识符)与当前配置信息不同,则进行转换(例如,包括对解码的重新初始化)以使用与要解码的一个或多个帧相关联的配置结构中的配置信息作为新配置来进行解码。该方法还包括:在比较配置信息时考虑包括在配置结构中的流标识符信息,使得先前由音频解码器获取的流标识符和与要解码的一个或多个帧相关联的配置结构中的流标识符信息所表示的流标识符之间的差异导致进行转换。该方法基于与上述音频解码器相同的考虑因素。

27、该方法可以通过本文所述的任何特征和功能以及细节单独地或组合地补充。

28、根据本发明的另一个实施例创建了一种用于提供编码的音频信号表示的方法。该方法包括:使用编码参数对音频信号的重叠或非重叠帧进行编码,以获得编码的音频信号表示。该方法包括:提供描述编码参数(或等效地,音频解码器要使用的解码参数)的配置结构,其中配置结构包括流标识符。该方法基于与上述音频编码器相同的考虑因素。

29、此外,应该注意,这里描述的方法可以通过上面关于相应的音频解码器和音频编码器描述的任何特征和功能来补充。此外,这些方法可以通过本文所述的任何特征、功能和细节单独或组合地补充。

30、根据本发明的实施例创建音频流。音频流包括音频信号的重叠或非重叠帧的编码表示。音频流还包括描述编码参数(或等效地,音频解码器要使用的解码参数)的配置结构。配置结构包括表示流标识符的流标识符信息(例如,以整数值的形式)。

31、音频流基于上述考虑因素。特别地,包括在音频流的配置结构中的流标识符(其也描述编码参数(或等效地,音频解码器要使用的解码参数))允许音频解码器区分不同的流,即使使用相同的编码参数(或解码参数)。

32、在优选实施例中,流标识符信息被包括在配置扩展结构中。在这种情况下,配置扩展结构优选地是配置结构的子数据结构,其中配置扩展结构的存在由配置结构的比特来指示。此外,流标识符信息是配置扩展结构的子数据项,其中,流标识符信息的存在由与流标识符信息相关联的配置扩展类型标识符来指示。这种音频流的使用允许在需要时灵活地包括流标识符信息,而在不需要时可以省略包括流标识符信息(例如,对于不允许在多个流之间进行切换的帧来说)。因此,可以节省比特率。

33、在优选实施例中,流标识符被嵌入在音频帧的表示的子数据结构中(并且可以由音频解码器从这种子数据结构中提取)。通过将流标识符嵌入音频帧的表示的子数据结构中,可以避免音频解码器必须使用来自更高协议级别的信息。相反,为了解码音频帧,音频解码器仅需要音频帧的表示,并且可以决定是否存在不同流之间的切换。

34、在优选实施例中,流标识符仅被嵌入在包括配置结构的音频帧的表示的子数据结构中(并且可以由音频解码器从包括配置结构的音频帧的表示的子数据结构中提取)。该想法基于以下发现:流之间的切换(没有明显的伪音)只能在包括配置结构的帧处执行。因此,已经发现,将流标识符嵌入包括配置结构的音频帧的表示的子数据结构中就足够了,而在并未包括配置结构的音频帧的表示中不包括流标识符。

35、这里描述的音频流可以通过本文讨论的任何特征、功能和细节单独或组合地补充。特别地,针对音频编码器、音频解码器和流提供器描述的这些特征也可以应用于音频流。

36、根据本发明的实施例创建用于提供编码的音频信号表示的音频流提供器。音频流提供器被配置为提供使用编码参数编码的音频信号的时间上重叠或非重叠的帧的编码版本,作为编码的音频信号表示的一部分。音频流提供器被配置为提供描述编码参数(或者,等效地,音频解码器要使用的解码参数)的配置结构,作为编码的音频信号表示的一部分,其中配置结构包括流标识符。该音频流提供器基于与上述音频编码器以及上述音频解码器相同的考虑因素。

37、在优选实施例中,音频流提供器被配置为:提供编码的音频信号表示,使得流标识符被包括在配置结构的配置扩展结构中,其中包括流标识符的所述配置扩展结构可以由配置结构中的一个或多个比特启用和禁用。该实施例基于与上面关于音频编码器以及关于音频解码器所讨论的相同的想法。换句话说,音频流提供器提供与音频编码器提供的音频流相对应的音频流(即使音频流提供器可以被配置为在不同流的提供之间切换,不同流例如由以并行方式操作的多个音频编码器提供,或者从存储介质提供)。

38、在优选实施例中,音频流提供器被配置为提供编码的音频信号表示,使得配置扩展结构包括指定流标识符的配置扩展类型标识符,以发信号通知在配置扩展结构中存在流标识符。该实施例基于与上面关于音频编码器和关于音频流提到的相同的考虑。

39、在优选实施例中,音频流提供器被配置为提供编码的音频信号表示,使得编码的音频信号表示包括包含所述流标识符的至少一个配置结构和不包含所述流标识符的至少一个配置结构。如上所述,流标识符不必被包括在每个配置结构中。相反,可以存在应该包括流标识符的配置结构的灵活的调整。通常,流标识符将被包括在这样的音频帧的配置结构中:对于这样的音频帧存在流之间的切换(或者预期或允许在流之间切换)。换句话说,包括相同配置结构的除了流标识符不同的不同流之间的切换将仅由流提供器在存在流标识符的帧处执行。因此,音频解码器(从音频流提供器接收编码的音频表示)具有识别不同流之间的切换的可能性,即使解码参数(由配置结构发信号通知)基本相同或甚至完全相同。

40、在优选实施例中,音频流提供器被配置为在编码的音频信息的第一部分(由第一音频帧序列表示)和编码的音频信息的第二部分(由第二音频帧序列表示)的提供之间切换,其中在呈现第一音频帧序列的最后帧之后正确地呈现第二音频帧序列的第一音频帧需要重新初始化音频解码器。音频流提供器被配置为提供编码的音频信号表示,使得表示第二音频帧序列的第一帧的音频帧表示包括配置结构,该配置结构包括与第二音频帧序列相关联的流标识符,其中与第二音频帧序列相关联的流标识符和与第一音频帧序列相关联的流标识符不同。换句话说,音频流提供器在具有相关联的不同流标识符的两个音频流(音频帧序列)之间切换。因此,音频解码器通常将知道与第一音频帧序列相关联的流标识符(例如,通过评估与第一音频帧序列相关联的配置结构),以及在音频解码器接收第二音频帧序列的第一帧时,音频解码器将能够评估包括与第二音频帧序列相关联的流标识符的配置结构,并且能够通过比较流标识符(对于不同的流是不同的)识别从第一流到第二流的切换。因此,音频流提供器提供来自第一流的音频帧,然后切换到提供来自第二流的音频帧,并在切换之后提供的第二音频流的第一帧的配置结构内提供适当的信令信息(即流标识符)。因此,不需要额外的信令来发信号通知不同音频流之间的切换。

41、在优选实施例中,音频流提供器被配置为提供编码的音频信号表示,使得编码的音频信号表示除了流标识符之外,不提供指示从第一音频帧序列切换到第二音频帧序列的任何其他信令信息。因此,可以实现比特率的显著节省。协议复杂性也保持很小,因为不必包括在不同协议级别的任何信息并且不必在音频解码器侧从不同协议级别提取这样的信息。

42、在优选实施例中,音频流提供器被配置为提供编码的音频信号表示,使得第一音频帧序列(例如,第一流)和第二音频帧序列(例如,第二流)是使用不同的比特率编码的。此外,音频流提供器被配置为提供编码的音频信号表示,使得编码的音频信号表示向音频解码器发信号通知除了不同的比特流标识符之外的用于解码第一音频帧序列和用于解码第二音频帧序列的相同的解码器配置信息(或解码器参数或解码参数)。因此,音频流提供器为不同的流(第一流和第二流)提供非常类似的配置信息,不同的流可以例如仅比特流标识符不同。在这种情况下,使用比特流标识符特别有用,因为它们允许以最小的信令开销可靠地区分不同的比特流。

43、在优选实施例中,音频流提供器被配置为在向音频解码器提供第一音频帧序列和第二音频帧序列之间切换,其中,第一音频帧序列和第二音频帧序列是使用不同的比特率编码的。音频流提供器被配置为选择性地在音频帧表示(例如,立即播出帧,ipf)包括随机接入信息(例如,音频预滚动扩展有效载荷“audiopreroll()”)的音频帧处在提供第一音频帧序列和在提供第二音频帧序列之间进行切换,而避免在不包括随机接入信息的音频帧处在序列之间切换。音频流提供器被配置为提供编码的音频信号表示,使得流标识符被包括在从第一音频帧序列切换到第二音频帧序列时提供的音频帧的配置结构中。例如,通过音频流提供器的这种配置确保仅在第二音频帧序列的第一帧包括具有流标识符的配置结构以及随机接入信息时在第一音频帧序列的帧的提供和第二音频帧序列的帧的提供之间切换。因此,音频解码器可以检测不同音频流之间的切换,并且因此可以识别应该评估随机接入信息(而当没有不同音频流之间的切换时以及当音频解码器假设呈现单个流的连续音频帧序列时,通常不评估随机接入信息。)。

44、因此,通过这样的概念可以实现在不同音频流之间切换时没有伪音的良好音频质量。

45、在另一实施例中,音频流提供器被配置为获得使用不同比特率编码的多个并行音频帧序列,并且其中,所述音频流提供器被配置为在向音频解码器提供来自不同并行序列的帧之间进行切换,其中所述音频流提供器被配置为使用包括在切换之后提供的第一音频帧表示的所述配置结构中的所述流标识符,向音频解码器发信号通知一个或多个帧序列与序列中的哪个序列相关联。因此,音频解码器可以以较小的开销识别不同流之间的转换,而无需使用来自其他协议层的信息。

46、应当注意,这里讨论的音频流提供器可以由本文描述的任何特征、功能和细节单独地或组合地补充。

47、根据本发明的另一个实施例创建了一种用于提供编码的音频信号表示的方法。该方法包括提供使用编码参数编码的音频信号的重叠或非重叠帧的编码版本,作为编码的音频信号表示的一部分。该方法包括提供描述编码参数(或者,等效地,音频解码器要使用的解码参数)的配置结构,作为编码的音频信号表示的一部分,其中配置结构包括流标识符。

48、该方法基于与上面讨论的流提供器相同的考虑因素。该方法可以通过本文例如关于流提供器、还关于音频编码器、音频解码器或音频流描述的任何其他特征、功能和细节来补充。

49、根据本发明的另一个实施例创建了用于执行本文所述方法的计算机程序。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1