音频的屏幕相对呈现和用于这样的呈现的音频的编码和解码的制作方法_6

文档序号:9932943阅读:来源:国知局
器声道的节目已通过包括通过将基于对象的音频节目的音频内容扭曲到至少部分地由至少一个扭曲程度参数所确定的程度来处理所述基于对象的音频节目以生成指示扭曲内容的所述一组扬声器声道而生成,其中,每一个所述扭曲程度参数指示要通过回放系统对基于对象的音频节目的对应的音频内容所执行的扭曲的最大程度,所述呈现的方法包括以下步骤: (a)解析基于扬声器声道的节目以识别包括指示扭曲内容的每一个所述一组扬声器声道的基于扬声器声道的节目的扬声器声道;和 (b)响应于包括指示扭曲内容的至少所述一组扬声器声道的基于扬声器声道的节目的扬声器声道中的至少一些而生成扬声器馈送,以用于驱动位于相对于回放屏幕的预定位置处的喇叭。22.如权利要求21所述的方法,其中,基于扬声器声道的节目已通过包括通过执行基于对象的音频节目的音频内容的屏幕外扭曲到至少部分地由所述至少一个扭曲程度参数所确定的程度和使用至少一个屏幕外扭曲参数来处理所述基于对象的音频节目而生成,所述至少一个屏幕外扭曲参数指示对基于对象的节目的对应的音频内容的屏幕外扭曲的至少一个特性。23.如权利要求21或权利要求22所述的方法,其中,基于扬声器声道的音频节目包括可选择的两组或更多组扬声器声道,多组中的至少一组指示基于对象的音频节目的未扭曲音频内容,而多组中的另一组是指示扭曲内容的所述一组扬声器声道,并且步骤(b)包括选择多组中的作为指示扭曲内容的所述一组扬声器声道的一组的步骤。24.如权利要求21-23中的任一项所述的方法,其中,每一个所述扭曲程度参数是指示要通过回放系统对节目的对应的音频内容所执行的扭曲的最大程度的非二进制值。25.—种系统,包括: 第一子系统,该第一子系统被配置为解析多声道音频节目以识别节目的声道;和 处理子系统,该处理子系统被耦合到所述第一子系统并且被配置为对节目的至少一个声道的音频内容执行扭曲到至少部分地由与所述声道对应的至少一个扭曲程度参数所确定的程度,其中每一个所述扭曲程度参数指示要通过回放系统对节目的对应的音频内容所执行的扭曲的最大程度。26.如权利要求25所述的系统,其中,扭曲包括至少部分地由至少一个屏幕外扭曲参数所确定的屏幕外扭曲,其中,屏幕外扭曲参数指示通过回放系统对节目的对应的音频内容的屏幕外扭曲的至少一个特性。27.如权利要求26所述的系统,其中,屏幕外扭曲包括作为音频元素要被呈现的扭曲位置的与回放屏幕的平面至少基本上垂直的距离的函数的、沿与回放屏幕的平面至少基本上平行的宽度轴的音频元素的未扭曲位置的、到由屏幕外扭曲参数所控制的程度的扭曲。28.如权利要求25-27中的任一项所述的系统,其中,扭曲包括确定指示要在沿宽度轴的扭曲位置处被呈现的音频元素的沿宽度轴的未扭曲位置的值Xs,并且生成以下值: Xwarp, YFACTOR=yEXP,以及 X’ =x*yfactor+(1-yfactor)*[XFACT0R*Xwarp+(1-xfactor)*χ)], 其中, Xwarp表示相对于回放屏幕的边缘的沿宽度轴的音频元素的原始扭曲位置, EXP是屏幕外扭曲参数, YFACTOR指示作为音频元素的沿与回放屏幕的平面至少基本上垂直的深度轴的扭曲位置y的函数的、沿宽度轴的扭曲的程度, X’表示相对于回放屏幕的边缘的沿宽度轴的音频元素的扭曲对象位置,并且 XFACTOR是一个所述扭曲程度参数。29.如权利要求25-28中的任一项所述的系统,其中,所述节目是基于对象的音频节目,并且所述第一子系统被配置为解析节目以识别由该节目的屏幕相关的元数据所指示的至少一个所述一个扭曲程度参数。30.如权利要求29所述的系统,其中,所述节目指示至少两个对象,所述第一子系统被配置为独立地确定用于对象中的每一个的至少一个扭曲程度参数,并且所述处理子系统被配置为对指示对象中的每一个的音频内容独立地执行扭曲到至少部分地由与对象中的所述每一个对应的所述至少一个扭曲程度参数所确定的程度。31.如权利要求25-30中的任一项所述的系统,其中,每一个所述扭曲程度参数是指示要通过回放系统对节目的对应的音频内容所执行的扭曲的最大程度的非二进制值。32.—种系统,包括: 第一子系统,该第一子系统被配置为生成基于对象的音频节目;和 第二子系统,该第二子系统被耦合到所述第一子系统并且被配置为响应于基于对象的音频节目而生成基于扬声器声道的节目,其中,所述基于扬声器声道的节目包括预期用于通过位于相对于回放屏幕的预定位置处的喇叭回放的至少一组扬声器声道,其中,所述第二子系统被配置为包括通过将基于对象的音频节目的音频内容扭曲到至少部分地由至少一个扭曲程度参数所确定的程度来生成所述一组扬声器声道,并且每一个所述扭曲程度参数指示要通过回放系统对基于对象的音频节目的对应的音频内容所执行的扭曲的最大程度。33.如权利要求32所述的系统,其中,所述第二子系统被配置为生成基于扬声器声道的音频节目使得该基于扬声器声道的节目包括可选择的两组或更多组扬声器声道,多组中的至少一组指示基于对象的音频节目的未扭曲音频内容,多组中的至少另一组的生成包括基于对象的音频节目的音频内容到至少部分地由扭曲程度参数所确定的程度的扭曲,并且多组中的所述另一组预期用于通过位于相对于回放屏幕的预定位置处的喇叭回放。34.如权利要求32或权利要求33所述的系统,其中,所述第二子系统被配置为包括通过执行基于对象的音频节目的音频内容的屏幕外扭曲、使得屏幕外扭曲至少部分地由指示该屏幕外扭曲的至少一个特性的至少一个屏幕外扭曲参数确定来生成所述一组扬声器声道。35.如权利要求34所述的系统,其中,所述第二子系统被配置为响应于屏幕外扭曲参数来控制作为对象要被呈现的扭曲位置的与回放屏幕的平面至少基本上垂直的距离的函数的、沿与回放屏幕的平面至少基本上平行的宽度轴的对象的未扭曲位置的扭曲的程度。36.如权利要求32-35中的任一项所述的系统,其中,所述第二子系统被配置为包括通过确定指示要在沿与回放屏幕的平面至少基本上平行的宽度轴的扭曲位置处被呈现的音频对象的沿宽度轴的未扭曲位置的值Xs并且生成以下值来执行扭曲: Xwarp, YFACTOR=yEXP,以及 X’ =x*yfactor+(1-yfactor)*[XFACT0R*Xwarp+(1-xfactor)*χ)], 其中, Xwarp表示相对于回放屏幕的边缘的沿宽度轴的对象的原始扭曲位置, EXP是屏幕外扭曲参数, YFACTOR指示作为对象的沿与回放屏幕的平面至少基本上垂直的深度轴的扭曲位置y的函数的、沿宽度轴的扭曲的程度, X,表示相对于回放屏幕的边缘的沿宽度轴的对象的扭曲对象位置,并且 XFACTOR是一个所述扭曲程度参数。37.如权利要求32-36中的任一项所述的系统,其中,基于对象的音频节目包括指示所述至少一个扭曲程度参数的屏幕相关的元数据,并且所述第二子系统被配置为解析基于对象的音频节目以识别由屏幕相关的元数据所指示的每一个所述扭曲程度参数。38.如权利要求32-37中的任一项所述的系统,其中,每一个所述扭曲程度参数是指示要通过回放系统对节目的对应的音频内容所执行的扭曲的最大程度的非二进制值。39.—种用于呈现基于扬声器声道的节目的系统,所述基于扬声器声道的节目包括指示扭曲内容的至少一组扬声器声道,其中,所述基于扬声器声道的节目已通过包括通过将基于对象的音频节目的音频内容扭曲到至少部分地由至少一个扭曲程度参数所确定的程度来处理所述基于对象的音频节目以生成指示扭曲内容的所述一组扬声器声道而生成,其中,每一个所述扭曲程度参数指示要通过回放系统对基于对象的音频节目的对应的音频内容所执行的扭曲的最大程度,所述系统包括: 第一子系统,该第一子系统被配置为解析基于扬声器声道的节目以识别包括指示扭曲内容的每一个所述一组扬声器声道的节目的扬声器声道;以及 呈现子系统,该呈现子系统被耦合到所述第一子系统并且被配置为响应于包括指示扭曲内容的至少所述一组扬声器声道的基于扬声器声道的节目的扬声器声道中的至少一些而生成扬声器馈送,以用于驱动位于相对于回放屏幕的预定位置处的喇叭。40.如权利要求39所述的系统,其中,基于扬声器声道的音频节目包括可选择的两组或更多组扬声器声道,多组中的至少一组指示基于对象的音频节目的未扭曲音频内容,而多组中的另一组是指示扭曲内容的所述一组扬声器声道,并且所述第一子系统被配置为针对所述呈现子系统的呈现而选择多组中的作为指示扭曲内容的所述一组扬声器声道的一组。41.如权利要求39或权利要求40所述的系统,其中,每一个所述扭曲程度参数是指示要通过回放系统对节目的对应的音频内容所执行的扭曲的最大程度的非二进制值。42.一种音频处理单元,包括: 缓冲存储器;和 至少一个处理子系统,所述至少一个处理子系统被耦合到所述缓冲存储器,其中,所述缓冲存储器存储基于对象的音频节目的至少一个分段,其中,所述分段包括指示至少一个对象的至少一个对象声道的音频内容和指示用于至少一个所述对象的至少一个扭曲程度参数的屏幕相关的元数据,其中,每一个所述扭曲程度参数指示要通过回放系统对对象所执行的扭曲的最大程度,并且 其中,所述处理子系统被耦合和配置为执行使用屏幕相关的元数据中的至少一些的基于对象的音频节目的呈现、或者基于对象的音频节目的生成、或者基于对象的音频节目的解码中的至少一个。43.如权利要求42所述的音频处理单元,其中,所述节目指示至少两个对象,并且屏幕相关的元数据指示用于对象中的至少两个中的每一个的至少一个所述扭曲程度参数,每一个所述扭曲程度参数指示要对每一个对应的对象所执行的扭曲的最大程度。44.如权利要求42或权利要求43所述的音频处理单元,其中,存储在所述缓冲存储器中的基于对象的音频节目的分段指示用于所述至少一个对象的至少一个屏幕外扭曲参数,其中,屏幕外扭曲参数指示要通过回放系统对对象所执行的屏幕外扭曲的至少一个特性,并且其中,包括在节目中的屏幕相关的元数据指示每一个所述屏幕外扭曲参数。45.如权利要求44所述的音频处理单元,其中,屏幕外扭曲参数控制作为对象要被呈现的扭曲位置的与回放屏幕的平面至少基本上垂直的距离的函数的、沿与回放屏幕的平面至少基本上平行的宽度轴的对象的未扭曲位置的扭曲的程度。46.如权利要求42-45中的任一项所述的音频处理单元,其中,扭曲包括确定指示要在沿宽度轴的扭曲位置处被呈现的对象的沿宽度轴的未扭曲位置的值Xs,并且生成以下值: Xwarp, YFACTOR=yEXP,以及 X’ =x*yfactor+(1-yfactor)*[XFACT0R*Xwarp+(1-xfactor)*χ)], 其中, Xwarp表示相对于回放屏幕的边缘的沿宽度轴的音频元素的原始扭曲位置, EXP是屏幕外扭曲参数, YFACTOR指示作为音频元素的沿与回放屏幕的平面至少基本上垂直的深度轴的扭曲位置y的函数的、沿宽度轴的扭曲的程度, X’表示相对于回放屏幕的边缘的沿宽度轴的音频元素的扭曲对象位置,并且 XFACTOR是一个所述扭曲程度参数。47.如权利要求42-46中的任一项所述的音频处理单元,其中,所述音频处理单元是编码器,并且所述处理子系统被配置为生成基于对象的音频节目。48.如权利要求42-46中的任一项所述的音频处理单元,其中,所述音频处理单元是解码器,并且所述处理子系统被配置为解码基于对象的音频节目。49.如权利要求42-48中的任一项所述的音频处理单元,其中,每一个所述扭曲程度参数是指示要通过回放系统对节目的对应的音频内容所执行的扭曲的最大程度的非二进制值。50.一种音频处理单元,包括: 缓冲存储器;和 至少一个处理子系统,所述至少一个处理子系统被耦合到所述缓冲存储器,其中,所述缓冲存储器存储基于扬声器声道的音频节目的至少一个分段,所述分段包括预期用于通过位于相对于回放屏幕的预定位置处的喇叭回放的基于扬声器声道的节目的至少一组扬声器声道的音频内容,其中,所述一组扬声器声道已响应于基于对象的音频节目包括通过将基于对象的音频节目的音频内容扭曲到至少部分地由至少一个扭曲程度参数所确定的程度而生成,其中,每一个所述扭曲程度参数指示要通过回放系统对基于对象的音频节目的对应的音频内容所执行的扭曲的最大程度,并且 其中,所述处理子系统被配置为执行基于扬声器声道的音频节目的呈现、或者基于扬声器声道的音频节目的解码中的至少一个。51.如权利要求50所述的音频处理单元,其中,存储在所述缓冲存储器中的基于扬声器声道的音频节目的至少一个所述分段包括可选择的两组或更多组扬声器声道的音频内容,多组中的至少一组指示基于对象的音频节目的未扭曲音频内容,并且多组中的至少另一组已响应于基于对象的音频节目包括通过将基于对象的音频节目的音频内容扭曲到至少部分地由所述至少一个扭曲程度参数所确定的程度而生成。52.如权利要求50或权利要求51所述的音频处理单元,其中,所述一组扬声器声道已通过包括执行至少部分地由至少一个屏幕外扭曲参数所确定的屏幕外扭曲的处理而生成。53.如权利要求52所述的音频处理单元,其中,屏幕外扭曲包括作为音频元素要被呈现的扭曲位置的与回放屏幕的平面至少基本上垂直的距离的函数的、沿与回放屏幕的平面至少基本上平行的宽度轴的音频元素的未扭曲位置的、到由屏幕外扭曲参数所控制的程度的扭曲。54.如权利要求50-53中的任一项所述的方法,其中,所述一组扬声器声道已通过包括执行包括确定指示要在沿与回放屏幕的平面至少基本上平行的宽度轴的扭曲位置处被呈现的音频对象的沿宽度轴的未扭曲位置的值Xs并且生成以下值的扭曲的处理而生成: Xwarp, YFACTOR=yEXP,以及 X’ =x*YFACT0R+(1-YFACTOR)*[XFACTOR*Xwarp+(1-XFACTOR)*x)], 其中, Xwarp表示相对于回放屏幕的边缘的沿宽度轴的对象的原始扭曲位置, EXP是屏幕外扭曲参数, YFACTOR指示作为对象的沿与回放屏幕的平面至少基本上垂直的深度轴的扭曲位置y的函数的、沿宽度轴的扭曲的程度, X,表示相对于回放屏幕的边缘的沿宽度轴的对象的扭曲对象位置,并且 XFACTOR是一个所述扭曲程度参数。55.如权利要求50-54中的任一项所述的音频处理单元,其中,基于对象的音频节目包括指示所述至少一个扭曲程度参数的屏幕相关的元数据,并且所述一组扬声器声道已通过包括解析基于对象的音频节目以识别由屏幕相关的元数据所指示的每一个所述扭曲程度参数的步骤的处理而生成。56.如权利要求50-55中的任一项所述的音频处理单元,其中,所述音频处理单元是解码器。57.如权利要求50-56中的任一项所述的音频处理单元,其中,每一个所述扭曲程度参数是指示要通过回放系统对节目的对应的音频内容所执行的扭曲的最大程度的非二进制值。
【专利摘要】在一些实施例中,用于生成包括指示用于至少一个音频对象的至少一个扭曲程度参数的屏幕相关的元数据的基于对象的音频节目、或者包括通过对基于对象的音频节目的音频内容扭曲到至少部分地由至少一个扭曲程度参数所确定的程度来生成基于扬声器声道的节目的方法,或者用于解码或呈现任何这样的音频节目的方法。其它方面是被配置为执行这样的音频信号生成、解码或者呈现的系统和包括存储任何这样的音频节目的至少一个分段的缓冲存储器的音频处理单元(例如解码器或者编码器)。
【IPC分类】H04N5/64, H04N5/74, H04R3/12, H04R5/02, H04N7/06, G11B20/10
【公开号】CN105723740
【申请号】CN201480062364
【发明人】C·Q·鲁宾逊, N·R·茨恩高斯, F·桑切斯
【申请人】杜比实验室特许公司
【公开日】2016年6月29日
【申请日】2014年11月11日
【公告号】WO2015073454A2, WO2015073454A3
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1