一种媒体流的中转与交换方法

文档序号:7835577阅读:130来源:国知局
专利名称:一种媒体流的中转与交换方法
技术领域
本发明涉及一种音频或视频等媒体流的传输方法。
技术背景
当今社会,电信网、广播电视网、互联网是人们通信、娱乐和获取资讯的三个主要途径,随着科技的进一步发展,上述三种网络形式正在相互渗透、互相兼容,“三网融合”的概念被提出,并得到了一定发展。“三网融合”是为了实现网络资源的共享,避免低水平的重复建设,形成适应性广、容易维护、费用低的高速宽带的多媒体基础平台。其表现为技术上趋向一致,网络上可以实现互联互通,形成无缝覆盖,业务上互相渗透和交叉,应用上趋向使用统一的IP协议,在经营上互相竞争、互相合作,朝着向人类提供多样化、多媒体化、个性化服务的同一目标逐渐交汇在一起,行业管制和政策方面也逐渐趋向统一。
在三网融合的发展过程中,人们可以通过互联网获取广播电视网中的媒体流数据,也可以通过广播电视网获取互联网中的媒体流数据,快速、流畅的进行数据的中转与交换成为必需,因此媒体流的中转与交换成为该过程中的一种关键技术。其中需要把根据特定编码技术的第一编码格式的媒体流中转与交换为第二编码格式的媒体流。
特定的编码技术例如为MEPG4、MEPG2和MEPGl等编码技术。MEPG4中包括运动补偿处理,其首先把当前图象的一个宏块映射到前个图象的一个宏块上。一旦找到前个图象中最可能的宏块位置,则与当前图象的宏块相关的位移矢量就可以确定。随后,与当前宏块和该最可能的宏块之间的差值相对应的预测宏块以及相关的运动矢量被编码。
各种预测方法都是可以的,图象类型决定了用于编码每个宏块的预测方法。例如, 一个宏块可根据属于上个图象的参考宏块进行前向预测,其也可根据属于显示序列中的下一个图象的参考宏块进行反向预测。另一种选择是不进行预测,在这种方式下,直接对当前图象的宏块中的块进行编码,这些宏块被称作帧内宏块。该块编码技术的第二格式可包括不同于该技术第一格式的编码参数。例如,MPEG4格式与MEPGl和MPEG2的不同之处在于其在双向预测编码B图象中不允许有帧内宏块。如果不进行修改,那么根据MPEGl或MPEG2 标准编码且包括这种宏决的媒体流将不能与MPEG-4标准相适应,因而也就不能使用MPEG4 解码器解码。发明内容
为了克服现有技术中存在的问题,本发明提供了一种媒体流的中转与交换方法, 其可以提高媒体流中转与交换的效率及正确率。
本发明公开了一种媒体流的中转与交换方法,其将根据特定编码技术的第一编码格式的输入媒体流转换为根据该编码技术的第二编码格式的输出媒体流,该方法包括替代步骤,其将一组预测宏块替代属于输入数据流的双向预测编码B图像的一组帧内宏块。
在一个优选实施例中,该替代步骤包括如下步骤
存储帧内编码I图象或预测编码P图象的一组帧内宏块,
通过存储的I或P图象的宏块组来为属于B图象的帧内宏块确定一个参考宏块, 该I或P图象在显示顺序中处于B图象之前或之后,以及
根据该帧内及参考宏块计算预测宏块。
在另一个优选实施例中,该替代步骤包括如下步骤
把一组附加宏块加到一个图象中,
通过在显示顺序中处于B图象之前或之后的帧内编码I图象或预测编码P图象的附加宏块组来为属于B图象的帧内宏块确定一个参考宏块,
根据该帧内宏块和参考宏块计算预测宏块。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式
对本发明的媒体流的中转与交换方法进一步详细说明。
本发明的媒体流的中转与交换将根据特定编码技术的第一编码格式的输入媒体流转换为根据该编码技术的第二编码格式的输出媒体流,该方法包括替代步骤,其将一组预测宏块替代属于输入数据流的双向预测编码B图像的一组帧内宏块。
根据本发明的中转与交换方法的第一种操作模式包括以下步骤
可变长解码输入媒体流,从而为每个宏块提供包括量化的DCT系数、相应的量化步骤或标度、预定模式和运动矢量的解码数据,
校正该解码数据,以及
可变长编码该校正的解码数据,以提供输出媒体流。
在下面的情况下,需要校正步骤。
MPEG4标准不知道或不允许MPEGl甚至是MPEG2标准所允许的所有功能。举例来说,其处理图象不是根据其们的屏幕显示数,而是根据其们的显示时间来定的。为此,该校正步骤把MPEGl输入媒体流的图象的屏幕显示数中转与交换为MPEG4输出媒体流的显示时间,其受输入媒体流的已知速率R的影响。这个操作是一个简单中转与交换操作,其不需要重新量化已被量化的DCT系数。
MPEGl和MEPG2标准使能属于被确定的图象的一行宏决的一段连续宏块的量化步骤,其在该段开始时一次性地规定。MEPG4标准不知道“段”的概念。这就是为什么根据本发明的校正步骤把量化步骤指定给属于该段的所有宏块的原因。
事实上,在量化步骤,MPEG4标准传送差值量化步骤因此指定给属于该段的第一宏块,而0值赋予了下面的宏块,从而形成输出媒体流。
根据本发明的中转与交换方法的第二操作模式包括以下步骤
可变长解码输入媒体流,从而为每个宏块提供包括量化的DCT系数、相应的量化步骤、预定模式和运动矢量的解码数据,
利用修改的量化步骤重新量化已量化的DCT系数,从而得到修改的DCT系数,
可变长编码重新量化之后的数据,以提供输出媒体流;
把如此编码的数据存储到一个缓冲存储器中,并且
使该缓冲存储器的输入和输出通过改变修改的量化步骤而得以控制。
在下面的情况下,需要重新量化步骤
MPEGl和MPEG2标准提供了一种可能性,即在一个给定值的范围内把量化步骤从一个宏块变化到下一个宏块,在该范围内,量化步骤的变化不受限制。MPEG4标准本身把量化步骤的变化限制在+/_2。对于输入媒体流来说,如果量化步骤从一个宏块到下一个宏块的变化的绝对值大于2,则重新量化步骤将把此变化限制为2。通过预先存储与输入媒体流的一组宏块相对应的量化步骤,并确定用于该组宏块的量化步骤的最佳变化,该重新量化步骤可以得到改进。在该最佳变化形式中,考虑到修改过的量化步骤的变化被限制为+/-2, 修改过的量化步骤的曲线从存储的一行的量化步骤开始通过二次方极小化来确定。
帧内编码块的DC系数(即DCT系数,对于该系数来说,频率在二维中为零)须根据不同于其其所有系数的一种方法来进行逆量化。在MPEGl标准中,逆量化的结果是一个乘以DC系数的乘数,该乘数等于8。在MPEG4标准中,该乘数是一个变量并且是根据该标准定义的一个表的量化步骤的函数。因此,重新量化步骤以在该表中定义的值来替代输入媒体流的等于8的乘数,这是从原始量化步骤或修改的量化步骤开始的,这根据不同的情况而定。
这个重新量化步骤可以明显地改变输出媒体流的速率。在可变速率的媒体流的情况下,这种变化不会有任何效果。相反,在恒定速率或在一个给定值的范围内变化的速率的情况下,一个用于改变修改过的量化步骤的值的控制步骤是避免缓冲存储器的溢出所必需的。
实际上,如上所述,MPEG4标准不允许B图象中有帧内宏块,这就是为什么根据本发明的中转与交换还包括以预测宏块替代帧内宏块这一步骤的原因。
根据本发明的中转与交换方法第三种操作模式包括以下步骤
逆量化属于B图象的帧内宏决的量化DCT系数acBq,属于I图象的一组i个帧内宏块的aclq(i),或者属于P图象的一组j个帧内宏块的acPq(j),
存储包括分别属于B、I和P图象的系数acB,acl⑴,acP(j)的逆量化宏块,
为B图象的帧内宏块计算在显示顺序中处于B图象之前或之后的I或P图象中的参考宏块,并在随后根据帧内宏块和参考宏块计算预测宏块。
在其中搜索参考宏块的宏块组由一个I或P图象中存在的所有帧内宏块形成。根据可用存储资源的不同,该宏块组可被限制为在所述图象内扩展并在I或P图象中存在的某些宏块。该宏块组存储在存储器中,同时,I或P图象的一个宏块可被用作当前B图象的帧内宏块的参考。
计算参考宏块的步骤要考虑以下的参数来执行
根据B图象的当前帧内宏块和存储的宏块计算的预测误差值;
在这种情况下,预测误差的最小值被搜索。例如,该组宏块的一个宏块k的预测误差等于系数acB与P图象的acP(k)或I图象的acl (k)之差的绝对值。在另一个例子中, 其等于一个宏块所述系数之差的平方和。
相对于B图象的帧内宏块位置的P图象中的存储宏块的位置。实际上,如果该存储宏块离B图象的帧内宏块非常远,则编码相应运动矢量所需的比特数可能会相当大,这将会降低编码效率。与在给定值的范围之外的运动矢量相关的存储宏块因而被排除在了参考宏块的搜索区之外。在这种情况下,该参考宏块的预测误差不必是所有存储宏块中最小的,但其预测误差必须是属于一个搜索窗的存储宏块中最小的。
预测宏块因而根据B图象的当前帧内宏块和搜索到的参考宏块之间的差值来确定,同时,相关的运动矢量根据图象中的宏块的相应位置来确定。
在该优选变化形式中,预测误差的计算根据逆量化的宏块来执行。其同样可借助离散余弦逆变换IDCT把其们中转与交换为像素宏块。这将构成一个传统的运动估计情况。 但是,从计算时间的角度来说,IDCT变换可能是昂贵的,这就是为什么前面的解决方案被优选的原因。而且,由于在DCT域的能量中转与交换,因此在DCT域中的误差平方和与在像素域中的误差平方和相等,正因如此,这两种方法在这种特定情况下是等效的。
但是,如果在B图象之前或之后的P图象中没有帧内宏块,那么在确定参考宏块时将会出现问题。这就是为什么该方法还包括把一组附加宏块加到序列图象中这一步骤的原因。为此,通过在所述图象的首部字段中进行规定则可以改变图象的尺寸。在该优选的变化形式中,该中转与交换在图象底部增加一行宏块。同样也可把这一行加到图象的顶部,或把一列加到图象的右边或左边。由于图象的尺寸被改变,因此图象序列中的所有图象都要增加这些附加宏块。
因此,对于B图象的一个帧内宏块来说,该计算步骤将确定
在显示顺序中处于B图象之前或之后的I或P图象的附加宏块组中的参考宏块, 以及通过使用与上述相同的原理,根据帧内及参考宏块预测的宏块。
举例来说,附加宏块组包括一个标识,更确切地说,是具有相同值的数据。在刚才提及的情况中,附加信息利用最少的比特进行编码。对于I图象来说,这些宏块是帧内编码;对于P和B图象来说,附加宏块是前向编码,这是因为其们与零预测误差和零运动矢量有关。为了尽可能减小运动矢量,参考宏块在相同的列中被选为B图象的当前宏块。这个参考宏块不对应于P图象中的帧内宏块,但是,由于其所包含的数据在P图象中没有变化, 因此,其对应于前个I图象中的对应项。因此,预测宏块根据B图象的当前帧内宏块和I图象的帧内宏块之间的误差来计算。如果I图象的附加宏块包括等于零的数据,则预测宏块的DCT系数就是当前帧内宏块的系数acBq。
在前述方法的改进方案中,B图象的帧内宏块由包含DCT系数的预测宏块替代,该 DCT系数为零且与零运动矢量相关。重新量化和控制步骤的目的分别是为了保证由MPEG4 标准施加的量化步骤的变化以及为了控制输出媒体流的速率。
本发明的媒体流中转与交换方法把根据块编码技术的第一编码格式的输入媒体流中转与交换为根据该编码技术的第二编码格式的输出媒体流,如上所述,其优选适用于 MPEG4标准编码的输出媒体流,不过,如果中转与交换的条件类似的话,其也可全部或部分地应用于使用块编码技术的其其视频编码标准的中转与交换,例如MPEG2,H. 261或H. 263寸。
本发明的媒体流中转与交换方法的优点在于避免了完全解码,即包括根据决编码技术的第一格式的解码图象的重建,之后根据所述技术的第二格式的重新编码。其目的是尽可能减少相关操作,即使是在所述媒体流的部分解码和重新编码中,如编码数据的重新量化。本方法可以让用户以一种简单的方式在诸如可视电话这样的MPEG4应用中再次使用根据MPEG编码格式的图象。
以上已经参考本发明的具体实施例对本发明的媒体流的中转与交换方法进行了描述,但本领域技术人员还在本发明的精神范围内可以对其做出各种显而易见的变型和组合,其均纳入本发明的保护范围。
权利要求
1.一种媒体流的转换方法,其将根据特定编码技术的第一编码格式的输入媒体流转换为根据该编码技术的第二编码格式的输出媒体流,其特征在于,该方法包括替代步骤,所述替代步骤将一组预测宏块替代属于输入数据流的双向预测编码B图像的一组帧内宏块。
2.如权利要求1所述的媒体流的中转与交换方法,其特征在于,所述替代步骤包括如下步骤存储帧内编码I图象或预测编码P图象的一组帧内宏块,通过存储的I或P图象的宏块组来为属于B图象的帧内宏块确定一个参考宏块,该I 或P图象在显示顺序中处于B图象之前或之后,以及根据该帧内及参考宏块计算预测宏块。
3.如权利要求1所述的媒体流的中转与交换方法,其特征在于,所述替代步骤包括如下步骤把一组附加宏块加到一个图象中,通过在显示顺序中处于B图象之前或之后的帧内编码I图象或预测编码P图象的附加宏块组来为属于B图象的帧内宏块确定个参考宏块,根据该帧内宏块和参考宏块计算预测宏块。
全文摘要
本发明公开了一种媒体流的转换方法,其将根据特定编码技术的第一编码格式的输入媒体流转换为根据该编码技术的第二编码格式的输出媒体流,该方法包括替代步骤,其将一组预测宏块替代属于输入数据流的双向预测编码B图像的一组帧内宏块。该方法可以提高媒体流中转与交换的效率及正确率。
文档编号H04N7/26GK102523447SQ20111044258
公开日2012年6月27日 申请日期2011年12月27日 优先权日2011年12月27日
发明者李宗霖 申请人:李宗霖
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1