Mpeg-4二进制形式传输的制作方法

文档序号:7642824阅读:163来源:国知局
专利名称:Mpeg-4二进制形式传输的制作方法
技术领域
本发明涉及一种处理包括与方格式图像有关的数据的数字视频数据信号的方法,所说处理方法包括用于将数字视频数据信号分段的一个分段步骤,以提供分段的视频数据信号,一个分段的视频数据信号包括是该方格式图像的一个区域的一个视频目标。本发明还涉及相应于所说处理方法的设备。
这样一种处理方法例如可以用基于视频目标的编码框架,例如MPEG-4编码标准编码一个数字视频数据信号。
背景技术
基于视频目标的编码框架,例如被称为MPEG-4视觉版本1,ISO/IEC 14496-2的MPEG-4编码标准允许编码具有不同形状的视频目标,代替全部方格式的图像。方格式图像由具有亮度和色度值的像素表示。除这些值外,一个视频目标的一个像素具有一个二进制形式值。该值是从一个方格式图像由分段处理得到的,并且由一个位表示,该位表示该像素是在该目标中或者不在该目标中。视频目标的分开编码可以丰富在某些多媒体业务中的用户的相互作用,这是因为可灵活地对该数字视频数据信号进行存取和容易处理该视频信息。按这种框架,编码器可执行本地确定的预处理,目的在于自动地识别在一图像序列中出现的目标。
分段操作目的在于将一个方格式图像或图像的一个视频序列划分为按一个给定准则提取的区域。

图1表示分段处理的一个例子,其中方格式图像(RP)已被划分成若干视频目标(V01-V04)。对于一个视频序列的情况,这种划分应当得到代表该视频目标的目标掩码的合成序列的时间相干性。基于空间均匀性,运动相干准则或空间时间处理已为分段视频序列推荐了不同的方法。这些方法期待按亮度均匀性和运动相干准则识别运动目标的类别。
发明概要本发明的目的在于提供一种处理一个数字视频数据信号的方法,以得到包括二进制形式的修改的数字视频数据信号。
至今,仅由推荐的ITV-R BT.601-5标准化像素数据传输。其指定数字编码视频信号的方法,但并未提出或建议传输二进制形式数据的任何方法。
按本发明的处理方法,其特征在于包括用一个识别符进行识别的步骤,用于识别一个方格式图像的像素属于哪一个分段的视频数据信号的视频目标,和插入步骤,用于将该识别符插入该数字视频数据信号中以形成由基于视频目标的编码框架编码的修改的数字视频数据信号。
这样的一种处理方法允许与二进制形式数据相关的信息通过视频目标的识别符插入到一个数字视频数据信号中,结果,由这种处理方法得到的修改的数字视频数据信号可直接由基于视频目标的编码器编码,特别地,由一个硬编码器进行编码。
在本发明的优选实施例中,数字视频数据信号由推荐的ITU-RBT.601-5定义,而识别符如在推荐的ITU-R BT.1364所定义的那样首先被插入到一个辅助数据分组中,然后插入到在行水平上的数字视频数据信号的垂直消隐空间。
本发明还应用到实施这样一种处理方法的处理设备。
根据参照下面描述的实施例的说明,本发明的这些和其他方面将显而易见。
附图的简述现在参照附图,借助例子,描述本发明,其中图1表示包括不同视频目标的分段的图像的一个例子,图2是按本发明的处理方法的方块图,图3表示由推荐的ITU-R BT.601-5定义的一个数字视频数据信号,以及图4表示由推荐的ITU-R BT.1364定义的一个辅助数据分组。
发明的详细说明本发明的目的在于将二进制形式数据插入到一个数字视频数据信号中,这样得到的修改的数字视频数据信号直接由一个基于视频目标的编码器进行编码。图2是说明按本发明处理方法原理的方块图。
这样一种处理方法处理包括与方格式图像相关的数字视频数据信号(DVS),和由该数字视频数据信号的分段步骤(SEG)提供的分段的视频数据信号(SVS),包括是该方格式图像的一个区域的视频目标(V0)的分段的视频数据信号。
所说处理方法包括步骤—用一个识别符识别(ID)一个方格式图像像素属于该分段的视频数据信号(SVS)的哪一个视频目标,—将该识别符(INS)插入到该数字视频数据信号中,以形成修改的数字视频数据信号(DVSm),以及—使用MPEG-4编码标准对修改的数字视频数据信号进行编码(ENC),以提供编码的数据信号(ES)。
在本发明的优选实施例中,数字视频数据信号(DVS)是由推荐的ITU-R BT.601-5定义的一种。图3表示由所说推荐定义的数字视频数据信号的结构。这样的数字视频数据信号包括—视频数据(YCRCB[1]和YCRCB[2],包括亮度取样(Y)和两个同步的色-差信号(CR和CB)),—水平消隐空间(HBSu1,HBSd1,HBSu2和HBSd2),—垂直消隐空间(VBS1和VBS2)。
例如,在每秒50半帧的系统中,在那里整个图像包括625行,该视频数据被分成两个半帧,每半帧包括288行。该帧的剩余部分相应于不同的水平消隐空间。
如果取样频率对亮度信号是13.5MHz,对于4∶2∶2编码格式的每个色差信号而言取样频率是6.75MHz。这样对于亮度信号,每整行的取样数是864,而对于每个色差信号的是432。这些取样按8位(可选择10)编码。如果对亮度信号每数字有效行的取样数是720,而且对于每个色差信号的是360,对于垂直消隐空间可得到最大的288个取样数。
本发明可应用到如由推荐的ITU-R BT.601-5所定义的其他格式的数字视频数据信号,例如,如相应525行的每秒速率60半帧的系统,4∶4∶4编码格式,或取样频率18MHz用于亮度信号。
本发明还应用于其他的数字视频数据信号,例如,如由相应于HDTV信号的推荐的ITU-R BT.656,ITU-R BT.799,或ITU-RBT.1120定义的数字视频数据信号。
在由本发明处理方法处理之前,应使用产生若干分段的视频数据信号(SVS)的分段处理(SEG)分段该数字视频数据信号。可以用两种方法执行分段处理。第一种方法是基于一种通常的软件方法,例如在本发明背景中所描述的,但消耗很多时间。第二种方法快得多并被称为Chroma Key处理。这种处理专用于提取至少两个视频目标,其中一个是背景视频目标。该背景目标最好是蓝的或绿的,这样的分段处理可以用硬件应用程序实施。
之后使用如在推荐的ITU-R BT.1364中定义的辅助数据将视频目标的识别符插入到该数字视频数据信号中。辅助数据以分组方式传送,每个分组携带自己的识别符。图4表示如在推荐的ITU-R BT.1364中定义的一个辅助数据分组。所说的辅助数据分组包括—一个辅助数据标志(ADF),是一个固定的始标,其可使辅助数据分组被检测,—一个数据识别字(DID),使分组携带一个特定类型的可加以识别的辅助数据,—一个数据块数(DBN),对每个连续的数据分组递增一,该连续的数据分组共享一个公共数据识别字并要求连续性指示,—一个数据计算字(DC),指示该分组长度,—一个用户数据字(UDW),它包含辅助数据,在每个分组高达255个字,—一个校验和字(CD),通过用户数据字,根据数据识别字确定辅助数据分组的有效性。
通过在数字视频数据信号的数字消隐部分中的数字视频部件接口,推荐的ITU-R BT.1364对传输辅助数据信号提供了一种机制。在本发明的优选实施例中,辅助数据分组插入到在行水平线上的数字视频数据信号(DVS)的垂直消隐空间(VBS1和VBS2)。对于在相同垂直消隐空间中提供的整个分组有充分的空间可利用。
每一个像素行或线表示720个像素和用户数据字的大小将不超过255个字或字节。结果,高达4个视频目标(V0)可以插入到该数字视频数据信号(DVS)中。至此,按本发明的处理方法包括一个识别步骤(ID),用于用一个识别符识别一个方格式图像像素属于哪一个分段视频数据信号的视频目标。视频目标用具有2位的一个识别符编码。因此,现在为充分地描述一个像素,需要相应180个字节的1440位。
所说识别符使得有可能按下列方式确定相应的像素属于哪一个视频目标—00该像素属于第一视频目标(V01),—01该像素属于第二视频目标(V02),—10该像素属于第三视频目标(V03),—11该像素属于第四视频目标(V04)。
从0-179编号是用户数据字的字节。编码n字节的八位包含下列信息—位0和1包含像素4n的识别符,—位2和3包含像素4n+1的识别符,—位4和5包含像素4n+2的识别符,—位6和7包含像素4n+3的识别符。
最后,将该识别符插入到一个辅助数据分组的子步骤(ADP)同将该辅助数据分组插入到一个垂直消隐空间的子步骤(VBS)组合,使得可能形成直接由一个基于视频目标的编码器进行编码的修改的数字视频数据信号(DVSm)。
要指出的是,使用动词“包括”和其配对并不排除存在任何其他的不同于在任一权利要求中所定义的那些步骤或元件。
权利要求
1.一种处理包括与方格式图像相关的数据的一个数字视频数据信号(DVS)的方法,所说处理方法包括分段步骤(SEG),用于分段该数字视频数据信号,以提供分段的视频数据信号(SVS),一个分段的视频数据信号包括是该方格式图像的一个区域的一个视频目标(V0),其特征在于所说处理方法包括—一个识别步骤(ID)用于使用一个识别符识别一个方格式图像的像素属于该分段的视频数据信号的哪一个视频目标,以及—一个插入步骤(INS),用于将该识别符插入到该数字视频数据信号中,以形成一个由基于视频目标的编码框架编码的修改的数字视频数据信号(DVSm)。
2.如权利要求1的处理一个数字视频数据信号(DVS)的方法,其特征在于该数字视频数据信号由推荐的ITU-R BT.601-5定义,和该插入步骤(INS)包括第一插入子步骤(ADP),将识别符插入到如在推荐的ITU-R BT.1364中定义的一个辅助数据分组中,和第二插入子步骤(VBS),将该辅助数据分组插入到一个行水平线上的数字视频数据信号的一个垂直消隐空间。
3.如权利要求1的处理一个数字视频数据信号(DVS)的方法,其特征在于识别步骤(ID)适于分配一个按两位编码的识别符到方格式图像的一个给定的像素。
4.一种用于处理包括与方格式图像相关的数据的一个数字视频数据信号(DVS)的设备,所说处理设备包括用于分段(SEG)该数字视频数据信号以提供分段的视频数据信号(SVS)的装置,一个分段的视频数据信号包括是该方格式图像的一个区域的一个视频目标(V0),其特征在于所说处理设备包括—用于使用一个识别符识别一个方格式图像的像素属于分段的视频数据信号的哪一个视频目标的装置,以及—用于将该识别符插入到该数字视频数据信号中以形成由基于视频目标的编码框架编码的修改的数字视频数据信号(DVSm)的装置。
5.如权利要求4的处理设备,其特征在于数字视频数据信号由推荐的ITU-R BT.601-5定义,以及插入装置(INS)适于首先将该识别符插入到如在推荐的ITU-R BT.1364中定义那样的一个辅助数据分组(ADP)中,接着辅助数据分组被插入到在行水平线上的该数字视频数据信号的垂直消隐空间(VBS)中。
6.如权利要求4的处理设备,其特征在于识别装置(ID)适于分配按两位编码的一个识别符到方格式图像的一个给定的像素。
7.一个如由推荐的ITU-R BT.601-5定义的数字视频数据信号包括如在推荐的ITU-R BT.1364定义的辅助数据分组,一个辅助数据分组被提供在一行水平线上的数字视频数据信号的垂直消隐空间中,其特征在于该辅助数据分组包括相应视频目标的识别符,所说视频目标由包括在该数字视频数据信号中的方格式图像的分段处理产生。
全文摘要
本发明涉及处理数字视频数据信号(DVS)的一种方法,以便将二进制形式数据插入到该数字视频数据信号中。这样一种方法用于处理包括与方格式图像有关的数据的数字视频数据信号,和由该数字视频数据信号的分段步骤(SEG)提供的分段的视频数据信号(SVS),包括是该方格式图像的一个区域的一个视频目标(V0)的分段的视频数据信号。所说处理方法包括用一个识别符进行识别(ID)的步骤,用于识别一个方格式图像的像素属于分段的视频数据信号(SVS)的哪一个视频目标、将识别符(INS)插入到该数字视频数据信号中以形成修改的数字视频数据信号(DVSm),以及使用基于视频目标的编码框架对该修改的数字视频数据信号进行编码(ENC),以得到一个被编码的数据信号(ES)。
文档编号H04N7/08GK1381140SQ01801317
公开日2002年11月20日 申请日期2001年4月27日 优先权日2000年5月18日
发明者G·福瓦克, P·多比尼 申请人:皇家菲利浦电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1