用于可伸缩视频的感兴趣区域信息设置方法和解析方法

文档序号:7751348阅读:88来源:国知局
专利名称:用于可伸缩视频的感兴趣区域信息设置方法和解析方法
技术领域
本发明涉及一种支持在可伸缩视频编码(SVC)中编码和解码多个感兴趣区域 (ROI)的新功能的方法,且更具体地,涉及一种在SVC中定义多个ROI且独立地用SVC中提供的可伸缩性来解码该多个ROI的方法。
背景技术
作为在运动图片编解码器中实现的ROI的例子,存在基于HJ63的编码和基于 MPEG-4对象的编码。提供以H. 263独立地解码特定区域的方法的独立分段解码(ISD)模式从将被独立地解码的该区域被视为在基于MPEG-4对象的编码中的一个完整图像的角度来看与基于MPEG-4对象的编码相同。但是,该ISD模式不同于如下的基于MPEG-4对象的编码。I.H.洸3中的ISD模式在基于HJ63的编码中,独立地解码图像中的特定区域的方法被提供作为选项 (见H. 263的附件R)。具体地,在基于H. 263的编码中,可以通过使用可伸缩分层编码来提供空间、时间和质量的可伸缩性。在H. 263中,通过使用对应于SVC的粗粒度可伸缩性(CGS)的方法来提供质量可伸缩性,且通过使用对应于精细粒度可伸缩性(res)的方法并支持各种帧来提供时间可伸缩性。另外,在空间可伸缩性中,类似于可伸缩视频解码(SVD),根据分辨率来进行编码,且使用具有较低分辨率的图像来进行层间编码。2.基于MPEG-4对象的编码器在基于MPEG-4对象的编码中,具有任意形状的对象区域被编码成由视频对象平面(VOP)定义的矩形区域。根据本方法,类似于R0I,在图像中的特定区域以其能够被独立地解码的方式被编码。根据基于H. 264的编码的SVC具有比H. 263和MPEG-4更高的编码速率,且在SVC 中的编码机制不同于H. 263和MPEG-4的编码机制。

发明内容
本发明提供一种代表适合于可伸缩视频编码(SVC)的感兴趣的区域(ROI)的方法。技术方案根据本发明的方面,提供一种多ROI (感兴趣区域)设置装置,包括R0I设置单元,其设置至少一个或多个ROI并通过定义宏块作为被分配给至少一个ROI的方式来将ROI 标识编号分配给每个ROI ;映射单元,其将至少一个或多个片组标识编号分配给至少一个或多个ROI标识编号;以及消息生成单元,其生成消息,该消息包括ROI相关信息、片组相关信息、关于将至少一个或多个ROI标识编号映射到至少一个或多个片组标识编号的映射信息和可伸缩性信息。多ROI设置装置可以进一步包括选择单元,其基于消息从比特流中选择具有特定可伸缩性的特定ROI的比特流。另外,当在ROI之间存在重叠区域时,映射单元可以将片组标识编号的每个分配给重叠区域和不重叠其他ROI的ROI的区域。另外,选择单元可以基于在消息中的信息,来从比特流中检测与被映射到特定ROI 标识编号的片组标识编号相对应的片组,移除其中不存在所检测的片组的NAL单元,并移除具有高于特定可伸缩性的可伸缩性的NAL单元。根据本发明的另一方面,提供一种ROI选择装置,包括接收单元,其接收具有消息的比特流,该消息包括关于将至少一个或多个片组分配到一个或多个ROI集的映射的映射信息、ROI相关信息、片组相关信息和可伸缩性信息;以及选择单元,其基于消息从比特流中选择与具有特定可伸缩性的特定ROI相对应的比特流。映射信息可以包括关于将ROI标识编号分配给至少一个或多个ROI的信息,和关于将表示至少一个或多个片组的片组标识编号分配给ROI标识编号的信息。另外,当在ROI之间存在重叠区域时,片组标识编号可以被分配给重叠区域和不重叠其他ROI的ROI的区域。根据本发明的另一方面,提供一种选择性ROI重构装置,包括接收单元,其接收具有消息的比特流,该消息包括关于将至少一个或多个片组分配到一个或多个ROI集的映射的映射信息、ROI相关信息、片组相关信息和可伸缩性信息;以及选择单元,其基于消息从比特流中选择与具有特定可伸缩性的特定ROI相对应的比特流;以及解码单元,其解码所选择的比特流。根据本发明的另一方面,提供一种多ROI (感兴趣区域)设置方法,包括(a)设置至少一个或多个ROI和将ROI标识编号分配给每个ROI ; (b)将至少一个或多个片组标识编号映射给至少一个或多个ROI标识编号;以及(c)生成消息,该信息包括ROI相关信息、片组相关信息、关于将至少一个或多个ROI标识编号映射到至少一个或多个片组标识编号的映射信息和可伸缩性信息。多ROI设置方法可以进一步包括(d)基于消息从比特流中选择具有特定可伸缩性的特定ROI的比特流。根据本发明的另一方面,一种ROI选择方法,包括(a)接收具有消息的比特流,该消息包括关于将至少一个或多个片组分配到一个或多个ROI集的映射的映射信息、ROI相关信息、片组相关信息和可伸缩性信息;以及(b)基于消息从比特流中选择与具有特定可伸缩性的特定ROI相对应的比特流。根据本发明的另一方面,提供一种选择性ROI重构方法,包括(a)接收具有消息的比特流,该消息包括关于将至少一个或多个片组分配到一个或多个ROI集的映射的映射信息、ROI相关信息、片组相关信息和可伸缩性信息;(b)基于消息从比特流中选择与具有特定可伸缩性的特定ROI相对应的比特流;以及(C)解码所选择的比特流。具体来说,根据本发明的一个方面,提供了一种用于可伸缩视频的ROI (感兴趣区域)信息设置方法,该方法包括在帧中设置至少一个R0I,并且向所述至少一个ROI中的每一个ROI分配ROI标识编号;将该ROI标识编号映射到层标识编号;以及将至少一个或多个片组标识编号映射到该层标识编号,其中,SEI (补充增强信息)消息包括该ROI标识编号到该层标识编号之间的映射信息、以及该ROI标识编号与所述至少一个或多个片组标识编号之间的映射信息。根据本发明的又一方面,提供了一种用于可伸缩视频的ROI解析方法,该方法包括根据SEI消息来确认ROI标识编号与层标识编号之间的映射关系;根据该SEI消息来确定与该层标识编号对应的至少一个或多个片组标识编号;以及基于所述至少一个或多个片组标识编号来确定在PSS(图像参数集)中对应的片组的位置。根据本发明的又一方面,提供了一种ROI解析方法,该方法包括根据可伸缩信息 SEI消息来确认包括ROI的层的层标识编号与ROI标识编号之间的映射关系;根据子图像可伸缩层SEI消息和运动约束片组集SEI消息来确定与该层标识编号对应的至少一个或多个片组标识编号;以及基于所述至少一个或多个片组标识编号来确定在PSS中对应的片组的位置。


图1示出根据本发明的实施例的被显示在移动电话或PDA的屏幕上的交通监视窗□。图2示出被定义在类型2的片组映射(slice group map)中的四个片组。图3示出在存在一个感兴趣的区域(ROI)的情况下的例子。图4示出存在具有重叠区域的两个ROI的情况下的例子。图5A示出在通过使用灵活的宏块排序(FMO)实现的图4的ROI的情况下的例子。图5B示出根据本发明的实施例的对于包括ROI在内的补充增强信息(SEI)消息的SEI消息生成操作。图6是示出根据本发明的实施例的基于ROI的视频通信、视频编码和解码操作的示意图。图7是示出根据本发明的实施例的多ROI设置装置的构造的图。图8是示出根据本发明的实施例的ROI选择装置的构造的图。图9A是示出根据本发明的实施例的选择性ROI重构装置的构造的图。图9B示出根据本发明的实施例的选择性ROI重构装置的ROI提取操作。图10AU0B和IOC示出根据本发明的实施例的SEI消息的语法。图11示出根据本发明的实施例的SEI消息的语法的例子。图12是示出在可伸缩视频编码(SVC)中实现多个ROI的操作的流程图。
具体实施例方式近来,已经使用可伸缩视频编码(SVC)作为用于在不同环境中传输视频的重要技术。在SVC中,根据用户的终端或网络的情况从已编码的比特流中移除特定部分,以便可以生成具有不同的时间、空间和质量特性的比特流。除了现有SVC的前述特征以外,本发明提供在具有一个或多个ROI的可伸缩视频流中提取具有特定的感兴趣的区域(ROI)的新的比特流的方法。由于这种方法,用户可以看到具有对于诸如移动电话或PDA之类的限制了分辨率和显示尺寸的用户的装置来说可能的最高分辨率的视频。当网络或终端在尺寸方面受限时,仅传输在视频中具有重要意义的感兴趣的区域 (ROI),以便可以提供能够保证服务质量(QoQ的视频流服务。现在,参考图1描述其示例。图1示出根据本发明的实施例的被显示在移动电话或PDA的屏幕上的交通监视窗在具有低分辨率的这种移动电话或PDA中,接收原始图像,该原始图像的分辨率被处理以便被降低。但是,在本实施例中,仅接收如并输出Iio或120定义的R0I,以便可以浏览适合于该终端的ROI。在SVC中的多个ROI的实现当定义了一个或多个ROI时,考虑两因素以便代表R0I。1)可以提供一个或多个ROI以便在可伸缩视频比特流中具有不同的可伸缩性。2)在两个ROI之间可能存在重叠区域,且重叠区域可能减少编码速率。在本实施例中,使用根据H. 264/AVC的灵活的宏块排序(FMO)来构造独立的ROI。1.使用FMO来编码和解码ROI现在,将描述根据本发明的实施例的SVC中的ROI的实现。在本发明的实施例中, 使用根据各种片组映射类型中的类型2的片组映射的FMO来定义ROI作为片组。图2示出在类型2的片组映射中定义的四个片组。应该注意,前述类型仅是示例,但本发明包括其所有修改和改变。图3示出在存在一个ROI的情况下的例子。位于帧中的ROI外部的宏块被定义为另一片组。如果仅存在一个ROIJUROI 310 变成片组1,而其背景变成片组2。给该帧中的每个宏块分配包括了该宏块的片组的片组ID。给每个宏块分配一个片组ID。在SVC中,以片组为单位进行帧的编码。当编码特定的片组时,仅编码在该帧中具有该特定片组的相同片组ID的宏块。在编码中,在图像参数集中,描述了片组的总数和片组ID,且记录在每个片组的左上和右下角中的宏块的地址。该信息被用于进行以片为单位的编码。2.使用FMO来实现多个ROI图4示出在存在具有重叠区域的两个ROI的情况下的例子。不像图3所示的在一个帧中存在一个ROI的情况,在多个ROI的情况下,存在多个 ROI。因此,需要考虑在ROI之间的重叠区域。例如,如图4所示,可以定义R0I_1 400和R0I_2 440。在这种情况下,使用FM0, 将R0I_1 400和R0I_2 440定义为单独的片组。因此,被包括在R0I_1 400和R0I_2 440 中的重叠区域可以被包括在包括了 R0I_1 400或R0I_2 440的一个片组中。在这种情况下,有以下问题。重叠区域420被包括在具有在R0I_1 400和R0I_2 440中较低的片组ID的片组中。例如,当R0I_1 400的片组ID是0且R0I_2 440的片组ID是1时,重叠区域中的宏块被包括在R0I_1 400中。在合成的编码中,编码R0I_1 400以便维持原始区域410和420。但是,编码R0I_2 440以便仅分配排除重叠区域以外的区域430作为R0I_2。在这种情况下,当用户仅解码来自编码比特流的R0I_2 440时,仅编码R0I_2 440的排除重叠区域以外的区域430以便在编码器中看到。为了解决该问题,根据本发明的实施例,在R0I_1 400和R0I_2 440之间重叠区域 OR 420被定义为独立的片组。因此,重复区域420可以被独立地编码和解码。但是,为了满足在FMO中定义的规则,重叠区域的片组ID需要低于R0I_1 400和R0I_2 440的片组ID。当用户想要浏览R0I_1 400时,重叠区域420和R0I_1 400排除重叠区域420以外的区域410被编码和解码。当用户想要浏览R0I_2 440时,重叠区域420和R0I_2 440 排除重叠区域420以外的区域430被编码和解码。因此,可以浏览适当的视频。图5A示出在通过使用FMO实现图4所示的ROI的情况下的例子。作为例子,原始视频具有通用图像格式(CIF)尺寸,且用户可能想要浏览原始尺寸、即CIF尺寸的R0I_1 500和其原始尺寸(分辨率)的一半、即四分之一 CIFOiCIF)尺寸的R0I_2 5400在这种情况下,为了编码R0I_1 500和R0I_2 M0,编码器在可伸缩层 (QCIF, CIF.4CIF)中进行编码。更具体地,编码器编码R0I_1 500排除重叠区域以外的区域R0I_1-0R 510、排除重叠区域以外的R0I_2-0R 530和重叠区域OR 520作为三个独立的片组。每个片组是矩形的形状。可以通过使用类型2的片组映射来编码ROI和重叠区域 OR。在本实施例中,可伸缩性增加或减少2的整数倍。作为例子,如图5A所示,为了通过考虑重叠区域OR来进行解码,重叠区域OR的片组ID需要低于R0I_1 500和R0I_2 540的片组ID。因此,重叠区域OR,R0I_1和R0I_2的片组ID可以被分别分配0、1和2。3.用于提取ROI比特流的元数据如图4和5A所示,当通过使用FMO在视频中定义具有重叠区域的多个ROI时,可以用一个或多个片组来构造一个ROI。因此,为了提取具有特定ROI的比特流,需要指示每个片组被包括在哪个ROI中的信息。例如,可以从原始比特流中提取具有图4和5A所示的每个ROI (R0I_1和R0I_2) 的两个比特流。可以在用户的终端中解码并显示每个R0I。在这种情况下,可以在一个显示单元或多个显示单元上独立地或同时显示R0I。在本发明的实施例中,为了提取具有特定ROI的比特流,表示ROI信息被定义为补充增强信息(SEI)的元数据被提供给可伸缩性视频比特流。包括ROI关联信息在内的SEI 消息包括ROI的位置和尺寸和ROI的可伸缩性。由于在SEI中描述了必要的元数据,因此提取ROI所需的信息可以被传输给比特流提取器或解码器。如下是被包括在表示ROI的元数据的结构中的主要信息。★ ROI的数量被包括在比特流中的ROI的数量★ROI ID :R0I唯一的值,用户可以用它来选择特定的ROI以下信息被用于对应的空间层。★片组ID 片组唯一的ID
★片组的尺寸和位置关于片组的尺寸和位置的信息,用它可以以特定的可伸缩性来识别ROI的尺寸和位置★片组到ROI的映射关于将片组ID映射到特定ROI ID的信息在当前的SVC中,通过使用三个SEI、即可伸缩信息SEI、子图像可伸缩层信息SEI 和运动约束片组集SEI来呈现ROI关联信息。图5B示出对于包括ROI在内的SEI消息的SEI消息生成操作。通过使用包括关于片组的信息在内的FMO信息来生成图像参数集(PPS)。以SEI 的形式来描述对应于片组的层。此时,生成包括用于将ROI ID映射到层中的ROI关联层的信息在内的SEI。接下来,生成包括表示关于链接到片组ID的层ID的信息的元数据在内的 SEI,并将其插入要被编码的比特流中。4.提取具有ROI的比特流图6是示出根据本发明的实施例的基于ROI的视频通信、视频编码和解码操作的示意图。在编码器610中,将输入的视频数据编码成SVC网络抽象层(NAL)单元(611)。 还将在被包括在SEI消息中的SVC比特流中的ROI关联信息和可伸缩性信息也编码成SEI NAL单元(612)。在传输中,被编码的SEI NAL单元先于包含被编码的视频数据的SVC NAL单元。在选择单元620中,提取从在编码器610中编码的可伸缩视频比特流中选择的具有特定ROI的比特流。在解码器630中,解码用所提取的NAL单元构造的比特流。现在,参考图7和8详细描述在选择单元620中进行的提取具有ROI的比特流的方法。图7是示出根据本发明的实施例的多ROI设置装置700的构造的图。多ROI设置装置700进行在SVC中的多个ROI的设置、所设置的ROI的编码和用于解码ROI的SEI消息的生成。另外,多ROI设置装置700可以进行仅提取具有特定ROI的比特流的功能。多ROI设置装置700包括ROI设置单元710、映射单元720和消息生成单元730。 多ROI设置装置700可以进一步包括选择单元740。ROI设置单元710设置至少一个或多个ROI,以便通过H. 264的多个片组的灵活的宏块排序(FMO)来设置宏块作为至少一个或多个ROI,且该宏块分配ROI ID给ROI。映射单元720给至少一个或多个ROI ID分配至少一个或多个片组ID。映射单元 720根据图3和4所示的操作将ROI ID映射到片组ID。当在视频中存在一个或多个ROI时,ID被用于标识R0I。由于ROI是有意义的区域,因此需要不考虑空间分辨率来指定特定空间区域的方法。在SVC中,仅给能够表示特定可伸缩性的特定帧速率的片组指定layer_ID。在比特流提取器中,设置ROI ID以便不考虑可伸缩性和帧速率来指定特定R0I,且设置片组ID以便表示特定可伸缩性的特定帧速率。 然后,进行映射。消息生成单元730生成一个消息,包括ROI关联信息、片组关联信息、关于将ROI ID映射到一个或多个片组ID的映射消息和可伸缩性信息。该消息在H. 264/AVC和SVC中的补充增强信息(SEI)消息,且被编码以便被包括在编码器的比特流中。由于在上述部分 “3.用于提取ROI比特流的元数据”中描述SEI消息,因此省略SEI消息的详细描述。选择单元740根据由消息生成单元730生成的SEI消息从初始比特流提取具备具有特定可伸缩性的特定ROI的比特流。现在将参考图8详细描述选择单元740。图8是示出根据本发明的实施例的ROI选择装置800的构造的图。ROI选择单元800包括接收单元810和选择单元820。接收单元810接收具有包括关于映射的映射信息(其分配至少一个或多个片组给至少一个或多个ROI集)、R0I关联信息、片组关联信息、和可伸缩性信息在内的消息的比特流。选择单元820可以从输入的可伸缩视频流中提取具有具备特定可伸缩性的特定 ROI的比特流。选择单元820进行SEI消息解析以便提取初始比特流中的R0I,以基于SEI 消息来从比特流中提取对应于具有特定可伸缩性的特定ROI的比特流。关于ROI的消息以元数据的形式被包括在SEI消息中,且用于提取特定ROI所需的消息被包括在SEI消息中。根据对终端或网络的限制或根据用户的选择,输入将被提取的外部或预定ROI的 ROI ID和可伸缩性,且通过使用在将经过解析的SEI消息中的关于ROI ID和片组ID之间的映射的映射信息来标识对应于将被提取的可伸缩性层的片组。接下来,当被包括在所请求的ROI中的片组不存在于任何所接收的NAL单元中时, 移除对应的NAL单元。另外,当NAL单元具有高于所请求的ROI的可伸缩性的分辨率时,移除NAL单元。用没有在上述操作中被移除的NAL单元来构造从选择单元820输出的比特流。包括由选择单元820提取的ROI的比特流还是可伸缩的比特流。图9A是示出根据本发明的实施例的选择性ROI重构装置900的构造的图。选择性ROI重构单元900包括实质上等于或类似于图8描述的接收单元810和选择单元820的接收单元910和选择单元920。另外,选择性ROI重构单元900包括解码单元 930。由于接收单元910和选择单元920等于或类似于图8所示的那些,因此省略其描述。解码单元930解码由选择单元820或920提取的具有ROI的比特流,以便可以最终在SVC中解码多个ROI。图9B示出根据本发明的实施例的选择性重构装置的ROI提取操作。从图像参数集(PPQ获得片组的数量和几何信息。接下来,从包括关于将layer_ ID映射到ROI ID的映射信息在内的SEI中获得表示片组的层的R0IID。接下来,从包括关于被连接于片组ID的layer_ID的信息在内的SEI中获得表示片组ID和layer_ID之间的关系的信息,以便可以通过使用片组ID来标识被连接于对应于将被提取的ROI ID的input_ R0I_ID的片组。因此,可以提取关联的比特流。图IOA到IOC示出根据本发明的实施例的SEI消息的语法。可伸缩性信息SEI提供比特流的可伸缩性信息。构造比特流的层根据其可伸缩性被分类为可伸缩层。可伸缩层表示特定片组。在可伸缩性信息SEI中描述关于可伸缩层的信息,以便可以提供提取比特流所需的信息。在本发明的实施例中,给可伸缩层分配ROI ID用于特定 R0I,以便可以提取具有特定ROI的比特流。由Sub_piC_layer_flag值为1来表示的可伸缩层指示片组是表示ROI的片组。当 sub_pic_layer_flag值是1时,记录ROI ID,以便ROI是特定片组的ROI。图11示出包含ROI有关信息的选择性的可伸缩性信息SEI。当ROI存在于比特流中时,roi_flag可以被用作取代Sub_piC_layer_flag的信号。roi_flag被设为1以便指示ROI存在于比特流。另外,ROI的数量值减去1被设为num_r0iS_minuS_l。当定义ROI 时,两个或多个片组存在于一个视频中。在这种情况下,将对应于ROI的层分组,以便可以定义子流(substream)。对应于 ROI减1的子流数量被设为nun_component_substreams_minus_l。ID被分配给子流,且ID 被存储在 component_substream_id 阵列中。另外描述构成子流的可伸缩层的信息,以便可以提供实际片组的可伸缩性信息。在本发明的另一实施例中,roi_flag、子流、nun_component_substreams_minus_l 禾口 component_substream_id 被存储作为 ROI 信息。图12是示出实现在SVC中的多个ROI的操作的流程图。如下进行在SVC中的多个ROI的实现。通过使用多个片组设置至少一个或多个ROI,且ROI ID被分配给ROI (操作S1210 和 S1220)。接下来,至少一个或多个片组ID被映射到至少一个或多个ROI ID (操作S1230)。 当在ROI之间存在重叠区域,片组ID被分配给重叠区域和不重叠其他ROI的ROI的区域。 (操作 S1230)。在完成将ROI ID映射到片组ID,生成包括ROI相关信息、片组相关信息、关于将 ROI ID映射到一个或多个片组ID的映射信息和可伸缩性信息的SEI消息(操作S1M0)。基于SEI消息从比特流中选择具有特定可伸缩性的特定ROI的比特流(操作 S1250)。更具体地,基于在SEI消息中的信息来选择与从比特流映射到特定ROI ID的片组 ID相对应的片组。移除其中不存在所检测的片组的NAL单元,且移除具有高于特定可伸缩性的可伸缩性的NAL单元。之后,提取剩余NAL单元作为比特流。解码所提取的比特流(操作SU60)。还可以实现本发明作为在计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可以存储能以后由计算机系统读取的数据的任何数据存储设备。计算机可读记录介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光数据存储设备和载波(诸如通过因特网的数据传输)。计算机可读记录介质还可以被分布在网络耦合计算机系统上,以便以分布式方式来存储和执行计算机可读代码。尽管已经参考本发明的示范实施例具体示出和描述了本发明,但本领域技术人员应该理解,在不脱离由所附权利要求所限定的本发明的精神和范围的情况下,可以进行形式和细节上的各种改变。
权利要求
1.一种用于可伸缩视频的ROI (感兴趣区域)信息设置方法,该方法包括在帧中设置至少一个R0I,并且向所述至少一个ROI中的每一个ROI分配ROI标识编号;将该ROI标识编号映射到层标识编号;以及将至少一个或多个片组标识编号映射到该层标识编号,其中,SEI (补充增强信息)消息包括该ROI标识编号到该层标识编号之间的映射信息、 以及该ROI标识编号与所述至少一个或多个片组标识编号之间的映射信息。
2.根据权利要求1的方法,其中,该SEI消息包括可伸缩信息SEI消息、子图像可伸缩层SEI消息和运动约束片组集SEI消息。
3.根据权利要求1的方法,其中,在该将该ROI标识编号映射到层标识编号的步骤中, 在该可伸缩信息SEI消息中包括用于指示该ROI标识编号到该层标识编号之间的映射信息的元数据。
4.根据权利要求1的方法,其中,在该分配ROI标识编号的步骤中,在该子图像可伸缩层SEI消息和该运动约束片组集SEI消息中包括用于指示以下信息的元数据,该信息关于向层标识编号分配的所分配的ROI标识编号和所述至少一个或多个片组标识编号。
5.根据权利要求1的方法,其中,在该在帧中设置至少一个ROI的步骤中,通过使用 H. 264多片组灵活的宏块排序(FMO)来设置宏块作为所述至少一个或多个ROI。
6.一种用于可伸缩视频的ROI解析方法,该方法包括根据SEI消息来确认ROI标识编号与层标识编号之间的映射关系;根据该SEI消息来确定与该层标识编号对应的至少一个或多个片组标识编号;以及基于所述至少一个或多个片组标识编号来确定在PSS (图像参数集)中对应的片组的位置。
7.根据权利要求6的方法,其中,通过确定在该SEI消息中包括的sub_piC_layer_ flag值,仅仅相对于具有1作为该sub_piC_layer_flag值的层来确认该ROI标识编号与层标识编号之间的映射关系。
8.根据权利要求7的方法,其中,该SEI消息是可伸缩信息SEI消息。
9.根据权利要求7的方法,其中,每一层地描述该Sub_piC_layer_flag值,并且只有当该sub_pic_layer_flag值为1时,ROI才存在于对应的层中。
10.根据权利要求6的方法,其中,该用于确定至少一个或多个片组标识编号的SEI消息是子图像可伸缩层SEI消息和运动约束片组集SEI消息。
11.根据权利要求6的方法,其中,该确定位置的步骤包括基于所述至少一个或多个片组标识编号来确定在每个片组的左上和右下角中的宏块的地址。
12.—种ROI解析方法,该方法包括根据可伸缩信息SEI消息来确认包括ROI的层的层标识编号与ROI标识编号之间的映射关系;根据子图像可伸缩层SEI消息和运动约束片组集SEI消息来确定与该层标识编号对应的至少一个或多个片组标识编号;以及基于所述至少一个或多个片组标识编号来确定在PSS中对应的片组的位置。
13.根据权利要求12的方法,其中,通过确定在该SEI消息中包括的sub_piC_layer_flag值,仅仅相对于具有1作为该sub_piC_layer_flag值的层来确认该ROI标识编号与层标识编号之间的映射关系。
14.根据权利要求13的方法,其中,每一层地描述该sub_piC_layer_flag值,并且只有当该sub_pic_layer_flag值为1时,ROI才存在于对应的层中。
15.根据权利要求12的方法,其中,该确定位置的步骤包括基于所述至少一个或多个片组标识编号来确定在每个片组的左上和右下角中的宏块的地址。
全文摘要
提供在可伸缩性视频编码中的多ROI(感兴趣区域)设置方法和装置以及ROI重构方法和装置。多ROI(感兴趣区域)设置装置,包括ROI设置单元,其设置至少一个或多个ROI并通过定义宏块作为被分配给至少一个ROI的方式来将ROI标识编号分配给每个ROI;映射单元,其将至少一个或多个片组标识编号分配给至少一个或多个ROI标识编号;以及消息生成单元,其生成消息,该消息包括ROI相关信息、片组相关信息、关于将至少一个或多个ROI标识编号映射到至少一个或多个片组标识编号的映射信息和可伸缩性信息。
文档编号H04N7/24GK102271249SQ20111023216
公开日2011年12月7日 申请日期2006年9月25日 优先权日2005年9月26日
发明者姜晶媛, 张供党, 洪镇佑, 裵泰眠, 金在坤, 鲁勇满 申请人:韩国电子通信研究院, 韩国科学技术院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1