发送装置、发送方法、接收装置、接收方法、编码装置以及编码方法_4

文档序号:9583891阅读:来源:国知局
流内的每个基本流附属哪个节目的信息。
[0188]在PMT中,具有节目循环,其描述与整个节目相关的信息。此外,在PMT中,具有基本循环,其具有与每个基本流相关的信息。在这个配置实例中,具有两个视频基本循环(视频ESl循环和视频ES2循环)和一个音频基本循环(音频ESl循环)。
[0189]在每个视频基本循环中,设置流的类型的信息、数据包标识符(PID)等,并且描述与视频流相关的信息的描述符也与视频流(视频PESl和视频PES2)相对应地描述。作为一个描述符,插入上述HEVC描述符(HEVC_descriptor)和可伸缩性扩展描述符(scalability_extens1n_descriptor)。
[0190]图25示出一种情况,其中,在图3的分层编码的实例中,通过层O到3的图片,生成基础子流(B子流),并且通过层4的图片,生成增强子流(E子流)。在这种情况下,包含在基础子流内的相应图片构成60P,并且在整个PES内除了包含在基础子流内的图片以外,包含在增强子流(E子流)内的相应图片构成120P。
[0191]基础子流的图片由NAL单元构成,例如,“AUD”、“VPS”、“SPS”、“PPS”、“PSEI”、“SLICE”、“SSEI”以及“EOS,,。“VPS”和“SPS”例如插入到GOP的领先图片内。作为SPS的元素的值“general_level_idc”设置为“等级5.1”。可以省略“E0S”。
[0192]另一方面,增强子流的图片由NAL单元构成,例如,“AUD”、‘?SPS”、“PPS”、“PSEI”、“SLICE”、“SSEI”以及“EOS,,。“ESPS”例如插入到GOP的领先图片内。作为ESPS的元素“general_level_idc” 的值设置为“等级 5.2”。可以省略“PSEI”、“SSEI” 以及“EOS,,。
[0193]在“视频ESl循环”中,设置流的类型的信息、数据包标识符(PID)等,并且也设置描述与视频流相关的信息的描述符以便与视频流(视频PES1)对应。这个流的类型设置为“O X 24”,表示基础流。此外,作为一个描述符,插入上述HEVC描述符。
[0194]I位字段“level_constrained_flag”设置为I。这表示“在子流内具有SPS或ESPS,并且作为其元素的‘general_level_idc’具有等级的值,所述等级包括等于或低于包含在子流内的temporaljd的图片。此外,“ leVel_idc”的值设置为“等级5.1”,这表示基础子流(B子流)的等级的值。此外,“temporal_id_min”设置为0,并且“temporal_id_max”设置为3,这表示基础子流(B子流)包括层O到3的图片。
[0195]在“视频ES2循环”中,设置流的类型的信息、数据包标识符(PID)等,并且描述与视频流相关的信息的描述符也对应于视频流(视频PES2)而设置。这个流的类型设置为“O X 25”,表示增强流。此外,作为一个描述符,插入上述HEVC描述符。
[0196]I位字段“level_constrained_flag”设置为I。这表示“在子流内具有SPS或ESPS,并且作为其元素的‘general_level_idc’具有等级的值,所述等级包括等于或低于包含在子流内的temporaljd的图片。此外,值“ leveljdc”设置为“等级5.2”,这表示基础子流(B子流)和增强子流(E子流)的等级的值。此外,“temp0ral_id_min”设置为4,并且“temp0ral_id_maX”设置为4,这表示增强子流(E子流)包括层4的图片。
[0197]在执行使用多个视频流的这种分布时,接收侧根据SPS和ESPS的元素“level_constrained_f lag”和“general_level_idc”,确定相应的子流是否落入其自身解码器处理能力的范围内,并且对包含在该范围内的子流执行解码。
[0198]图26示出在以下情况下的传输流TS的另一个配置实例,其中,在图3的分层编码的实例中,通过层O到3的图片,生成基础子流(B子流),并且通过层4的图片,生成增强子流(E子流)。在这种情况下,包含在基础子流内的相应图片构成60P,并且在整个PES内除了包含在基础子流内的图片以外,包含在增强子流(E子流)内的相应图片构成120P。
[0199]基础子流的图片由NAL单元构成,例如,“AUD”、“VPS”、“SPS”、“PPS”、“PSEI”、“SLICE”、“SSEI”以及“EOS,,。“VPS”和“SPS”例如插入GOP的领先图片内。作为SPS的元素的“generallevelidc”的值设置为“等级5.2”。在这种情况下,作为SPS的元素的“sub_layer_level_present_flag” 设置为“ I ”,并且在“sublayer_level_idc [3] ” 中,指不基础子流的等级的“等级5.1”的值。可以省略“E0S”。
[0200]增强子流的图片由NAL单元构成,例如,“AUD”、“PPS”以及“SLICE”。然而,没有在图25中显示的“ESPS”的NAL单元。
[0201]在“视频ESl循环”中,设置流的类型的信息、数据包标识符(PID)等,并且描述与视频流相关的信息的描述符也对应于视频流(视频PES1)而设置。这个流的类型设置为“O X 24”,表示基础流。此外,作为一个描述符,插入上述HEVC描述符。
[0202]没有在图25 中显示的“level_constrained_flag”。“level_idc”的值设置为“等级5.1”,这表示基础子流(B子流)的等级的值。此外,“temp0ral_id_min”设置为0,并且“temporal_id_max”设置为3,这表示基础子流(B子流)包括层O到3的图片。
[0203]在“视频ES2循环中”中,设置流的类型的信息、数据包标识符(PID)等,并且描述与视频流相关的信息的描述符也对应于视频流(视频PES2)而设置。这个流的类型设置为“O X 25”,表示增强流。此外,作为一个描述符,上述HEVC描述符被插入。
[0204]没有在图25 中显示的“level_constrained_flag”。“level_idc”的值设置为“等级5.2”,这表示基础子流(B子流)和增强子流(E子流)的等级的值。此外,“temporalid_min”设置为4,并且“temp0ral_id_maX”设置为4,这表示增强子流(E子流)包括层4的图片。
[0205]在执行使用多个视频流的这种分布时,接收侧根据SPS的元素“general_level_idc”和“sublayer_level_idc”,确定相应的子流是否落入其自身解码器处理能力的范围内,并且对包含在该范围内的子流执行解码。
[0206]返回图2,发送单元105在适合于广播的调制方案(例如,QPSK-0FDM)中调制传输流TS,并且从发送天线中发送RF调制信号。
[0207]简单描述在图2中显示的发送装置100的操作。编码器102接收未压缩的动态图像数据的输入。编码器102对这个动态图像数据执行分层编码。换言之,编码器102将构成动态图像数据的相应图片的图像数据分类成多个层,并且编码该数据,从而生成具有每层的图片的编码图像数据的视频流。此时,进行编码,以便要参考的图片附属于其自身的层和/或比其自身的层更低的层。
[0208]编码器102生成具有每层的图片的编码图像数据的视频流。例如,编码器102将所述多个层分成预定数量的层组,所述数量等于或大于2,并且生成预定数量的视频流(其包括对应于每个层组的每个子流),或者生成单个视频流(其包括对应于每个层组的所有子流)。
[0209]编码器102将用于识别附属层组的识别信息加入每个层组的图片的编码图像数据中。在这种情况下,例如,作为SPS和ESPS的元素的“general_level_idc”被用作识别信息。SPS包含在用于每个序列(GOP)的最低层组的子流(即,基础子流)内。另一方面,ESPS包含在用于每个序列(GOP)的比最低层组更高的层组的子流(即,增强子流)内。更高层组具有包含在SPS和ESPS内的“general_level_idc”的更高值。例如,包含在每个层组的子流的SPS和ESPS内的“general_level_idc”的值设置为等级的值,所述等级包括包含在等于或低于相应层组的层组内的所有层的图片。
[0210]由编码器102生成的,包括每层的图片的编码数据的视频流被供应给压缩数据缓冲器(cpb) 103,并且暂时储存在其内。在多路复用器104中,读取在压缩数据缓冲器103内累积的视频流,将视频流进行PES包格式化,进一步将视频流进行传输包格式化并且多路复用视频流,从而获得传输流TS,作为多路复用流。
[0211]这个传输流TS包括具有每层的图片的编码图像数据的单个视频流或者预定数量的视频流,所述数量等于或大于2。在多路复用器104中,将层信息和流配置信息插入传输流TS内。换言之,在多路复用器104中,将HEVC描述符(HEVC_deSCriptor)和可伸缩性扩展描述符(scalability_extens1n_descriptor)插入对应于每个视频流的视频基本循环内。
[0212]多路复用器104设置更高优先级的TS数据包,其包含在更低层侧上的层组的图片的编码图像数据。例如,在多个层分成两个层组(包括低层组和高层组)时,多路复用器104使用TS数据包报头的“transport_pr1rity”的I位字段来设置优先级。
[0213]将由多路复用器104生成的传输流TS发送给发送单元105。在发送单元105中,在适合于广播的调制方案(例如,QPSK-0FDM)中调制传输流TS,并且从发送天线中发送RF调制信号。
[0214]〈接收装置的配置〉
[0215]图27示出接收装置200的一个配置实例。这个接收装置200具有中央处理单元(CPU) 201、接收单元202、多路分用器203以及压缩数据缓冲器(编码图片缓冲器或cpb) 204。进一步,接收装置200具有解码器205、解压缩数据缓冲器(解码图片缓冲器或dpb) 206以及后处理单元207。CPU 201构成控制单元,其控制接收装置200的每个单元的操作。
[0216]接收单元202解调由接收天线接收的RF调制信号,以获取传输流TS。多路分用器203根据解码能力(解码器时间层能力),从传输流TS中选择性取出层组的图片的编码图像数据,并且将该数据发送给压缩数据缓冲器(编码图片缓冲器或cpb) 204。
[0217]图28示出多路分用器203的一个配置实例。这个多路分用器203具有PCR提取单元231、时间戳提取单元232、分段提取单元233、TS优先级提取单元234、PES有效载荷提取单元235以及图片选择单元236。
[0218]PCR提取单元231从包括PCR的TS数据包中提取PCR (节目时钟参考),并且将PCR发送给CPU 201。时间戳提取单元232提取插入每个图片的PES报头内的时间戳(DTS或PTS),并且将时间戳发送给CPU 201。分段提取单元233从传输流TS中提取分段数据,并且将该数据发送给CPU201。这个分段数据包括上述HEVC描述符(HEVC_desCriptor)、可伸缩性扩展描述符(scalability_extens1n_descriptor)等。
[0219]TS优先级提取单元234提取为每个TS数据包设置的优先级信息。在多个层分成预定数量的层组时,这个优先级是每个层组的优先级,所述数量等于或大于2,并且如上所述在更低层侧上的层组设置为具有更高优先级。例如,在层组分成包括低层组和高层组的两个层组时,提取TS数据包报头的I位字段“transport_pr1rity”的值。对于低层组,这个值设置为“ I ”,并且对于高层组,这个值设置为“O”。
[0220]PES有效载荷提取单元235从传输流TS中提取PES有效载荷,即,每层的图片的编码图像数据。图片选择单元236根据解码能力(解码器时间层能力),从由PES有效载荷提取单元235取出的每层的图片的编码图像数据中选择性取出层组的图片的编码图像数据,并且将该数据发送给压缩数据缓冲器(编码图片缓冲器或cpb)204。在这种情况下,图片选择单元236参考由分段提取单元233获得的层信息以及流配置信息以及由TS优先级提取单兀234提取的优先级彳目息。
[0221]考虑以下情况:例如,包含在传输流TS(编码流)内的视频流的帧速率是120fps。例如,假设多个层分成包括在低层侧上的层组和在高层侧上的层组的两个层组,并且相应层组的图片的帧速率是60fps。在图3中所示的分层编码的上述实例中,例如,层O到3设置为附属于在低层侧上的层组并且层4设置为附属于在高层侧上的层组。
[0222]包含在TS数据包的报头内的I位字段“transport_pr1rity”在TS数据包包含基础层(即,在低层侧上的层组)的图片的编码图像数据的情况下设置为“1”,并且在TS数据包包含非基础层(即,在高层侧上的层组)的图片的编码图像数据的情况下设置为“O”。
[0223]在这种情况下,传输流TS可以包括单个视频流(编码流),其具有每层的图片的编码图像数据(见图10)。此外,在这种情况下,传输流TS可以包括两个视频流(编码流),即,具有在低层侧上的层组的图片的编码图像数据的基础流(B流)和具有在高层侧上的层组的图片的编码图像数据的增强流(E流)(见图11)。
[0224]在解码能力等于120P(120fps)时,例如,图片选择单元236取出所有层的图片的编码图像数据,并且将该数据发送给压缩数据缓冲器(cpb) 204。另一方面,在解码能力不等于120P,而是等于60P(60fps)时,例如,图片选择单元236仅仅取出在低层侧上的层组的图片的编码图像数据,并且将该数据发送给压缩数据缓冲器(cpb) 204。
[0225]图29示出在传输流TS内包括单个视频流(编码流)的情况。在此处,“高”表示在高层侧上的层组的图片,并且“低”表示在低层侧上的层组的图片。此外,“P”表示“transport_pr1rity,,。
[0226]在解码能力等于120P(120fps)时,图片选择单元236取出所有层的图片的编码图像数据,并且将该数据发送给压缩数据缓冲器(印13)204,以在区域1(印13_1)内累积。另一方面,在解码能力不等于120P,而是等于60P(60fps)时,根据“transport_pr1rity”,进行过滤,并且仅仅取出在低层侧上的层组的图片(P= I),将该数据发送给压缩数据缓冲器(cpb) 204,并且在区域I (cpb_l)内累积。
[0227]图30示出在传输流TS内包括两个视频流(编码流)的情况,包括基础流和扩展流。在此处,“高”表示在高层侧上的层组的图片,并且“低”表示在低层侧上的层组的图片。此夕卜,“P”表示“transport_pr1rity”。进一步,基础流的数据包标识符(PID)设置为PID1,并且扩展流的数据包标识符(PID)设置为PID2。
[0228]在解码能力等于120P(120fps)时,图片选择单元236取出所有层的图片的编码图像数据,并且将该数据发送给压缩数据缓冲器(cpb) 204。然后,在低层侧上的层组的图片的编码图像数据在区域l(cpb_l)内累积,并且在低层侧上的层组的图片的编码图像数据在区域2(cpb_2)内累积。
[0229]另一方面,在解码能力不等于120P,而是等于60P时,通过根据数据包标识符(PID)进行的过滤,仅仅取出在低层侧上的层组的图片(PIDl),发送给压缩数据缓冲器(cpb)204,并且在区域l(cpb_l)内累积。应注意的是,这种情况下,也可以根据“transport_pr1rity,,,进行过滤。
[0230]图31示出多路分用器203的处理流程的一个实例。这个处理流程示出了以下情况下:传输流TS包括单个视频流(编码流)。
[0231]多路分用器203在步骤ST31中开始处理,然后,移动到步骤ST32的处理。在步骤ST32中,从CPU 201中设置解码能力(解码器时间层能力)。接下来,多路分用器203在步骤ST33中确定是否具有解码所有层的能力。
[0232]在具有解码所有层的能力时,在步骤ST34中,多路分用器203多路分用穿过相应PID滤波器的所有TS数据包,以执行分段解析。然后,多路分用器203移动到步骤ST35的处理。
[0233]在步骤ST33中没有解码所有层的能力时,在步骤ST36中,多路分用器203多路分用“transpo^pr1rity”为“I”的TS数据包,以执行分段解析。然后,多路分用器203移动到步骤ST35的处理。
[0234]在步骤ST35中,多路分用器203在目标PID的部分之中读取HEVC描述符(HEVC_descriptor)和可伸缩性扩展描述符(scalability_extens1n_descriptor),并且获得关于扩展流的存在、可伸缩性的类型、流的数量和ID、temporal_id的最大和最小值以及最小目标解码器等级的信息。
[0235]接下来,多路分用器203在步骤ST37中将PID的编码流传输给压缩数据缓冲器(cpb) 204并且将DTS和PTS通知CPU 201。在步骤ST37的处理之后,多路分用器203在步骤ST38中完成处理。
[0236]图32示出多路分用器203的另一个处理流程的一个实例。这个处理流程示出了以下情况下:传输流TS包括两个视频流(编码流),包括基础流和扩展流。
[0237]多路分用器203在步骤ST41中开始处理,然后,移动到步骤ST42的处理。在步骤ST42中,从CPU 201中设置解码能力(解码器时间层能力)。接下来,多路分用器203在步骤ST43中确定是否具有解码所有层的能力。
[0238]在具有解码所有层的能力时,在步骤ST44中,多路分用器203多路分用穿过相应PID滤波器的所有TS数据包,以执行分段解析。然后,多路分用器203移动到步骤ST45的处理。
[0239]在步骤ST43中没有解码所有层的能力时,在步骤ST46中,多路分用器203多路分用PID = PIDl的TS数据包,以执行分段解析。然后,多路分用器203移动到步骤ST45的处理。
[
当前第4页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1