简化的最可能模式列表生成方案的制作方法

文档序号:27611421发布日期:2021-11-27 01:14阅读:98来源:国知局
简化的最可能模式列表生成方案的制作方法
简化的最可能模式列表生成方案
1.本技术要求于2018年12月4日提交美国专利局、申请号为62/775,373、申请名称为“简化的最可能模式列表生成方案”的美国临时申请的优先权,于2018年12月28日提交美国专利局、申请号为62/786,031、申请名称为“提高的最可能模式列表生成方案”的美国临时申请的优先权,以及于2019年11月25日提交美国专利局、申请号为16/694,266、申请名称为“简化的最可能模式列表生成方案”的美国正式申请的优先权,其全部内容通过引用结合在本技术中。
技术领域
2.本技术涉及先进的视频编解码技术,尤其涉及一种针对零参考行和非零参考行的简化的最可能模式列表生成方案。


背景技术:

3.itu

t vceg(q6/16)和iso/iec mpeg(jtc 1/sc 29/wg 11)在2013年(版本1)、2014年(版本2)、2015年(版本3)和2016年(版本4)中发布了h.265/hevc(高效视频编码)标准。2015年,这两个标准化组织联合组成了联合视频探索组(jvet),致力于研究开发超过hevc标准的未来视频编码技术标准的潜在需求。2017年10月,他们发出了联合呼吁,征集针对具有超出hevc(cfp)能力的视频压缩的提案。截至2018年2月15日,分别提交了针对标准动态范围(sdr)的共22个cfp响应、针对高动态范围(hdr)的12个cfp响应和针对360种视频类别的12个cfp响应。2018年4月,在122运动图象专家组(mpeg)/第十次jvet会议上,对所有收到的cfp响应都进行了评估。作为此次会议的结果,jvet正式启动了超过hevc的下一代视频编码的标准化。新的标准被命名为通用视频编码(vvc),并且jvet被重新命名为联合视频专家组。
4.在hevc中使用的帧内预测模式如图1所示。在hevc中,总共有35个帧内预测模式,其中模式10是水平模式,模式26是垂直模式,并且模式2、模式18和模式34是对角模式。帧内预测模式由三个最可能模式(mpm)和32个剩余模式来标识。
5.为了对帧内模式进行编解码,基于相邻块的帧内模式,建立大小为3的最可能模式(mpm)列表。该mpm列表将被称为mpm列表或主mpm列表。如果帧内模式不是来自mpm列表,则发送标志以指示帧内模式是否属于所选模式。
6.用于hevc的mpm列表生成过程的一个示例如下示出:
7.·
if(leftintradir==aboveintradir&&leftintradir>dc_idx)
8.οmpm[0]=leftintradir;
[0009]
οmpm[1]=((leftintradir+offset)%mod)+2;
[0010]
οmpm[2]=((leftintradir

1)%mod)+2;
[0011]
·
else if(leftintradir==aboveintradir)
[0012]
οmpm[0]=planar_idx;
[0013]
οmpm[1]=dc_idx;
[0014]
οmpm[2]=ver_idx;
[0015]
·
else if(leftintradir!=aboveintradir)
[0016]
οmpm[0]=leftintradir;
[0017]
οmpm[1]=aboveintradir;
[0018]
οif(leftintradir>0&&aboveintradir>0)
[0019]

mpm[2]=planar_idx;
[0020]
οelse
[0021]

mpm[2]=(leftintradir+aboveintradir)<2?ver_idx:
[0022]
dc_idx;
[0023]
在此,leftintradir用于指示左块中的模式,而aboveintradir被用于指示上块中的模式。如果左块当前不可用,则leftintradir或aboveintradir将为dc_idx。此外,变量“offset”和“mod”是常数值,其分别被设置为29和32。


技术实现要素:

[0024]
本技术实施例提供了一种帧内预测模式发送方法,所述帧内预测模式用于对已编码视频比特流中的当前块进行编码,所述方法使用至少一个处理器,包括:
[0025]
生成与所述当前块的零参考行相对应的第一最可能模式mpm列表,所述第一mpm列表包括多个角度帧内预测模式;
[0026]
生成与所述当前块的至少一个非零参考行相对应的第二mpm列表,所述第二mpm列表包括所述多个角度帧内预测模式;
[0027]
发送参考行索引,所述参考行索引指示在所述零参考行和所述至少一个非零参考行中用于对所述当前块进行编码的参考行;及,
[0028]
发送帧内模式索引,所述帧内模式索引指示所述第一mpm列表内的帧内预测模式或者所述第二mpm列表内的帧内预测模式。
[0029]
本技术实施例还提供了一种帧内预测模式发送设备,所述帧内预测模式用于对已编码视频比特流中的当前块进行编码,包括:
[0030]
至少一个存储器,用于存储程序代码;
[0031]
至少一个处理器,用于读取所述程序代码,根据所述程序代码的指令进行操作,所述程序代码包括:
[0032]
第一生成代码,用于使得所述至少一个处理器,生成与所述当前块的零参考行相对应的第一最可能模式mpm列表,所述第一mpm列表包括多个角度帧内预测模式;
[0033]
第二生成代码,用于使得所述至少一个处理器,生成与所述当前块的至少一个非零参考行相对应的第二mpm列表,所述第二mpm列表包括所述多个角度帧内预测模式;
[0034]
第一通知代码,用于使得所述至少一个处理器,发送参考行索引,所述参考行索引指示在所述零参考行和所述至少一个非零参考行中用于对所述当前块进行编码的参考行;及,
[0035]
第二通知代码,用于使得所述至少一个处理器,发送帧内模式索引,所述帧内模式索引指示所述第一mpm列表内的帧内预测模式或者所述第二mpm列表内的帧内预测模式。
[0036]
本技术实施例还提供一种非暂时性计算机可读介质,其上存储有指令,所述指令
包括至少一个指令,当所述至少一个指令由帧内预测模式发送设备执行时,所述帧内预测模式用于对已编码视频比特流中的当前块进行编码,使得所述至少一个处理器:
[0037]
生成与所述当前块的零参考行相对应的第一最可能模式mpm列表,所述第一mpm列表包括多个角度帧内预测模式;
[0038]
生成与所述当前块的至少一个非零参考行相对应的第二mpm列表,所述第二mpm列表包括所述多个角度帧内预测模式;
[0039]
发送参考行索引,所述参考行索引指示所述至少一个非零参考行和所述零参考行其中之一,用于对所述当前块进行编码;及,
[0040]
发送帧内模式索引,所述帧内模式索引指示所述第一mpm列表内的帧内预测模式或者所述第二mpm列表内的帧内预测模式。
附图说明
[0041]
根据以下详细描述和附图,所公开的主题的其他特征、性质和各种优点将进一步明确,其中:
[0042]
图1示出了hevc中帧内预测模式的示例;
[0043]
图2示出了与编码块单元相邻的参考行的示例;
[0044]
图3示出了vvc中帧内预测模式的示例;
[0045]
图4示出了相邻cu的位置的示例;
[0046]
图5是根据一实施例的通信系统的简化框图的示意图;
[0047]
图6示出了根据一实施例的在流传输环境中视频编码器和视频解码器的位置的框图;
[0048]
图7示出了根据一实施例的视频解码器的框图;
[0049]
图8示出了根据一实施例的视频编码器的框图;
[0050]
图9示出了根据一实施例的在已编码视频码流中发送用于对当前块进行编码的帧内预测模式的示例性过程的流程图;以及
[0051]
图10示出了根据实施例的计算机系统的示意图。
具体实施方式
[0052]
多线帧内预测被提出以使用更多的参考行进行帧内预测,并且编码器决定并发信号通知哪个参考行被用于生成帧内预测器。在帧内预测模式之前发送参考行索引,并且在发送非零参考行索引的情况下,仅允许最可能的模式。在图2中,描述了4条参考行的示例,其中每条参考行包括六个片段,即片段a到f,以及左上的参考样本。此外,分别使用来自片段b和e的最近样本,对片段a和f进行填充。
[0053]
在vvc中,如图3所示,总共有95个帧内预测模式,其中模式18是水平模式,模式50是垂直模式,并且模式2、模式34和模式66是对角模式。模式

1至

14以及模式67至80被称为广角帧内预测(waip)模式。
[0054]
在vtm3.0中,对于相邻参考行(也称为零参考行)和非相邻参考行(也称为非零参考行),mpm列表的大小被设置为6。被用于导出6个mpm候选项的相邻模式的位置,对于相邻和非相邻参考行也是相同的,如图4所示。在图4中,块a和块b表示当前编码单元的上相邻编
码单元和左相邻编码单元,并且变量candintrapredmodea和candintrapredmodeb分别指示块a和b相关联的帧内预测模式。candintrapredmodea和candintrapredmodeb最初被设置为intra_planar。如果块a(或b)被标记为可用,则candintrapredmodea(或candintrapredmodeb)被设置为块a(或b)的实际帧内预测模式。
[0055]
对于相邻参考行和非相邻参考行,mpm候选项导出过程是不同的。对于零参考行,如果两个相邻模式都是平面模式或dc模式,则使用默认模式来构建mpm列表,其中2个是平面模式和dc模式,并且其余4个模式是角度帧内预测模式,其也可以被称为角度默认模式。对于非零参考行,如果两个相邻模式都是平面模式或dc模式,则使用6个角度默认模式来构建mpm列表。
[0056]
mpm列表导出过程的示例如下所示,其中candmodelist[x],x=0...5,表示6个mpm候选项,intralumareflineidx[xcb][ycb]表示待预测块的参考行索引,并且intralumareflineidx[xcb][ycb]可以是0、1、或3。
[0057]

如果candintrapredmodeb等于candintrapredmodea,并且candintrapredmodea大于intra_dc,则candmodelist[x],x=0...5,如下导出:
[0058]

如果intralumareflineidx[xcb][ycb]等于0,则:
[0059]
candmodelist[0]=candintrapredmodea
[0060]
candmodelist[1]=intra_planar
[0061]
candmodelist[2]=intra_dc
[0062]
candmodelist[3]=2+((candintrapredmodea+61)%64)
[0063]
candmodelist[4]=2+((candintrapredmodea

1)%64)
[0064]
candmodelist[5]=2+((candintrapredmodea+60)%64)
[0065]

否则(intralumareflineidx[xcb][ycb]不等于0),则:
[0066]
candmodelist[0]=candintrapredmodea
[0067]
candmodelist[1]=2+((candintrapredmodea+61)%64)
[0068]
candmodelist[2]=2+((candintrapredmodea

1)%64)
[0069]
candmodelist[3]=2+((candintrapredmodea+60)%64)
[0070]
candmodelist[4]=2+(candintrapredmodea%64)
[0071]
candmodelist[5]=2+((candintrapredmodea59)%64)
[0072]

否则,如果candintrapredmodeb不等于candintrapredmodea,并且candintrapredmodea或candintrapredmodeb大于intra_dc,则:
[0073]

变量minab和maxab如下导出:
[0074]
minab=candmodelist[(candmodelist[0]>candmodelist[1])?1:0]
[0075]
maxab=candmodelist[(candmodelist[0]>candmodelist[1])?0:1]
[0076]

如果candintrapredmodea和candintrapredmodeb均大于intra_dc,则candmodelist[x],x=0...5,如下导出:
[0077]
candmodelist[0]=candintrapredmodea
[0078]
candmodelist[1]=candintrapredmodeb
[0079]

如果intralumareflineidx[xcb][ycb]等于0,则:
[0080]
candmodelist[2]=intra_planar
[0081]
candmodelist[3]=intra_dc
[0082]

如果maxab

minab在[2,62]的范围内,则:
[0083]
candmodelist[4]=2+((maxab+61)%64)
[0084]
candmodelist[5]=2+((maxab

1)%64)
[0085]

否则:
[0086]
candmodelist[4]=2+((maxab+60)%64)
[0087]
candmodelist[5]=2+((maxab)%64)
[0088]

否则(intralumareflineidx[xcb][ycb]不等于0),则:
[0089]

如果maxab

minab等于1,则:
[0090]
candmodelist[2]=2+((minab+61)%64)
[0091]
candmodelist[3]=2+((maxab

1)%64)
[0092]
candmodelist[4]=2+((minab+60)%64)
[0093]
candmodelist[5]=2+(maxab%64)
[0094]

否则,如果maxab

minab等于2,则:
[0095]
candmodelist[2]=2+((minab

1)%64)
[0096]
candmodelist[3]=2+((minab+61)%64)
[0097]
candmodelist[4]=2+((maxab

1)%64)
[0098]
candmodelist[5]=2+((minab+60)%64)
[0099]

否则,如果maxab

minab大于61,则:
[0100]
candmodelist[2]=2+((minab

1)%64)
[0101]
candmodelist[3]=2+((maxab+61)%64)
[0102]
candmodelist[4]=2+(minab%64)
[0103]
candmodelist[5]=2+((maxab+60)%64)
[0104]

否则:
[0105]
candmodelist[2]=2+((minab+61)%64)
[0106]
candmodelist[3]=2+((minab

1)%64)
[0107]
candmodelist[4]=2+((maxab+61)%64)
[0108]
candmodelist[5]=2+((maxab

1)%64)
[0109]

否则(candintrapredmodea或candintrapredmodeb大于intra_dc),candmodelist[x],x=0...5,如下导出:
[0110]

如果intralumareflineidx[xcb][ycb]等于0,则:
[0111]
candmodelist[0]=candintrapredmodea
[0112]
candmodelist[1]=candintrapredmodeb
[0113]
candmodelist[2]=1

minab
[0114]
candmodelist[3]=2+((maxab+61)%64)
[0115]
candmodelist[4]=2+((maxab

1)%64)
[0116]
candmodelist[5]=2+((maxab+60)%64)
[0117]

否则(intralumareflineidx[xcb][ycb]不等于0),则:
[0118]
candmodelist[0]=maxab
[0119]
candmodelist[1]=2+((maxab+61)%64)
[0120]
candmodelist[2]=2+((maxab

1)%64)
[0121]
candmodelist[3]=2+((maxab+60)%64)
[0122]
candmodelist[4]=2+(maxab%64)
[0123]
candmodelist[5]=2+((maxab+59)%64)
[0124]

否则:
[0125]

如果intralumareflineidx[xcb][ycb]等于0,则:
[0126]
candmodelist[0]=candintrapredmodea
[0127]
candmodelist[1]=(candmodelist[0]==intra_planar)?intra_dc:
[0128]
intra_planar
[0129]
candmodelist[2]=intra_angular50
[0130]
candmodelist[3]=intra_angular18
[0131]
candmodelist[4]=intra_angular46
[0132]
candmodelist[5]=intra_angular54
[0133]

否则(intralumareflineidx[xcb][ycb]不等于0),则:
[0134]
candmodelist[0]=intra_angular50
[0135]
candmodelist[1]=intra_angular18
[0136]
candmodelist[2]=intra_angular2
[0137]
candmodelist[3]=intra_angular34
[0138]
candmodelist[4]=intra_angular66
[0139]
candmodelist[5]=intra_angular26
[0140]
在vtm4.0中,mpm列表的大小被扩展到6。当intra_luma_mpm_flag为真时,其指示当前模式属于mpm列表中的候选项。考虑下表1:
[0141]
表1:
[0142][0143]
图5是根据本技术公开的实施例的通信系统(300)的简化框图。通信系统(300)包括至少两个终端装置(510

520),经由网络(550)互相连接。对于单向数据传输,第一终端(510)在本地位置上对视频数据进行编码,然后通过网络(550)传输到第二终端(520)。第二终端(520)从网络(550)接收另一终端已编码的视频数据,对已编码视频数据进行解码,并显示恢复的视频数据。单向数据传输在媒体服务等应用中是较常见的。
[0144]
图5示出能够支持已编码视频的双向传输的第二对终端(530,540),所述双向传输例如发生在视频会议期间。对于双向数据传输,每个终端(530,540)在本地位置上对采集的视频数据进行编码,然后通过网络(550)传输到另一终端。每个终端(530,540)还可接收由
另一终端发送的已编码视频数据,对已编码视频数据进行解码,并在本地显示设备上显示恢复的视频数据。
[0145]
在图5中,终端(510

540)可为服务器、个人计算机和智能电话,但本技术公开的原理可不限于此。本技术公开的实施例适用于膝上型计算机、平板电脑、媒体播放器和/或专用视频会议设备。网络(550)表示在终端(510

540)之间传送已编码视频数据的任何数目的网络,包括例如有线和/或无线通信网络。通信网络(550)可在电路交换和/或分组交换信道中交换数据。代表性网络可包括电信网络、局域网、广域网和/或互联网。出于本技术的目的,除非在下文中有所解释,否则网络(550)的架构和拓扑对于本技术公开的操作来说可能是无关紧要的。
[0146]
作为本技术所公开的主题的一个示例,图6示出视频编码器和视频解码器在流式环境中的放置方式。本技术所公开主题可同等地适用于其它支持视频的应用,包括例如视频会议、数字tv、在包括cd、dvd、存储棒等的数字介质上存储压缩视频等等。
[0147]
流式传输系统可包括采集子系统(613),所述采集子系统可包括数码相机等视频源(601),所述视频源创建未压缩的视频样本流(602)。相较于已编码的视频码流,样本流(602)被描绘为粗线以强调高数据量的视频样本流,可由耦接到摄像机(601)的编码器(603)来处理。视频编码器(603)可包括硬件、软件或软硬件组合以实现或实施如下文更详细地描述的所公开主题的各方面。相较于样本流,已编码的视频码流(604)被描绘为细线以强调较低的数据量,其可存储在流式传输服务器(605)上以供将来使用。至少一个流式传输客户端子系统(606,608)可访问流式传输服务器(605)以检索已编码的视频数据(604)的副本(607,609)。客户端(606)包括视频解码器(610),视频解码器(610)对已编码的视频数据(607)的传入副本进行解码,且产生可在显示器(612)或另一呈现装置(未描绘)上呈现的输出视频样本流(611)。在一些流式传输系统中,可根据某些视频编码/压缩标准,对视频码流(604,607,609)进行编码。该些标准的实施例包括itu

t h.265。正在开发的视频编码标准非正式地称为下一代视频编码(versatile video coding,vvc),本技术可用于vvc标准的上下文中。
[0148]
图7是根据本技术公开的实施例的视频解码器(610)的框图。
[0149]
接收器(710)可接收将由视频解码器(610)解码的至少一个已编码视频序列;在同一实施例或另一实施例中,一次接收一个已编码视频序列,其中每个已编码视频序列的解码独立于其它已编码视频序列。可从信道(712)接收已编码视频序列,所述信道可以是通向存储已编码的视频数据的存储装置的硬件/软件链路。接收器(710)可接收已编码的视频数据以及其它数据,例如,可转发到它们各自的使用实体(未标示)的已编码音频数据和/或辅助数据流。接收器(710)可将已编码视频序列与其它数据分开。为了防止网络抖动,缓冲存储器(715)可耦接在接收器(710)与熵解码器/解析器(720)(此后称为“解析器(720)”)之间。当接收器(710)从具有足够带宽和可控性的存储/转发装置或从等时同步网络接收数据时,也可能不需要配置缓冲存储器(715),或可以将所述缓冲存储器做得较小。为了在互联网等业务分组网络上使用,也可能需要缓冲存储器(715),所述缓冲存储器可相对较大且可具有自适应性大小。
[0150]
视频解码器(610)可包括解析器(720)以根据已编码视频序列重建符号(721)。这些符号的类别包括用于管理视频解码器(610)的操作的信息,以及用以控制显示装置(612)
等显示装置的潜在信息,所述显示装置不是解码器的组成部分,但可耦接到解码器,如图7中所示。用于显示装置的控制信息可以是辅助增强信息(supplemental enhancement information,sei消息)或视频可用性信息(video usability information,vui)的参数集片段(未标示)。解析器(720)可对接收到的已编码视频序列进行解析/熵解码。已编码视频序列的编码可根据视频编码技术或标准进行,且可遵循各种原理,包括可变长度编码、霍夫曼编码(huffman coding)、具有或不具有上下文灵敏度的算术编码等等。解析器(720)可基于对应于群组的至少一个参数,从已编码视频序列提取用于视频解码器中的像素的子群中的至少一个子群的子群参数集。子群可包括图片群组(group of pictures,gop)、图片、图块、分片、宏块、编码单元(coding unit,cu)、块、变换单元(transform unit,tu)、预测单元(prediction unit,pu)等等。熵解码器/解析器还可从已编码视频序列提取信息,例如变换系数、量化器参数值、运动矢量等等。
[0151]
解析器(720)可对从缓冲存储器(715)接收的视频序列执行熵解码/解析操作,从而创建符号(721)。解析器(720)可接收已编码数据,选择对特定的符号(721)进行解码。进一步,解析器(720)可确定是否可以将特定的符号(721)提供给运动补偿预测单元(753)、缩放器/逆变换单元(751)、帧内图片预测单元(752)或者,环路滤波器(756)。
[0152]
取决于已编码视频图片或一部分已编码视频图片(例如:帧间图片和帧内图片、帧间块和帧内块)的类型以及其它因素,符号(721)的重建可涉及至少两个不同单元。涉及哪些单元以及涉及方式可由解析器(720)从已编码视频序列解析的子群控制信息控制。为了简洁起见,未描述解析器(720)与下文的至少两个单元之间的此类子群控制信息流。
[0153]
除已经提及的功能块以外,视频解码器(610)可在概念上细分成如下文所描述的数个功能单元。在商业约束下运行的实际实施例中,这些单元中的许多单元彼此紧密交互并且可以彼此集成。然而,出于描述所公开主题的目的,概念上细分成下文的功能单元是适当的。
[0154]
第一单元是缩放器/逆变换单元(751)。缩放器/逆变换单元(751)从解析器(720)接收作为符号(721)的量化变换系数以及控制信息,包括使用哪种变换方式、块大小、量化因子、量化缩放矩阵等。缩放器/逆变换单元(751)可输出包括样本值的块,所述样本值可输入到聚合器(755)中。
[0155]
在一些情况下,缩放器/逆变换单元(751)的输出样本可属于帧内编码块;即:不使用来自先前重建的图片的预测性信息,但可使用来自当前图片的先前重建部分的预测性信息的块。此类预测性信息可由帧内图片预测单元(752)提供。在一些情况下,帧内图片预测单元(752)采用从当前(已部分重建)图片(756)提取的已重建信息,生成大小和形状与正在重建的块相同的周围块。在一些情况下,聚合器(755)基于每个样本,将帧内预测单元(752)生成的预测信息添加到由缩放器/逆变换单元(751)提供的输出样本信息中。
[0156]
在其它情况下,缩放器/逆变换单元(751)的输出样本可属于帧间编码和潜在运动补偿块。在此情况下,运动补偿预测单元(753)可访问参考图片存储器(757)以提取用于预测的样本。在根据符号(721)对提取的样本进行运动补偿之后,这些样本可由聚合器(755)添加到缩放器/逆变换单元(751)的输出(在这种情况下被称作残差样本或残差信号),从而生成输出样本信息。运动补偿预测单元(753)从参考图片存储器(757)内的地址获取预测样本可受到运动矢量控制,且所述运动矢量以所述符号(721)的形式而供运动补偿预测单元
(753)使用,所述符号(721)例如是包括x、y和参考图片分量。运动补偿还可包括在使用子样本精确运动矢量时,从参考图片存储器提取的样本值的内插、运动矢量预测机制等等。
[0157]
聚合器(755)的输出样本可在环路滤波器单元(756)中被各种环路滤波技术采用。视频压缩技术可包括环路内滤波器技术,所述环路内滤波器技术受控于包括在已编码视频序列(也称作已编码视频码流)中的参数,且所述参数作为来自解析器(720)的符号(721)可用于环路滤波器单元(756)。然而,在其他实施例中,视频压缩技术还可响应于在解码已编码图片或已编码视频序列的先前(按解码次序)部分期间获得的元信息,以及响应于先前重建且经过环路滤波的样本值。
[0158]
环路滤波器单元(756)的输出可以是样本流,所述样本流可输出到显示设备(612)以及存储在参考图片存储器(757),以用于后续的帧间图片预测。
[0159]
一旦完全重建,某些已编码图片就可用作参考图片以用于将来预测。举例来说,一旦对应于当前图片的已编码图片被完全重建,且已编码图片(通过例如解析器(720))被识别为参考图片,则当前参考图片(656)可变为参考图片存储器(757)的一部分,且可在开始重建后续已编码图片之前重新分配新的当前图片缓冲器。
[0160]
视频解码器(610)可根据例如itu

t h.265标准中的预定视频压缩技术执行解码操作。在已编码视频序列遵循视频压缩技术或标准的语法以及视频压缩技术或标准中记录的配置文件的意义上,已编码视频序列可符合所使用的视频压缩技术或标准指定的语法。具体地说,配置文件可从视频压缩技术或标准中可用的所有工具中选择某些工具作为在所述配置文件下可供使用的仅有工具。对于合规性,还要求已编码视频序列的复杂度处于视频压缩技术或标准的层级所限定的范围内。在一些情况下,层级限制最大图片大小、最大帧率、最大重建取样率(以例如每秒兆(mega)个样本为单位进行测量)、最大参考图片大小等。在一些情况下,由层级设定的限制可通过假想参考解码器(hypothetical reference decoder,hrd)规范和在已编码视频序列中用信号表示的hrd缓冲器管理的元数据来进一步限定。
[0161]
在实施例中,接收器(710)可连同已编码视频一起接收附加(冗余)数据。所述附加数据可以是已编码视频序列的一部分。所述附加数据可由视频解码器(610)用以对数据进行适当解码和/或较准确地重建原始视频数据。附加数据可呈例如时间、空间或信噪比(signal noise ratio,snr)增强层、冗余分片、冗余图片、前向纠错码等形式。
[0162]
图8是根据本技术公开的实施例的视频编码器(603)的框图。
[0163]
视频编码器(603)可从视频源(601)(并非编码器的一部分)接收视频样本,所述视频源可采集将由视频编码器(603)编码的视频图像。
[0164]
视频源(601)可提供将由视频编码器(603)编码的呈数字视频样本流形式的源视频序列,所述数字视频样本流可具有任何合适位深度(例如:8位、10位、12位
……
)、任何色彩空间(例如bt.601y crcb、rgb
……
)和任何合适取样结构(例如y crcb 4:2:0、y crcb 4:4:4)。在媒体服务系统中,视频源(601)可以是存储先前已准备的视频的存储装置。在视频会议系统中,视频源(601)可以是采集本地图像信息作为视频序列的相机。可将视频数据提供为至少两个单独的图片,当按顺序观看时,这些图片被赋予运动。图片自身可构建为空间像素阵列,其中取决于所用的取样结构、色彩空间等,每个像素可包括至少一个样本。所属领域的技术人员可以很容易理解像素与样本之间的关系。下文侧重于描述样本。
[0165]
根据实施例,视频编码器(603)可实时或在由应用所要求的任何其它时间约束下,将源视频序列的图片编码且压缩成已编码视频序列(843)。施行适当的编码速度是控制器(850)的一个功能。为了简洁起见,图中未标示耦接。由控制器设置的参数可包括速率控制相关参数(图片跳过、量化器、率失真优化技术的λ值等)、图片大小、图片群组(group of pictures,gop)布局,最大运动矢量搜索范围等。控制器(850)可用于具有其它合适的功能,这些功能涉及针对某一系统设计优化的视频编码器(603)。
[0166]
一些视频编码器在本领域技术人员所称的“编码环路”中进行操作。作为简单的描述,在实施例中,编码环路可包括编码器(830)中的编码部分(之后称为“源编码器”)(负责基于待编码的输入图片和参考图片创建符号)和嵌入于编码器(603)中的(本地)解码器(833)。解码器(833)以类似于(远程)解码器创建样本数据的方式重建符号以创建样本数据(因为在本技术所考虑的视频压缩技术中,符号与已编码视频码流之间的任何压缩是无损的)。将重建的样本流(样本数据)输入到参考图片存储器(834)。由于符号流的解码产生与解码器位置(本地或远程)无关的位精确结果,因此参考图片存储器内容在本地编码器与远程编码器之间也是按比特位精确对应的。换句话说,编码器的预测部分“看到”的参考图片样本与解码器将在解码期间使用预测时所“看到”的样本值完全相同。这种参考图片同步性基本原理(以及在例如因信道误差而无法维持同步性的情况下产生的漂移)也用于一些相关技术。
[0167]“本地”解码器(833)的操作可与例如已在上文结合图7详细描述视频解码器(610)的“远程”解码器相同。然而,另外简要参考图6,当符号可用且熵编码器(845)和解析器(720)能够无损地将符号编码/解码为已编码视频序列时,包括缓冲存储器(715)和解析器(720)在内的视频解码器(610)的熵解码部分,可能无法完全在本地解码器(833)中实施。
[0168]
此时可以观察到,除存在于解码器中的解析/熵解码之外的任何解码器技术,也必定以基本上相同的功能形式存在于对应的编码器中。出于此原因,本技术侧重于解码器操作。可简化编码器技术的描述,因为编码器技术与全面地描述的解码器技术互逆。仅在某些区域中需要更详细的描述,并且在下文提供。
[0169]
在操作期间,在一些实施例中,源编码器(830)可执行运动补偿预测编码。参考来自视频序列中被指定为“参考图片”的至少一个先前已编码图片,所述运动补偿预测编码对输入图片进行预测性编码。以此方式,编码引擎(832)对输入图片的像素块与参考图片的像素块之间的差异进行编码,所述参考图片可被选作所述输入图片的预测参考。
[0170]
本地视频解码器(833)可基于源编码器(830)创建的符号,对可指定为参考图片的图片的已编码视频数据进行解码。编码引擎(832)的操作可为有损过程。当已编码视频数据可在视频解码器(图6中未示)处被解码时,重建的视频序列通常可以是带有一些误差的源视频序列的副本。本地视频解码器(833)复制解码过程,所述解码过程可由视频解码器对参考图片执行,且可使重建的参考图片存储在参考图片高速缓存(834)中。以此方式,视频编码器(603)可在本地存储重建的参考图片的副本,所述副本与将由远端视频解码器获得的重建参考图片具有共同内容(不存在传输误差)。
[0171]
预测器(835)可针对编码引擎(832)执行预测搜索。即,对于将要编码的新图片,预测器(835)可在参考图片存储器(834)中搜索可作为所述新图片的适当预测参考的样本数据(作为候选参考像素块)或某些元数据,例如参考图片运动矢量、块形状等。预测器(835)
可基于样本块逐像素块操作,以找到合适的预测参考。在一些情况下,根据预测器(835)获得的搜索结果,可确定输入图片可具有从参考图片存储器(834)中存储的至少两个参考图片取得的预测参考。
[0172]
控制器(850)可管理源编码器(830)的编码操作,包括例如设置用于对视频数据进行编码的参数和子群参数。
[0173]
可在熵编码器(845)中对所有上述功能单元的输出进行熵编码。熵编码器根据例如霍夫曼编码、可变长度编码、算术编码等技术对各种功能单元生成的符号进行无损压缩,从而将所述符号转换成已编码视频序列。
[0174]
传输器(840)可缓冲由熵编码器(845)创建的已编码视频序列,从而为通过通信信道(860)进行传输做准备,所述通信信道可以是通向将存储已编码的视频数据的存储设备的硬件/软件链路。传输器(840)可将来自视频编码器(830)的已编码视频数据与要传输的其它数据合并,所述其它数据例如是已编码音频数据和/或辅助数据流(未示出来源)。
[0175]
控制器(850)可管理视频编码器(603)的操作。在编码期间,控制器(850)可以为每个已编码图片分配某一已编码图片类型,但这可能影响可应用于相应的图片的编码技术。例如,通常可将图片分配为以下任一种图片类型:
[0176]
帧内图片(i图片),其可以是不将序列中的任何其它图片用作预测源就可被编码和解码的图片。一些视频编解码器容许不同类型的帧内图片,包括例如独立解码器刷新(independent decoder refresh,“idr”)图片。所属领域的技术人员了解i图片的变体及其相应的应用和特征。
[0177]
预测性图片(p图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多一个运动矢量和参考索引来预测每个块的样本值。
[0178]
双向预测性图片(b图片),其可以是可使用帧内预测或帧间预测进行编码和解码的图片,所述帧内预测或帧间预测使用至多两个运动矢量和参考索引来预测每个块的样本值。类似地,至少两个预测性图片可使用多于两个参考图片和相关联元数据以用于重建单个块。
[0179]
源图片通常可在空间上细分成至少两个样本块(例如,4
×
4、8
×
8、4
×
8或16
×
16个样本的块),且逐块进行编码。这些块可参考其它(已编码)块进行预测编码,根据应用于块的相应图片的编码分配来确定所述其它块。举例来说,i图片的块可进行非预测编码,或所述块可参考同一图片的已编码的块来进行预测编码(空间预测或帧内预测)。p图片的像素块可参考一个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。b图片的块可参考一个或两个先前编码的参考图片通过空间预测或通过时域预测进行预测编码。
[0180]
视频编码器(603)可根据例如itu

t h.265建议书的预定视频编码技术或标准执行编码操作。在操作中,视频编码器(603)可执行各种压缩操作,包括利用输入视频序列中的时间和空间冗余的预测编码操作。因此,已编码视频数据可符合所用视频编码技术或标准指定的语法。
[0181]
在实施例中,传输器(840)可在传输已编码的视频时传输附加数据。源编码器(830)可将此类数据作为已编码视频序列的一部分。附加数据可包括时间/空间/snr增强层、冗余图片和分片等其它形式的冗余数据、sei消息、vui参数集片段等。
[0182]
如上所述,在vtm3.0,mpm列表候选项导出过程,对于相邻参考行和非相邻参考行
可以是不同的。结果,mpm列表候选项导出过程,在每种情况下可能是复杂的,而在编码效率方面没有明显的好处。
[0183]
此外,在vtm3.0中,当发送的参考行索引为0,并且左相邻模式和上相邻模式中的一个等于或小于dc模式而另一个大于dc模式时,左相邻模式总是被插入到mpm列表中,随后是上相邻模式,即使上相邻模式是平面或dc模式。这可能不是最佳解决方案,因为根据统计数据,平面和dc模式是最频繁使用的帧内预测模式。
[0184]
所提出的方法可以单独使用或以任何顺序组合使用。在实施例中,最近的参考行的线索引可以是0,并且最近的参考行可以被称为零参考行。其它线可以被称为非零参考行。在下面的描述中,candmodelist可以表示mpm列表,reflineidx可以表示当前块的参考行索引,candintrapredmodea和candintrapredmodeb可以表示左相邻模式和上相邻模式。如果一个相邻模式不是平面或dc模式,或者一个相邻模式正在根据给定的预测方向生成预测样本,诸如在vvc草案2中定义的帧内预测模式2至66,则该模式可以被称为角度帧内预测模式。如果一个模式是平面模式或dc模式,则该模式被称为非角度帧内预测模式。每个帧内预测模式可与模式编号相关联,模式编号可被称为帧内预测模式索引。例如,平面、dc、水平和垂直帧内预测模式可分别与模式编号0、1、18和50相关联。
[0185]
在一个实施例中,变量minab和maxab可以如下导出:
[0186]
candmodelist[0]=candintrapredmodea
[0187]
candmodelist[1]=candintrapredmodeb
[0188]
minab=candmodelist[(candmodelist[0]>candmodelist[1])?1:0]
[0189]
maxab=candmodelist[(candmodelist[0]>candmodelist[1])?0:1]
[0190]
在一个实施例中,变量offset和mod可以根据以下两种情况中的任一种来设置:offset=61,mod=64;offset=62,mod=65。
[0191]
在一个实施例中,当发送非零参考行索引时,如果左相邻模式和上相邻模式之间的绝对模式编号差大于或等于给定阈值,则可以使用相同的规则来导出mpm列表候选项。
[0192]
在一个实施例中,给定阈值可以是0,这意味着,使用相同的规则来导出mpm列表候选项,而不管左相邻模式和上相邻模式之间的模式编号差。
[0193]
在另一实施例中,左相邻模式和上相邻模式都是角度帧内预测模式,并且给定阈值可以是1、2或3。在一个示例中,mpm列表候选项可以如下导出:
[0194]
candmodelist[0]=candintrapredmodea
[0195]
candmodelist[1]=candintrapredmodeb
[0196]
candmodelist[2]=2+((minab+offset)%mod)
[0197]
candmodelist[3]=2+((minab

1)%mod)
[0198]
candmodelist[4]=2+((maxab+offset)%mod)
[0199]
candmodelist[5]=2+((maxab

1)%mod)
[0200]
在另一实施例中,左相邻模式和上相邻模式都是角度帧内预测模式,并且这两个模式的模式编号差等于1或2,mpm列表候选项可以通过使用相同的规则来导出。在一个示例中,mpm列表候选项可以如下导出:
[0201]
candmodelist[0]=candintrapredmodea
[0202]
candmodelist[1]=candintrapredmodeb
[0203]
candmodelist[2]=2+((minab+offset)%mod)
[0204]
candmodelist[3]=2+((maxab

1)%mod)
[0205]
candmodelist[4]=2+((minab+offset

1)%mod)
[0206]
candmodelist[5]=2+(maxab%mod)
[0207]
在另一实施例中,如果左相邻模式和上相邻模式不相等,则可以通过使用相同的规则来导出mpm列表候选项,而不管左相邻模式和上相邻模式之间的模式编号差。
[0208]
在一个实施例中,如果左相邻模式和上相邻模式都是角度帧内预测模式但它们不相等,则通过使用相同的规则导出mpm列表候选项,而不管左相邻模式和上相邻模式之间的模式编号差。
[0209]
在一个示例中,可以如下导出6个mpm候选项:
[0210]
candmodelist[0]=candintrapredmodea
[0211]
candmodelist[1]=candintrapredmodeb
[0212]
candmodelist[2]=2+((minab+offset)%mod)
[0213]
candmodelist[3]=2+((minab

1)%mod)
[0214]
candmodelist[4]=2+((maxab+offset)%mod)
[0215]
candmodelist[5]=2+((maxab

1)%mod)
[0216]
在另一示例中,可以如下导出6个mpm候选项:
[0217]
candmodelist[0]=candintrapredmodea
[0218]
candmodelist[1]=candintrapredmodeb
[0219]
candmodelist[2]=2+((minab+offset)%mod)
[0220]
candmodelist[3]=2+((maxab

1)%mod)
[0221]
candmodelist[4]=2+((minab

1)%mod)
[0222]
candmodelist[5]=2+((maxab+offset)%mod)
[0223]
在另一示例中,可以如下导出6个mpm候选项:
[0224]
candmodelist[0]=candintrapredmodea
[0225]
candmodelist[1]=candintrapredmodeb
[0226]
candmodelist[2]=2+((maxab+offset)%mod)
[0227]
candmodelist[3]=2+((maxab

1)%mod)
[0228]
candmodelist[4]=2+((minab+offset)%mod)
[0229]
candmodelist[5]=2+((minab

1)%mod)
[0230]
在另一示例中,可以如下导出6个mpm候选项:
[0231]
candmodelist[0]=candintrapredmodea
[0232]
candmodelist[1]=candintrapredmodeb
[0233]
candmodelist[2]=2+((candintrapredmodea+offset)%mod)
[0234]
candmodelist[3]=2+((candintrapredmodea

1)%mod)
[0235]
candmodelist[4]=2+((candintrapredmodeb+offset)%mod)
[0236]
candmodelist[5]=2+((candintrapredmodeb

1)%mod)
[0237]
在另一实施例中,如果左相邻模式和上相邻模式中的至少一个是角度帧内预测模式,则通过使用相同的规则导出mpm列表候选项,而不管左相邻模式和上相邻模式之间的模
式编号差。
[0238]
在实施例中,当两个相邻模式都是角度帧内预测模式时,在mpm列表中可以存在用于非零参考行的复制模式候选项。
[0239]
在一个实施例中,当两个相邻模式都是角度帧内预测模式,并且这两个相邻模式的模式编号差的绝对值等于1或2、或大于阈值时,mpm列表中存在用于非零参考行的冗余模式候选项,阈值可以是正整数,例如61、62、63或64之一。
[0240]
在另一实施例中,限定在mpm列表中没有用于零参考行的复制模式候选项。
[0241]
在另一实施例中,当两个相邻模式都是角度帧内预测模式并且不相等时,在mpm列表中可以存在用于非零参考行的复制模式候选项。
[0242]
在一个实施例中,被用于构造零参考行mpm列表的角度帧内预测模式可以再被用于非零线mpm列表,并且这些角度mpm模式的索引可以与用于零参考行和非零参考行mpm列表的索引相同。
[0243]
在一个示例中,零线的mpm列表可以是{26,18,0,1,25,27},其中26、18、25和27是角度帧内预测模式。因此,对于非零线,这4个角度帧内预测模式也可以使用相同的索引,并且非零线的mpm列表的一个示例可以是{26,18,17,19,25,27}。
[0244]
在一个实施例中,被用于构造零参考行mpm列表的默认角度帧内预测模式再被用于非零线mpm列表,并且这些角度mpm模式的mpm索引与用于零参考行和非零参考行mpm列表的mpm索引相同。变量k是正整数。在一个示例中,k等于4。
[0245]
在一个示例中,零和非零参考行的默认模式分别是{平面,dc,垂直,水平,垂直

k,垂直+k}和{2,34,垂直,水平,垂直

k,垂直+k}。这可以被描述成如下:
[0246]
candmodelist[0]=reflineidx==0?平面:2
[0247]
candmodelist[1]=reflineidx==0?dc:34
[0248]
candmodelist[2]=垂直
[0249]
candmodelist[3]=水平
[0250]
candmodelist[4]=垂直

k
[0251]
candmodelist[5]=垂直+k
[0252]
在另一实例中,用于零和非零参考行的默认模式可如下制定,其中candintrapredmodea等于平面或dc模式:
[0253]
candmodelist[0]=reflineidx==0?candintrapredmodea:2
[0254]
candmodelist[1]=reflineidx==0?(1

candintrapredmodea):34
[0255]
candmodelist[2]=垂直
[0256]
candmodelist[3]=水平
[0257]
candmodelist[4]=垂直

k
[0258]
candmodelist[5]=垂直+k
[0259]
在一个实施例中,如果一个相邻模式是平面或dc模式,或任何非角度帧内预测模式,而另一个相邻模式是角度帧内预测模式,则可以总是首先将平面或dc模式插入到索引为0的mpm列表中,而其次将角度相邻模式插入到索引为1的mpm列表中。
[0260]
在一个实施例中,如果发送零参考行索引,则可以总是首先将平面模式插入到索引为0的mpm列表中,其次将角度相邻模式插入到索引为1的mpm列表中,并且第三将dc模式
插入到索引为2的mpm列表中。一个示例如下所示:
[0261]
candmodelist[0]=平面
[0262]
candmodelist[1]=max(candintrapredmodea,candintrapredmodeb)
[0263]
candmodelist[2]=dc
[0264]
candmodelist[3]=2+((mpm[1]+offset)%mod)
[0265]
candmodelist[4]=2+((mpm[1]

1)%mod)
[0266]
candmodelist[5]=2+((mpm[1]+offset

1)%mod)
[0267]
在另一实施例中,如果发送零参考索引,则可以总是首先将非角相邻模式插入到索引为0的mpm列表中,其次将角度相邻模式插入到索引为1的mpm列表中,并且索引为2的mpm候选项可以总是被设置为(1

candmodelist[0])。一个示例如下所示:
[0268]
candmodelist[0]=min(candintrapredmodea,candintrapredmodeb)
[0269]
candmodelist[1]=max(candintrapredmodea,candintrapredmodeb)
[0270]
candmodelist[2]=1

candmodelist0.[0271]
candmodelist[3]=2+((mpm[1]+offset)%mod)
[0272]
candmodelist[4]=2+((mpm[1]

1)%mod)
[0273]
candmodelist[5]=2+((mpm[1]+offset

1)%mod)
[0274]
在另一个实施例中,如果发送零参考行索引,则可以总是首先将角度相邻模式插入到索引为0的mpm列表中,其次将非角度相邻模式插入到索引为1的mpm列表中,并且索引为2的mpm候选项可以总是被设置为(1

candmodelist[1])。一个示例如下所示:
[0275]
candmodelist[0]=max(candintrapredmodea,candintrapredmodeb)
[0276]
candmodelist[1]=min(candintrapredmodea,candintrapredmodeb)
[0277]
candmodelist[2]=1

candmodelist[1]
[0278]
candmodelist[3]=2+((mpm[0]+offset)%mod)
[0279]
candmodelist[4]=2+((mpm0.‑
1)%mod)
[0280]
candmodelist[5]=2+((mpm[0]+offset

1)%mod)
[0281]
另一示例如下所示:
[0282]
candmodelist[0]=max(candintrapredmodea,candintrapredmodeb)
[0283]
candmodelist[1]=平面
[0284]
candmodelist[2]=dc
[0285]
candmodelist[3]=2+((mpm[0]+offset)%mod)
[0286]
candmodelist[4]=2+((mpm0.‑
1)%mod)
[0287]
candmodelist[5]=2+((mpm[0]+offset

1)%mod)
[0288]
在一个实施例中,对于零参考行,如果一个相邻块与非角度帧内预测模式相关联,例如平面模式、dc模式、帧间模式、帧内

帧间模式或cpr模式,而另一个相邻模式是角度帧内预测模式,则平面或dc模式是否被置于mpm列表中的角度相邻模式之前,取决于角度相邻模式的模式编号。
[0289]
在一个实施例中,如果角度相邻模式是垂直模式或水平模式,则首先将角度相邻模式插入到索引为0的mpm列表中,其次将平面或dc模式插入到索引为1的mpm列表中。否则,首先将平面或dc模式插入到索引为0的mpm列表中,其次将角度相邻模式插入到索引为1的
mpm列表中。一个示例如下所示:
[0290]
candmodelist[0]=(maxab==intra_angular50||maxab==intra_angular18)?maxab:minab
[0291]
candmodelist[1]=(maxab==intra_angular50||maxab==intra_angular18)?minab:maxab
[0292]
candmodelist[2]=1

minab
[0293]
candmodelist[3]=2+((maxab+offset)%mod)
[0294]
candmodelist[4]=2+((maxab

1)%mod)
[0295]
candmodelist[5]=2+((maxab+offset

1)%mod)
[0296]
在一个实施例中,如果角度相邻模式是垂直模式,或水平模式,或对角线模式,例如模式2、34、66,则首先将角度相邻模式插入到索引为0的mpm列表中,并且其次将平面或dc模式插入到索引为1的mpm列表中。否则,首先将平面或dc模式插入到索引为0的mpm列表中,其次将角度相邻模式插入到索引为1的mpm列表中。
[0297]
在一个实施例中,如果角度相邻模式是垂直模式或水平模式,则首先将角度相邻模式插入到索引为0的mpm列表中,其次将平面或dc模式插入到索引为1的mpm列表中。否则,首先将与当前块左相邻的块的左相邻模式插入到索引为0的mpm列表中,并且其次将当前块上方的块的上相邻模式插入到索引为1的mpm列表中。一个示例如下所示:
[0298]
candmodelist[0]=(maxab==intra_angular50||maxab==intra_angular18)?maxab:candintrapredmodea
[0299]
candmodelist[1]=(maxab==intra_angular50||maxab==intra_angular18)?minab:candintrapredmodeb
[0300]
candmodelist[2]=1

minab
[0301]
candmodelist[3]=2+((maxab+offset)%mod)
[0302]
candmodelist[4]=2+((maxab

1)%mod)
[0303]
candmodelist[5]=2+((maxab+offset

1)%mod)
[0304]
在一个实施例中,如果角度相邻模式是垂直模式,或水平模式,或对角模式,例如模式2、34、66,则首先将角度相邻模式插入到索引为0的mpm列表中,并且其次将平面或dc模式插入到索引为1的mpm列表中。否则,首先将左相邻模式插入到索引为0的mpm列表中,并且其次将上相邻模式插入到索引为1的mpm列表中。
[0305]
在一个实施例中,如果角度相邻模式是不使用内插在分数位置生成预测样本的模式,例如模式2、34、66、水平、垂直、72、76、78、80、

6、10、

12、

14,则首先将角度相邻模式插入到索引为0的mpm列表中,并且其次将平面或dc模式插入到索引为1的mpm列表中。否则,首先将平面或dc模式插入到索引为0的mpm列表中,并且其次将角度相邻模式插入到索引为1的mpm列表中。
[0306]
在一个实施例中,确定是将平面模式还是dc模式置于mpm列表中的角度相邻模式之前,还取决于相邻角度帧内预测模式的位置,例如它是来自左相邻块还是上相邻块。
[0307]
在一个实施例中,如果左角度相邻模式是水平模式或者上角度相邻模式是垂直模式,则首先将角度相邻模式插入到索引为0的mpm列表中,其次将平面或dc模式插入到索引为1的mpm列表中。否则,首先将平面或dc模式插入到索引为0的mpm列表中,并且其次将角度
相邻模式插入到索引为1的mpm列表中。
[0308]
在一个实施例中,如果左角度相邻模式是水平状模式,并且它不使用内插在分数位置生成预测样本,例如模式2、水平、

6、

10、

12、

14,则首先将角度相邻模式插入到索引为0的mpm列表中,其次将平面或dc模式插入到索引为1的mpm列表中。否则,首先将平面或dc模式插入到索引为0的mpm列表中,并且其次将角度相邻模式插入到索引为1的mpm列表中。
[0309]
在一个实施例中,如果上角度相邻模式是垂直状模式并且它不使用内插在分数位置生成预测样本,例如模式66、垂直、72、76、78、80,则首先将角度相邻模式插入到索引为0的mpm列表,其次将平面或dc模式插入到索引为1的mpm列表。否则,首先将平面或dc模式插入到索引为0的mpm列表中,并且其次将角度相邻模式插入到索引为1的mpm列表中。
[0310]
图9是用于发送用于对已编码视频比特流中的当前块进行编码的帧内预测模式的示例性过程900的流程图。在一些实施方案中,图9的至少一个过程框可以由解码器610执行。在一些实施方案中,图9的至少一个过程框可以由与解码器610分离或包括解码器610的另一设备或一组设备来执行,例如编码器603。
[0311]
如图9所示,过程900可以包括生成与当前块的零参考行相对应的第一mpm列表(框910)。第一mpm列表可以包括多个角度帧内预测模式。
[0312]
如图9进一步所示,过程900可以包括生成与当前块的至少一个非零参考行相对应的第二mpm列表(框920)。第二mpm列表可以包括相同的多个角度帧内预测模式。
[0313]
如图9中进一步所示,过程900可以包括发送参考行索引,参考行索引指示至少一个非零参考行和零参考行其中之一,用于对当前块进行编码(框930)。
[0314]
如图9进一步所示,过程900可以包括确定参考行索引是否指示参考行是零参考行(框940)。基于参考行索引指示参考行是零参考行,过程900然后发送帧内模式索引,指示第一mpm列表内的帧内预测模式(框950)。当参考行索引指示参考行为至少一个非零参考行中的一个时,过程900然后发送帧内模式索引,指示第二mpm列表内的帧内预测模式(框950)。
[0315]
在一个实施例中,第一mpm列表进一步包括至少一个非角度帧内预测模式,第二mpm列表不包括至少一个非角度帧内预测模式。
[0316]
在一个实施例中,至少一个非角度帧内预测模式包括平面模式和dc模式中的至少一个。
[0317]
在一个实施例中,第一mpm列表包括对应于多个角度帧内预测模式的第一多个索引,第二mpm列表包括对应于多个角度帧内预测模式的第二多个索引,并且第一多个索引与第二多个索引相同。
[0318]
在一个实施例中,多个角度帧内预测模式包括第一角度帧内预测模式和第二角度帧内预测模式,第一角度帧内预测模式对应于第一多个索引中的第一索引,第二角度帧内预测模式对应于第一多个索引中的第二索引,第一角度帧内预测模式对应于第二多个索引中的第一索引,第二角度帧内预测模式对应于第二多个索引中的第二索引,第一多个索引中的第一索引与第二多个索引中的第一索引相同,并且第一多个索引中的第二索引与第二多个索引中的第二索引相同。
[0319]
在一个实施例中,若当前块的第一相邻块的第一相邻模式是非角度帧内预测模式,并且当前块的第二相邻块的第二相邻模式是角度帧内预测模式,则第一mpm列表的第一帧内预测模式可以是非角度帧内预测模式,并且第一mpm列表的第二帧内预测模式可以是
角度帧内预测模式。
[0320]
在一个实施例中,若第一相邻模式是dc模式,并且参考行索引指示参考行是零参考行,则第一mpm列表的第一帧内预测模式可以是dc模式。
[0321]
在一个实施例中,若第一相邻模式是平面模式,并且参考行索引指示参考行是零参考行,则第一mpm列表的第一帧内预测模式可以是平面模式。
[0322]
在一个实施例中,若参考行索引指示参考行是零参考行,第一mpm列表的第一帧内预测模式可以是平面模式,第一mpm列表的第二帧内预测模式可以是角度帧内预测模式,并且第一mpm列表的第三帧内预测模式可以是dc模式。
[0323]
在一个实施例中,若参考行索引指示参考行是零参考行,当前块的第一相邻块的第一相邻模式是非角度帧内预测模式,并且当前块的第二相邻块的第二相邻模式是角度帧内预测模式,则第一mpm列表的第一帧内预测模式可以是角度帧内预测模式,并且第一mpm列表的第二帧内预测模式可以是非角度帧内预测模式。虽然图9示出了过程900的示例性框,但是在一些实施方案中,过程900可以包括比图9所示的更多的框、更少的框、不同的框或不同排列的框。另外或可选地,可以并行地执行过程900的两个或多个框。
[0324]
进一步,上述提出的方法可以由处理电路(例如,至少一个处理器,或者,至少一个集成电路)实施。在一个实施例中,至少一个处理器执行存储在非暂时性计算机可读介质中的程序,以执行上述提出的至少一个方法。
[0325]
上述技术可以通过计算机可读指令实现为计算机软件,并且物理地存储在至少一个计算机可读介质中。例如,图10示出了计算机系统(1200),其适于实现所公开主题的某些实施例。
[0326]
所述计算机软件可通过任何合适的机器代码或计算机语言进行编码,通过汇编、编译、链接等机制创建包括指令的代码,所述指令可由至少一个计算机中央处理单元(cpu),图形处理单元(gpu)等直接执行或通过译码、微代码等方式执行。
[0327]
所述指令可以在各种类型的计算机或其组件上执行,包括例如个人计算机、平板电脑、服务器、智能手机、游戏设备、物联网设备等。
[0328]
图10所示的用于计算机系统(1200)的组件本质上是示例性的,并不用于对实现本技术实施例的计算机软件的使用范围或功能进行任何限制。也不应将组件的配置解释为与计算机系统(1200)的示例性实施例中所示的任一组件或其组合具有任何依赖性或要求。
[0329]
计算机系统(1200)可以包括某些人机界面输入设备。这种人机界面输入设备可以通过触觉输入(如:键盘输入、滑动、数据手套移动)、音频输入(如:声音、掌声)、视觉输入(如:手势)、嗅觉输入(未示出),对至少一个人类用户的输入做出响应。所述人机界面设备还可用于捕获某些媒体,气与人类有意识的输入不必直接相关,如音频(例如:语音、音乐、环境声音)、图像(例如:扫描图像、从静止影像相机获得的摄影图像)、视频(例如二维视频、包括立体视频的三维视频)。
[0330]
人机界面输入设备可包括以下中的至少一个(仅绘出其中一个):键盘1001、鼠标1002、触控板1003、触摸屏1004、数据手套1204、操纵杆1005、麦克风(1006)、扫描仪1007、照相机1008。
[0331]
计算机系统(1200)还可以包括某些人机界面输出设备。这种人机界面输出设备可以通过例如触觉输出、声音、光和嗅觉/味觉来刺激至少一个人类用户的感觉。这样的人机
界面输出设备可包括触觉输出设备(例如通过触摸屏1010、数据手套1204或操纵杆1005的触觉反馈,但也可以有不用作输入设备的触觉反馈设备)、音频输出设备(例如,扬声器1009、耳机(未示出))、视觉输出设备(例如,屏幕1010,包括阴极射线管(crt)屏幕、液晶显示(lcd)屏幕、等离子屏幕、有机发光二极管(oled)屏幕),其中每一个都具有或没有触摸屏输入功能、每一个都具有或没有触觉反馈功能——其中一些可通过诸如立体画面输出的手段输出二维视觉输出或三维以上的输出;虚拟现实眼镜(未示出)、全息显示器和放烟箱(未示出))以及打印机(未示出)。
[0332]
计算机系统(1200)还可以包括人可访问的存储设备及其相关介质,如包括具有cd/dvd的高密度只读/可重写式光盘(cd/dvd rom/rw)或类似介质(1021)的光学介质、拇指驱动器(1022)、可移动硬盘驱动器或固体状态驱动器(1023),诸如磁带和软盘(未示出)的传统磁介质,诸如安全软件保护器(未示出)等的基于rom/asic/pld的专用设备,等等。
[0333]
本领域技术人员还应当理解,结合所公开的主题使用的术语“计算机可读介质”不包括传输介质、载波或其它瞬时信号。
[0334]
计算机系统(1200)还可以包括通往至少一个通信网络的接口。例如,网络可以是无线的、有线的、光学的。网络还可为局域网、广域网、城域网、车载网络和工业网络、实时网络、延迟容忍网络等等。网络还包括以太网、无线局域网、蜂窝网络(gsm、3g、4g、5g、lte等)等局域网、电视有线或无线广域数字网络(包括有线电视、卫星电视、和地面广播电视)、车载和工业网络(包括canbus)等等。某些网络通常需要外部网络接口适配器,用于连接到某些通用数据端口或外围总线1049(例如,计算机系统(1200)的usb端口);其它系统通常通过连接到如下所述的系统总线集成到计算机系统(1200)的核心(例如,以太网接口集成到pc计算机系统或蜂窝网络接口集成到智能电话计算机系统)。通过使用这些网络中的任何一个,计算机系统(1200)可以与其它实体进行通信。所述通信可以是单向的,仅用于接收(例如,无线电视),单向的仅用于发送(例如can总线到某些can总线设备),或双向的,例如通过局域或广域数字网络到其它计算机系统。上述的每个网络和网络接口可使用某些协议和协议栈。
[0335]
上述的人机界面设备、人可访问的存储设备以及网络接口可以连接到计算机系统(1200)的核心(1040)。
[0336]
核心(1040)可包括至少一个中央处理单元(cpu)1041、图形处理单元(gpu)1042、以现场可编程门阵列(fpga)1043形式的专用可编程处理单元、用于特定任务的硬件加速器1044等。这些设备以及只读存储器(rom)1045、随机存取存储器1046、内部大容量存储器(例如内部非用户可存取硬盘驱动器、固态硬盘等)1047等可通过系统总线1248进行连接。在某些计算机系统中,可以以至少一个物理插头的形式访问系统总线1248,以便可通过额外的中央处理单元、图形处理单元等进行扩展。外围装置可直接附接到核心的系统总线1248,或通过外围总线1049进行连接。外围总线的体系结构包括外部控制器接口pci、通用串行总线usb等。
[0337]
cpu 1041、gpu 1042、fpga 1043和加速器1044可以执行某些指令,这些指令组合起来可以构成上述计算机代码。该计算机代码可以存储在rom 1045或ram1046中。过渡数据也可以存储在ram 1046中,而永久数据可以存储在例如内部大容量存储器1047中。通过使用高速缓冲存储器可实现对任何存储器设备的快速存储和检索,高速缓冲存储器可与至少
一个cpu 1041、gpu 1042、大容量存储器1047、rom 1045、ram 1046等紧密关联。
[0338]
所述计算机可读介质上可具有计算机代码,用于执行各种计算机实现的操作。介质和计算机代码可以是为本技术的目的而特别设计和构造的,也可以是计算机软件领域的技术人员所熟知和可用的介质和代码。
[0339]
作为实施例而非限制,具有体系结构(1200)的计算机系统,特别是核心1040,可以作为处理器(包括cpu、gpu、fpga、加速器等)提供执行包含在至少一个有形的计算机可读介质中的软件的功能。这种计算机可读介质可以是与上述的用户可访问的大容量存储器相关联的介质,以及具有非易失性的核心1040的特定存储器,例如核心内部大容量存储器1047或rom 1045。实现本技术的各种实施例的软件可以存储在这种设备中并且由核心1040执行。根据特定需要,计算机可读介质可包括一个或一个以上存储设备或芯片。该软件可以使得核心1040特别是其中的处理器(包括cpu、gpu、fpga等)执行本文所述的特定过程或特定过程的特定部分,包括定义存储在ram 1046中的数据结构以及根据软件定义的过程来修改这种数据结构。另外或作为替代,计算机系统可以提供逻辑硬连线或以其它方式包含在电路(例如,加速器1044)中的功能,该电路可以代替软件或与软件一起运行以执行本文所述的特定过程或特定过程的特定部分。在适当的情况下,对软件的引用可以包括逻辑,反之亦然。在适当的情况下,对计算机可读介质的引用可包括存储执行软件的电路(如集成电路(ic)),包含执行逻辑的电路,或两者兼备。本技术包括任何合适的硬件和软件组合。
[0340]
虽然本技术已对至少两个示例性实施例进行了描述,但实施例的各种变更、排列和各种等同替换均属于本技术的范围内。因此应理解,本领域技术人员能够设计多种系统和方法,所述系统和方法虽然未在本文中明确示出或描述,但其体现了本技术的原则,因此属于本技术的精神和范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1