基于AI的视频处理方法、装置、设备及可读存储介质与流程

文档序号:31450379发布日期:2022-09-07 13:06阅读:92来源:国知局
基于AI的视频处理方法、装置、设备及可读存储介质与流程
基于ai的视频处理方法、装置、设备及可读存储介质
技术领域
1.本技术涉及多媒体处理技术领域,尤其涉及一种基于ai的视频处理方法、装置、设备及可读存储介质。


背景技术:

2.现有技术中,通常使用通用的编码方案对视频进行编码,具体地,会固定的将当前图片划分成块,之后用当前块跟前一帧或者后一帧的图片中的块做匹配,找到误差最小的块作为当前图片当前块的参考块,之后对当前块跟参考块的残差做编码。
3.对当前块跟参考块的残差做编码对当前块中平移的目标物体有效,但是当前块中目标物体旋转时,往往无法确定最匹配的参考块,也即,找到的参考块与当前块的残差也会很大,而当前块跟参考块的残差很大,增加了码流的码率,导致图像质量下降,降低了音视频产品的竞争力。


技术实现要素:

4.本技术的主要目的在于提供一种基于ai的视频处理方法、装置、设备及可读存储介质,旨在解决解决现有视频压缩技术无法对目标物体旋转情况进行有效编码的技术问题。
5.为实现上述目的,本技术提供一种基于ai的视频处理方法,应用于编码端,所述基于ai的视频处理方法包括以下步骤:
6.确定待编码图片中携带有目标物体信息的第一编码块;
7.当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块;
8.基于所述最匹配块确定旋转角度以及块索引信息;
9.基于所述旋转角度和所述块索引信息进行编码。
10.可选地,所述确定待编码图片中携带有目标物体信息的第一编码块的步骤,包括:
11.获取待编码图片,对所述待编码图片进行块划分,得到分块;
12.对所述分块进行目标物体检测,得到携带有目标物体信息的第一编码块。
13.可选地,所述当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片的步骤之前,所述方法包括:
14.确定所述第一编码块当前的可用字节数;
15.当所述可用字节数小于预设字节数时,确定所述第一编码块需要精确编码。
16.可选地,所述确定待编码图片中携带有目标物体信息的第一编码块的步骤之后,所述方法包括:
17.当所述第一编码块不需要精确编码时,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配块。
18.可选地,所述在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配的目标编码块的步骤,包括:
19.确定所述目标物体的标识信息;
20.基于所述标识信息,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配块。
21.可选地,所述将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块的步骤,包括:
22.在所述参考图片中确定与所述第一编码块位置对应的各第二编码块,对所述第二编码块进行滤波处理,得到滤波编码块;
23.基于所述滤波编码块,得到拟合关键点,基于所述拟合关键点和所述参考图片中的初始关键点,确定目标关键点;
24.确定所述目标关键点的主方向以及峰值方向;
25.基于所述目标关键点的主方向以及峰值方向,确定特征匹配度最高的第二编码块为最匹配块。
26.可选地,所述基于所述旋转角度和所述块索引信息进行编码的步骤,包括:
27.基于所述旋转角度以及块索引信息,对所述待编码图片进行编码,得到第一编码信息,其中,所述最匹配块在所述参考图片中已进行编码,且所述最匹配块对应的编码信息为第二编码信息;
28.将所述第一编码信息发送给预设解码端,以供所述预设解码端基于所述第一编码信息和所述第二编码信息,还原所述待编码图片。
29.此外,为实现上述目的,本技术还提供一种基于ai的视频处理装置,所述装置包括:
30.第一确定模块,用于确定待编码图片中携带有目标物体信息的第一编码块;
31.第二确定模块,用于当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块;
32.第三确定模块,用于基于所述最匹配块确定旋转角度以及块索引信息;
33.编码模块,用于基于所述旋转角度和所述块索引信息进行编码。
34.此外,为实现上述目的,本技术还提供一种基于ai的视频处理设备,所述基于ai的视频处理设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的基于ai的视频处理程序,所述基于ai的视频处理程序被所述处理器执行时实现如上所述的基于ai的视频处理方法的步骤。
35.此外,为实现上述目的,本技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于ai的视频处理程序,所述基于ai的视频处理程序被处理器执行时实现如上所述的基于ai的视频处理方法的步骤。
36.本技术提供一种基于ai的视频处理方法、装置、设备及存储介质,与现有技术中对当前块跟参考块的残差做编码时,由于在旋转情况下,难以准确查找得到参考块,致使无法对目标物体旋转情况进行有效编码相比,在本技术中,确定待编码图片中携带有目标物体
信息的第一编码块;当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块;基于所述最匹配块确定旋转角度以及块索引信息;基于所述旋转角度和所述块索引信息进行编码。可以理解,对携带有目标物体信息的第一编码块,在需要精确编码,基于sift特征匹配的方式,准确确定最匹配块,进而,基于准确确定的最匹配块,准确得到所述第一编码块的旋转角度以及块索引信息,以实现基于所述旋转角度以及块索引信息,对所述待编码图片进行编码,得到第一编码信息,进而,实现对旋转情况下的目标物体进行有效编码。
附图说明
37.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。
38.为了更清楚地说明本技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
39.图1为本技术基于ai的视频处理方法第一实施例的流程示意图;
40.图2为本技术基于ai的视频处理方法中步骤s10的细化步骤流程示意图;
41.图3为本技术实施例方案涉及的硬件运行环境的设备结构示意图;
42.图4为本技术基于ai的视频处理方法涉及的场景示意图。
43.本技术目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
44.应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
45.本技术实施例提供一种基于ai的视频处理方法,在本技术基于ai的视频处理方法的第一实施例中,参照图1,所述基于ai的视频处理方法包括:
46.步骤s10,确定待编码图片中携带有目标物体信息的第一编码块;
47.步骤s20,当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块;
48.步骤s30,基于所述最匹配块确定旋转角度以及块索引信息;
49.步骤s40,基于所述旋转角度和所述块索引信息进行编码。
50.在本实施例中,所述基于ai的视频处理方法应用于基于ai的视频处理装置,所述基于ai的视频处理装置属于基于ai的视频处理设备(具体为编码端),所述基于ai的视频处理设备属于基于ai的视频处理系统,该基于ai的视频处理设备属于基于ai的视频处理系统包括编码端和解码端。
51.需要说明的是,目前视频的应用场景越来越多,视频编码算法也变得越来越重要,视频编码主要是对图片做视频的压缩编码,业界已经有h264/h265等编码标准,这样任何一个编码器如果按照视频编码标准编码出来的码流都会被其他第三方解码器正确的解码出来。
52.但是,目前视频编码的压缩质量存在很多问题,如果压缩的太多可以获得更低的码率,占用更低的带宽,但是解码出来的图像质量会很差。如果视频编码压缩比低,可以获得很好的图像质量,但是码率会很高,占用的带宽会很大。如何在保证图片质量的情况下压缩码率是一个编码端必须考虑的方案,这将会大大提高产品的竞争力,增强用户的体验。
53.目前,通常使用通用的编码方案对视频进行编码,具体地,会固定的将当前图片划分成块,之后用当前块跟前一帧或者后一帧的图片中的块做匹配,找到误差最小的块作为当前图片当前块的参考块,之后对当前块跟参考块的残差做编码。
54.对当前块跟参考块的残差做编码对当前块中平移的目标物体有效,但是当前块中目标物体旋转时,往往无法确定最匹配的参考块,也即,找到的参考块与当前块的残差也会很大,而当前块跟参考块的残差很大,增加了码流的码率,导致图像质量下降,降低了音视频产品的竞争力。
55.为了解决现有技术的问题,在本实施例中,先对图片进行块划分,然后确定当前划分出的块是否需要精确编码,当需要精确编码时,基于sift特征匹配方式确定sift区域,并根据该sift区域中对应各个块与第一编码块的sad值来确定最匹配块,在确定最匹配块后,基于最匹配块确定旋转角度以及块索引信息,并将旋转角度以及块索引信息放置到sei信息中进行视频压缩编码。
56.具体步骤如下:
57.步骤s10,确定待编码图片中携带有目标物体信息的第一编码块;
58.在本实施例中,待编码图片中包括一个或者多个目标物体,或者待编码图片中还可以不包括目标物体。
59.在本实施例中,如图4所示,待编码图片为p帧图片类型,而idr帧类型图片按照预设视频编码标准编码的方式进行编码。
60.在本实施例中,在得到待编码图片后,对所述待编码图片进行块划分,确定待编码图片中携带有目标物体信息的第一编码块。
61.在本实施例中,第一编码块可以为多个。
62.其中,参照图2,所述确定待编码图片中携带有目标物体信息的第一编码块的步骤,包括:
63.步骤s11,获取待编码图片,对所述待编码图片进行块划分,得到分块;
64.步骤s12,对所述分块进行目标物体检测,得到携带有目标物体信息的第一编码块。
65.在本实施例中,获取待编码图片后,对所述待编码图片进行块划分,得到分块,在得到分块后,通过预设目标物体检测模型,对所述待编码图片进行目标物体检测,得到携带有目标物体信息的第一编码块。
66.例如,对所述待编码图片进行目标物体检测后,得到目标物体r1、目标物体r2、目标物体rx。
67.在本实施例中,对所述第一目标物体进行分块时,将当前图片划分成16x16的大小,以使得分块时能将目标物体划分在一个块内。
68.在本实施例中,标记各个目标物体所在的第一编码块的索引,如r1b15表示第一个目标物体所在的块是第15个块(其中块是从左往右,从上往下的顺序索引)。
69.步骤s20,当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块;
70.在本实施例中,阐述当所述第一编码块需要精确编码时,如何确定最匹配块。
71.其中,所述当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片的步骤之前,所述方法包括:
72.步骤a1,确定所述第一编码块当前的可用字节数;
73.步骤a2,当所述可用字节数小于预设字节数时,确定所述第一编码块需要精确编码。
74.在本实施例中,确定所述第一编码块当前的可用字节数,其中,确定所述第一编码块当前的可用字节数的方式为:
75.设当前待编码图片的预分配可用字节数为bt,当前待编码图片的分块数为n,则每个块平均的码率或者可用字节数为bt/n。假设当前第一编码块为第ai块,假设每个分块实际消耗掉的是bi的字节。则当前已经用去的字节为sum(ai*bi),剩余的字节数为bt-sum(ai*bi),则当前分块可用的实际字节数为bri=(bt-sum(ai*bi))/(n-i)。
76.当所述可用字节数小于预设字节数时,确定所述第一编码块需要精确编码,具体地,如果bri小于bt/n*4/5(预设字节数),则说明当前宏块需要精确编码。
77.需要说明的是,由于bri小于预设字节数,表明当前码率或者可用字节数是不够使用的,由于预设字节数是不够使用的,此时,需要节省预设字节数,在本实施例中,需要通过精确编码来增加编码块的压缩比(精确编码的时耗更多,通过增加时耗的方式,减少字节数的消耗),以节省预设字节数。
78.很显然,当所述可用字节数小于预设字节数时,表明第一编码块以前的编码块使用的字节数或者码率过多,而当前目标物体所在的第一编码块是需要节省码率的,此时,默认当前待编码图片中的目标物体和之前的参考图片中的目标物体存在旋转的情况,另外,当前待编码图片中的目标物体和之前的参考图片中的目标物体存在平移的情况时,也是目标物体旋转的特殊情况,只不过旋转的角度为0。
79.在本实施例中,当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,其中,待编码图片的参考图片为待编码图片的上一帧的图片。
80.将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块,基于所述最匹配块确定旋转角度以及块索引信息。
81.其中,做尺度不变特征变换sift特征匹配的过程可以包括:
82.1、构建尺度空间,检测极值点,获得尺度不变性;
83.2、基于极值点和尺度空间,过滤并进行目标关键点的精确定位;
84.3、为目标关键点分配方向值;
85.4、生成特征向量。
86.以特征点为中心取16
×
16的邻域作为采样窗口,将采样点与目标关键点的相对方向通过高斯加权后归入包含8个bin的方向直方图,最后获得4
×4×
8的128维特征向量。
87.具体地,所述将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不
变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块的步骤,包括:
88.步骤s21,在所述参考图片中确定与所述第一编码块位置对应的各第二编码块,对所述第二编码块进行滤波处理,得到滤波编码块;
89.步骤s22,基于所述滤波编码块,得到拟合关键点,基于所述拟合关键点和所述参考图片中的初始关键点,确定目标关键点;
90.步骤s23,确定所述目标关键点的主方向以及峰值方向;
91.步骤s24,基于所述目标关键点的主方向以及峰值方向,确定特征匹配度最高的第二编码块为最匹配块。
92.在本实施例中,位置对应可以是位置一致,或者位置偏差在预设区域内,把第一编码块跟参考图片中对应不同位置的各个块做sift特征匹配,具体地,在本实施例中,sift特征匹配中图像高斯金字塔(gaussian pyramid)是采用高斯函数,通过高斯函数对参考图片的各个块进行模糊以及降采样处理得到滤波编码块。
93.使用dog空间的局部极值点的确定方式确定滤波编码块的拟合关键点或者拟合极值点,进而,确定拟合关键点或者拟合极值点分别和初始关键点之间的偏移量,若任意一个偏移量超过了0.5(预设偏移量值),则说明拟合关键点应该在初始关键点的相邻位置。
94.基于所述拟合关键点和所述参考图片中的初始关键点,确定目标关键点,可以将所述拟合关键点和所述参考图片中的初始关键点作为目标关键点,或者从所述拟合关键点和所述参考图片中的初始关键点选取目标关键点。
95.对目标关键点进行预设梯度计算,在完成目标关键点的梯度计算后,使用直方图统计目标关键点预设邻域内像素的梯度和方向,其中,梯度直方图将0~360度的方向范围分为36个柱,其中每柱10度。
96.其中,方向直方图的峰值方向代表了目标关键点的方向,具体地,方向直方图的峰值则代表了该目标关键点预设邻域梯度的方向,以直方图中最大值作为该关键点的主方向。
97.对目标关键点所在预设范围区域进行划分,使得每个目标关键点和一个第二编码块对应,结合目标关键点的主方向以及峰值方向,确定出来第二编码块的一个sift区域,其中,每个sift区域携带有128维特征向量。
98.对比sift区域中每个块的128维特征向量,取最高的特征值vx所在的第二编码块作为最匹配块。
99.在本实施例中,在得到最匹配块后,将最匹配块的整个像素点按照顺时针旋转,得到新的16x16的块ax,使用ax跟第一编码块做sad计算,则计算的sad肯定是最小的,即得到了真正的最匹配块bx。
100.步骤s30,基于所述最匹配块确定旋转角度以及块索引信息;
101.在确定最匹配块后,将最匹配块和第一编码块进行比对,即可得到旋转角度。
102.在本实施例中,由于标记各个目标物体所在的第一编码块的索引,如r1b15表示第一个目标物体所在的块是第15个块(其中块是从左往右,从上往下的顺序索引)。因而,可以确定块索引信息。
103.步骤s40,基于所述旋转角度和所述块索引信息进行编码。
104.其中,所述基于所述旋转角度和所述块索引信息进行编码的步骤,包括:
105.基于所述旋转角度以及块索引信息,对所述待编码图片进行编码,得到第一编码信息,其中,所述最匹配块在所述参考图片中已进行编码,且所述最匹配块对应的编码信息为第二编码信息;
106.将所述第一编码信息发送给预设解码端,以供所述预设解码端基于所述第一编码信息和所述第二编码信息,还原所述待编码图片。
107.在本实施例中,基于所述旋转角度以及块索引信息,对所述待编码图片进行编码,得到第一编码信息,其中,所述最匹配块在所述参考图片中已进行编码,且所述最匹配块对应的编码信息为第二编码信息,因而,可以节约或者节省预设字节数。
108.具体地,例如,将步骤s20找到的bx块的图片做旋转得到bx1,并将bx块的索引和角度标记下来为(bx,ax),放在视频流的sei信息中,将所述第一编码信息发送给预设解码端,以供所述预设解码端基于所述第一编码信息和所述第二编码信息,还原所述待编码图片。
109.本技术提供一种基于ai的视频处理方法、装置、设备及存储介质,与现有技术中对当前块跟参考块的残差做编码时,由于在旋转情况下,难以准确查找得到参考块,致使无法对目标物体旋转情况进行有效编码相比,在本技术中,确定待编码图片中携带有目标物体信息的第一编码块;当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块;基于所述最匹配块确定旋转角度以及块索引信息;基于所述旋转角度和所述块索引信息进行编码。可以理解,对携带有目标物体信息的第一编码块,在需要精确编码,基于sift特征匹配的方式,准确确定最匹配块,进而,基于准确确定的最匹配块,准确得到所述第一编码块的旋转角度以及块索引信息,以实现基于所述旋转角度以及块索引信息,对所述待编码图片进行编码,得到第一编码信息,进而,实现对旋转情况下的目标物体进行有效编码。
110.进一步地,基于本技术中上述实施例,提供本技术的另一实施例,在该实施例中,所述确定所述第一编码块当前的可用字节数的步骤之后,所述方法包括:
111.步骤b1,当所述第一编码块不需要精确编码时,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配块。
112.在本实施例中,当所述可用字节数大于等于预设字节数时,确定所述第一编码块不需要精确编码,当所述第一编码块不需要精确编码时,基于所述第一编码块,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配块。
113.具体地,基于所述第一编码块,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值(sad、sum of absolute difference,绝对误差和)最小的第二编码块的过程可以是:在参考图片内随机确定与第一编码块大小一致的多个第二编码块,然后将多个第二编码块分别与第一编码块进行比对,得到与所述第一编码块sad值最小的第二编码块,将所述第二编码块所在的第二编码块作为最匹配的目标编码块。
114.所述在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配的目标编码块的步骤,包括:
115.步骤c1,确定所述目标物体的标识信息;
116.步骤c2,基于所述标识信息,在所述参考图片内进行运动搜索,确定与所述第一编
码块sad值最小的第二编码块作为最匹配块。
117.在本实施例中,确定所述第一编码块的标识信息,具体地,还可以是确定所述第一编码块中目标物体的标识信息,基于所述目标物体的标识信息,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块。
118.也即,首先确定参考图片内包括所述目标物体标识的第二编码块,进而,可以快速查找得到与所述第一编码块sad值最小的第二编码块。
119.具体地,在搜索前先查询当前16x16的第一编码块所属的id或者对应目标物体的id,根据第一编码块所属的id或者对应目标物体的id,对应到参考图片的相应目标物体id,进而得到参考图片对应目标物体的第二编码块。
120.在本实施例中,快速查找得到第二编码块,提升了编码效率。
121.进一步地,基于本技术中上述实施例,提供本技术的另一实施例,在该实施例中,应用于解码端,所述基于ai的视频处理方法包括以下步骤:
122.步骤s60,在对待解码图片的第一编码块进行解码时,获取所述第一编码块对应的旋转角度以及块索引信息;
123.步骤s70,基于所述旋转角度以及块索引信息,对所述第一编码块进行旋转处理,并得到旋转后的第一编码块;
124.步骤s80,对所述旋转后的第一编码块进行解码处理,最终得到解码图片。
125.在本实施例中,解码端获取视频流中待解码图片,然后解码当前视频流的sei信息,进而,得到当前帧的各个划分块的信息(bx,ax)列表,其中bx表示使用了旋转匹配的块的坐标(块索引信息),ax表示该块的旋转角度值,然后基于所述旋转角度以及块索引信息,对所述第一编码块进行旋转处理,并得到旋转后的第一编码块,具体地,确定旋转后的第一编码块的残差值,用该块的残差值加上第二编码信息,得到当前第一编码块的像素值。
126.在本实施例中,解码端可以准确对待解码图片的第一编码块进行解码。
127.参照图3,图3是本技术实施例方案涉及的硬件运行环境的设备结构示意图。
128.如图3所示,该基于ai的视频处理设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
129.可选地,该基于ai的视频处理设备还可以包括矩形用户接口、网络接口、摄像头、rf(radio frequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
130.本领域技术人员可以理解,图3中示出的基于ai的视频处理设备结构并不构成对基于ai的视频处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
131.如图3所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于ai的视频处理程序。操作系统是管理和控制基于ai的视频处理设备硬件和软件资源的程序,支持基于ai的视频处理程序以及其它软件和/或程序的运行。网络通信模块用于
实现存储器1005内部各组件之间的通信,以及与基于ai的视频处理系统中其它硬件和软件之间通信。
132.在图3所示的基于ai的视频处理设备中,处理器1001用于执行存储器1005中存储的基于ai的视频处理程序,实现上述任一项所述的基于ai的视频处理方法的步骤。
133.本技术基于ai的视频处理设备具体实施方式与上述基于ai的视频处理方法各实施例基本相同,在此不再赘述。
134.本技术还提供一种基于ai的视频处理装置,所述基于ai的视频处理装置包括:
135.第一确定模块,用于确定待编码图片中携带有目标物体信息的第一编码块;
136.第二确定模块,用于当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块;
137.第三确定模块,用于基于所述最匹配块确定旋转角度以及块索引信息;
138.编码模块,用于基于所述旋转角度和所述块索引信息进行编码。
139.可选地,所述第一确定模块包括:
140.第一获取单元,用于获取待编码图片,对所述待编码图片进行块划分,得到分块;
141.第二获取单元,用于对所述分块进行目标物体检测,得到携带有目标物体信息的第一编码块。
142.可选地,所述装置包括:
143.第四确定模块,用于确定所述第一编码块当前的可用字节数;
144.第五确定模块,用于当所述可用字节数小于预设字节数时,确定所述第一编码块需要精确编码。
145.可选地,所述装置还包括:
146.第六确定模块,用于当所述第一编码块不需要精确编码时,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配块。
147.可选地,所述第六确定模块包括:
148.第一确定单元,用于确定所述目标物体的标识信息;
149.第二确定单元,用于基于所述标识信息,在所述参考图片内进行运动搜索,确定与所述第一编码块sad值最小的第二编码块作为最匹配块。
150.可选地,所述第二确定模块包括:
151.滤波单元,用于在所述参考图片中确定与所述第一编码块位置对应的各第二编码块,对所述第二编码块进行滤波处理,得到滤波编码块;
152.第三获取单元,用于基于所述滤波编码块,得到拟合关键点,基于所述拟合关键点和所述参考图片中的初始关键点,确定目标关键点;
153.第三确定单元,用于确定所述目标关键点的主方向以及峰值方向;
154.基于所述目标关键点的主方向以及峰值方向,确定特征匹配度最高的第二编码块为最匹配块。
155.可选地,所述编码模块包括:
156.编码单元,用于基于所述旋转角度以及块索引信息,对所述待编码图片进行编码,得到第一编码信息,其中,所述最匹配块在所述参考图片中已进行编码,且所述最匹配块对
应的编码信息为第二编码信息;
157.发送单元,用于将所述第一编码信息发送给预设解码端,以供所述预设解码端基于所述第一编码信息和所述第二编码信息,还原所述待编码图片。
158.本技术基于ai的视频处理装置的具体实施方式与上述基于ai的视频处理方法各实施例基本相同,在此不再赘述。
159.本技术实施例提供了一种基于ai的视频处理系统,所述基于ai的视频处理系统包括:
160.编码端,用于获取待编码图片,对所述待编码图片中的目标物体进行块划分,得到第一编码块;确定所述第一编码块当前的可用字节数,当所述可用字节数小于预设字节数时,确定所述第一编码块需要精确编码;还用于当所述第一编码块需要精确编码时,确定所述待编码图片的参考图片,将所述第一编码块与所述参考图片中对应各个第二编码块做尺度不变特征变换sift特征匹配,把sift特征匹配度最高的第二编码块作为最匹配块,基于所述最匹配块确定旋转角度以及块索引信息;还用于基于所述旋转角度以及块索引信息,对所述待编码图片进行编码,得到第一编码信息,其中,所述最匹配块在所述参考图片中已进行编码,且所述最匹配块对应的编码信息为第二编码信息;还用于将所述第一编码信息发送给预设解码端,以供所述预设解码端基于所述第一编码信息和所述第二编码信息,还原所述待编码图片;
161.解码端,用于在对待解码图片的第一编码块进行解码时,获取所述第一编码块对应的旋转角度以及块索引信息;基于所述旋转角度以及块索引信息,对所述第一编码块进行旋转处理,并得到旋转后的第一编码块;对所述旋转后的第一编码块进行解码处理,最终得到解码图片。
162.本技术基于ai的视频处理系统具体实施方式与上述基于ai的视频处理方法各实施例基本相同,在此不再赘述。
163.本技术实施例提供了一种存储介质,且所述存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于ai的视频处理方法的步骤。
164.本技术存储介质具体实施方式与上述基于ai的视频处理方法各实施例基本相同,在此不再赘述。
165.本技术还提供一种计算机程序产品、包括计算机程序,该计算机程序被处理器执行时实现上述的基于ai的视频处理方法的步骤。
166.本技术计算机程序产品的具体实施方式与上述基于ai的视频处理方法各实施例基本相同,在此不再赘述。
167.需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
168.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
169.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方
法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
170.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1