一种视频处理方法及装置的制造方法_5

文档序号:8925532阅读:来源:国知局
[0262] 为了便于理解和简化计算,本发明实施例W预编码视频包含有3段场景(场景一、 场景二和场景=),且每段场景为一个场景类别,视频处理器选取各段场景的其中一幅随机 访问点图像为例对视频处理方法进行说明。
[0263] 具体的,本发明实施例提供一种视频处理方法,如图12所示,包括:
[0264]S401、视频处理装置将待编码视频分割为=段场景。
[0265] 具体的,视频处理装置对待编码视频采用任意一种现有的场景切换方法进行场景 切换检测,并将待编码视频分割为=段场景。
[0266]S402、视频处理装置从各段场景中选取其中一幅随机访问点图像。
[0267] 视频处理装置将各段场景视为不同场景类别,然后根据场景类别从各段场景中选 取其中一幅随机访问点图像;或者,视频处理装置根据场景类别和场景活动性从各段场景 中选取其中一幅随机访问点图像。
[026引示例性的,视频处理装置选取各个场景类别内的中间图像的邻近随机访问点图 像。
[0269] 假设一个场景类别包含L幅图像,编码时的随机访问点间隔为IP。视频处理装置 从第一幅图像开始计数,当计数到L/2位置的图像时,选取离L/2最近的随机访问点处的图 像,即第Li/Px/巧」幅或LZ/(2xiP)」+l幅随机访问点图像。
[0270] 示例性的,视频处理装置选取各个场景类别内达到累加活动性一半的图像的邻近 随机访问点图像。
[0271] 假设一个场景类别包含L幅图像,视频处理装置计算每个场景类别的活动性 MI,,其中,Mli为场景类别内第i幅图像按照实施例S中任意一种计算活 i=l 动性的方法计算出的活动性。视频处理装置从第一幅图像开始累加活动性,当累加到 第M幅图像位置,此时的累加活动性达到该场景所有图像的累加活动性的一半,即M为 满足的最小值,抽取离第M幅图像最近的随机访问点处的图像,即第 _M//f+ 0.5」幅或第LM/ /户+ 0.5」+1幅随机访问点图像。
[0272]S403、视频处理装置保存选取出的随机访问点图像,W生成知识库。
[0273] 本发明实施例提供一种视频处理方法,视频处理装置将待编码视频分割为至少两 段场景,并将各段场景划分为至少两个场景类别,然后,视频处理装置从至少两个场景类别 中的至少一个场景类别中分别选取出至少一幅图像,最后,视频处理装置保存选取出的图 像,W生成知识库。
[0274] 从上面可W看出,本发明实施例中的知识库是视频处理装置根据待编码视频生成 的,因此,该知识库与待编码视频之间的相关性较高。另外,视频处理器装置是将待编码视 频进行分割,并划分为至少两个场景类别,然后根据场景类别的划分,从至少一个场景类别 中选取图像的。视频处理装置从场景类别的角度出发,选取图像,并将选取出的图像存储至 知识库,有效地降低了图像库中数据之间的冗余度。该样,本发明技术方案解决了目前图像 库中数据冗余较大,与待编码视频相关性较低的问题。进而,有效的解决了视频编码效率较 低的问题。
[0275] 实施例五
[0276] 本发明实施例提供一种视频处理装置1,如图13所示,包括:
[0277] 分割单元10,用于将待编码视频分割为至少两段场景,W及用于将各段场景划分 为至少两个场景类别。
[027引选取单元11,用于从所述至少两个场景类别中的至少一个场景类别中分别选取出 至少一幅图像。
[0279] 存储单元12,用于保存所述选取单元11选取出的图像,W生成知识库。
[0280] 进一步地,所述选取出的图像中任意两幅图像之间的相似度低于第一预设阔值。
[0281] 进一步地,所述分割单元10,具体用于将每段场景划分为一个场景类别;
[028引或者,
[0283] 所述分割单元10,具体用于检测至少一段场景和其不相邻场景的相似度,并将相 似度大于或等于第二预设阔值的场景划分为同一个场景类别。
[0284] 进一步地,所述选取单元11,具体用于从各段场景中分别选取一幅代表图像。
[0285] 进一步地,如图14所示,所述视频处理装置1还包括计算单元13 ;
[0286] 所述计算单元13,用于计算任意两段不相邻场景的代表图像之间的相似度;所述 相似度使用两幅图像之间的图像差、特征描述子相似度或运动补偿残差中的一种来衡量。
[0287] 进一步地,所述选取单元11,具体用于选取第一场景类别中任意一段场景的第一 预设位置的图像,所述第一场景类别为所述至少一个场景类别中的任意一个场景类别;
[028引所述选取单元11,具体用于根据所述第一场景类别中各段场景的活动性选取图 像,所述活动性使用运动矢量强度、图像差、运动补偿残差或者图像特征变化中的至少一种 来衡量;其中,所述图像特征至少包括亮度直方图、色度直方图、特征描述子中的一种,所述 特征描述子至少包括尺度不变转换SIFT特征描述子、加速稳健特征SURF特征描述子中的 一种。
[0289] 进一步地,所述第一预设位置属于所述待编码视频中的随机访问点。
[0290] 进一步地,如图14所示,所述视频处理装置1还包括处理单元14 ;
[0291] 所述处理单元14,还用于对选取出的图像进行编码,生成重建图像;
[0292] 所述存储单元12,具体用于保存所述处理单元14生成的重建图像,W生成知识 库。
[0293] 进一步地,所述计算单元13,还用于计算所述第一场景类别中每段场景的活动性。
[0294] 进一步地,如图14所示,所述视频处理装置1还包括确定单元15 ;
[0295] 所述确定单元15,用于根据所述计算单元13计算的每段场景的活动性,确定每段 场景中需要选取图像的数量;
[0296] 所述选取单元11,还用于采用第一预设选取规则,在每段场景中选取图像,所述选 取图像的数量与所述需要选取图像的数量相同。
[0297] 进一步地,当第一场景类别中只包含有一段场景,且在该段场景中需要选取图像 的数量为零时,则将所述第一场景类别需要选取图像的数量修改为一;
[029引当所述第一场景类别中包含至少两段场景,且所有场景中需要选取图像的数量均 为零时,则将所述第一场景类别中其中一段场景需要选取图像的数量修改为一。
[0299] 进一步地,每段场景中需要选取图像的数量和该段场景的活动性呈单调递增关 系,但每段场景中需要选取图像的数量不超过第=预设阔值。
[0300] 进一步地,所述选取单元11,还用于根据选取图像的数量,等间隔或近似等间隔地 从场景中选取出相应数量的图像。
[0301] 进一步地,所述计算单元13,还用于计算所述第一场景类别中位于第二预设位置 的图像的活动性;
[0302] 所述选取单元11,还用于根据所述计算单元13计算的各个位于第二预设位置的 图像的活动性和第二预设选取规则,选取所述第一场景类别中的图像。
[0303] 进一步地,所述处理单元14,还用于从第一幅位于第二预设位置的图像开始,累积 各幅位于第二预设位置的图像的活动性;
[0304] 所述选取单元11,还用于当活动性累积达到第四预设阔值时,选取对应位置的图 像。
[0305] 进一步地,所述第二预设位置属于所述待编码视频中的随机访问点。
[0306] 进一步地,所述选取出的图像属于所述待编码视频中的随机访问点所在的图像。
[0307] 进一步地,所述待编码视频中的随机访问点所在的图像采用帖内编码,或者仅参 考知识库中的至少一幅图像采用帖间编码。
[030引进一步地,如图14所示,所述视频处理装置1还包括获取单元16 ;
[0309] 所述获取单元16,用于获取当前图像,所述当前图像为所述待编码视频中至少一 幅图像;
[0310] 所述选取单元11,还用于从所述知识库中选择所述当前图像的至少一幅参考图 像;
[0311] 所述处理单元14,还用于根据所述选取单元11选择出的至少一幅参考图像对所 述当前图像进行编码。
[0312] 进一步地,所述当前图像至少包括所述待编码视频中至少一个随机访问点所在的 图像。
[0313] 进一步地,所述处理单元14,还用于将所述当前图像和所述知识库中至少一幅图 像进行相似度比较;
[0314] 所述选取单元11,还用于选取相似度超过第五预设阔值的N幅图像作为当前图像 的参考图像,其中N为大于等于1的整数。
[0315] 本发明实施例提供一种视频处理装置,包括分割单元、选取单元和存储单元。视 频处理装置将待编码视频分割为至少两段场景,并将各段场景划分为至少两个场景类别, 然后,视频处理装置从至少两个场景类别中的至少一个场景类别中分别选取出至少一幅图 像,最后,视频处理装置保存选取出的图像,W生成知识库。
[0316] 从上面可W看出,本发明实施例中的知识库是视频处理装置根据待编码视频生成 的,因此,该知识库与待编码视频之间的相关性较高。另外,视频处理器装置是将待编码视 频进行分割,并划分为至少两个场景类别,然后根据场景类别的划分,从至少一个场景类别 中选取图像的。视频处理装置从场景类别的角度出发,选取图像,并将选取出的图像存储至 知识库,有效地降低了图像库中数据之间的冗余度。该样,本发明技术方案解决了目前图像 库中数据冗余较大,与待编码视频相关性较低的问题。进而,有效的解决了视频编码效率较 低的问题。
[0317] 实施例六
[031引本发明实施例提供一种视频处理器,如图15所示,该视频处理器包括通信接口 20、处理器21、存储器22和系统总线23,其中,
[0319] 通信接口 20、处理器21和存储器22之间通过系统总线23连接并完成相互间的通 信。
[0320] 处理器21可能为单核或多核中央处理器,或者为特定集成电路,或者为被配置成 实施本发明实施例的一个或多个集成电路。
[0321] 存储器22可W为高速RAM(RandomAccessMemo巧,随机存储器)存储器,也可W 为非易失性存储器(non-volatilememcxry),例如,至少一个磁盘存储器。
[0322] 具体的,处理器21,用于将待编码视频分割为至少两段场景,W及用于将各段场景 划分为至少两个场景类别,W及用于从所述至少两个场景类别中的至少一个场景类别中分 别选取出至少一幅图像。
[0323] 具体的,存储器22,用于保存所述处理器21选取出的图像,W生成知识库。
[0324] 进一步地,所述选取出的图像中任意两幅图像之间的相似度低于第一预设阔值。
[0325] 进一步地,所述处理器21,具体用于将每段场景划分为一个场景类别,或者具体用 于检测至少一段场景和其不相邻场景的相似度,并将相似度大于或等于第二预设阔值的场 景划分为同一个场景类别。
[0326] 进一步地,所述处理器21,具体用于从各段场景中分别选取一幅代表图像。
[0327] 进一步地,所述处理器21,用于计算任意两段不相邻场景的代表图像之间的相似 度;所述相似度使用两幅图像之间的图像差、特征描述子相似度或运动补偿残差中的一种 来衡量。
[032引进一步地,所述处理器21,具体用于选取第一场景类别中任意一段场景的第一预 设位置的图像,所述第一场景类别为所述至少一个场景类别中的任意一个场景类别,W及 具体用于根据所述第一场景类别中各段场景的活动性选取图像,所述活动性使用运动矢量 强度、图像差、运动补偿残差或者图像特征变化中的至少一种来衡量;其中,所述图像特征 至少包括亮度直方图、色度直方图、特征描述子中的一种,所述特征描述子至少包括尺度不 变转换SIFT特征描述子、加速稳健特征SURF特征描述子中的一种。
[0329] 进一步地,所述第一预设位置属于所述待编码视频中的随机访问点。
[0330] 进一步地,所述处理器21,还用于对选取出的图像进行编码,生成重建图像。
[0331] 进一步地,所述存储器22,具体用于保存所述处理器21生成的重建图像,W生成 知识库。
[0332] 进一步地,所述处理器21,还用于计算所述第一场景类别中每段场景的活动性。
[0333] 进一步地,所述处理器21,用于根据每段场景的活动性,确定每段场景中需要选取 图像的数量,W及用于采用第一预设选取规则,在每段场景中选取图像,所述选取图像的数 量与所述需要选取图像的数量相同。
[0334] 进一步地,当第一场景类别中只包含有一段场景,且在该段场景中需要选取图像 的数量为零时,则将所述第一场景类别需要选取图像的数量修改为一;
[0335] 当所述第一场景类别中包含至少两段场景,且所有场景中需要选取图像的数量均 为零时,则将所述第一场景类别中其中一段场景需要选取图像的数量修改为一。
[0336] 进一步地,每段场景中需要选取图像的数量和该段场景的活动性呈单调递增关 系,但每段场景中需要选取图像的数量不超过第=预设阔值。
[0337] 进一步地,所述处理器21,还用于根据选取图像的数量,等间隔或近似等间隔地从 场景中选取出相应数量的图像。
[033引进一步地,所述处理器21,还用于计算所述第一场景类别中位于第二预设位置的 图像的活动性,W及还用于根据各个位于第二预设位置的图像的活动性和第二预设选取规 贝1J,选取所述第一场景类别中的图像。
[0339] 进一步地,所述处理器21,还用于从第一幅位于第二预设位置的图像开始,累积各 幅位于第二预设位置的图像的活动性;
[0340] 所述处理器21,还用于当活动性累积达到第四预设阔值时,选取对应位置的图像。
[0341] 进一步地,所述第二预设位置属于所述待编码视频中的随机访问点。
[0342] 进一步地,所述选取出的图像属于所述待编码视频中的随机访问点所在的图像。
[0343] 进一步地,所述待编码视频中的随机访问点所在的图像采用帖内编码,或者仅参 考知识库中的至少一幅图像采用帖间编码。
[0344] 进一步地,所述处理器21,用于获取当前图像,所述当前图像为所述待编码视频中 至少一幅图像,W及还用于从所述知识库中选择所述当前图像的至少一幅参考图像,W及 还用于根据至少一幅参考图像对所述当前图像进行编码。
[0345] 进一步地,所述当前图像至少包括所述待编码视频中至少一个随机访问点所在的 图像。
当前第5页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1