图像处理方法、装置及计算机可读介质与流程

文档序号:19104946发布日期:2019-11-12 22:34阅读:129来源:国知局
本发明涉及图像处理技术,尤其涉及一种图像处理方法、装置及计算机可读介质。
背景技术
::目前,随着互联网视频信息的日益丰富,用户经常在持有的终端(如笔记本电脑、平板电脑和智能手机)上观看视频节目,为了帮助视频应用在用户终端(如智能手机、平板电脑)快速了解视频节目,在用户运行智能手机的视频应用(如腾讯视频)时,视频应用会向视频服务器请求可以观看的视频节目的相关信息(包括视频节目的名称、分类信息、时长以及截图),并在智能手机的显示界面中呈现视频服务器返回的视频节目的相关信息,其中截图可以帮助用户对视频节目形成快速的直观了解(了解节目中有哪些人物),便于用户根据截图对视频节目中的人物和情节形成了解,以选取期望观看的视频节目;相关技术在形成视频节目的截图时存在的问题是:1)视频节目的数量快速增长,依靠人工在视频节目中选取承载特定对象(如人物、景点和建筑等)的截图需要耗费大量的人力,并且难以在视频节目上线时迅速获取截图以在视频应用的显示界面中呈现给用户,降低了视频应用呈现视频节目的截图的时效性;2)采取的从视频节目中自动获取截图的处理方案,首先,提取截图的运算量大,导致无法及时对新上线的视频节目形成截图;综上所述,相关技术对应精确快速地获取视频节目中承载有特定对象的截图,尚无有效解决方案。技术实现要素:本发明实施例提供一种图像处理方法、装置及计算机可读介质,能够高效精确获取视频中承载有特定对象的截图。本发明实施例的技术方案是这样实现的:本发明实施例提供一种图像处理方法,所述方法包括:对视频进行解码处理得到帧图像,对得到的帧图像进行分区处理得到分区图像;对得到的每个分区图像进行迭代处理,所述迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行至少一次分类处理,以及在所述分类处理判定所述分区图像具有对象时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的对象特征点向量进行至少一次校准处理;从所述分区图像提取特征向量,基于提取的所述分区图像的特征向量,以及所述迭代处理后得到的所述分区图像的对象特征点向量确定所述分区图像的得分;基于所述分区图像的得分对所述分区图像进行对象判决,并基于判决结果确定具有所述对象的候选帧图像。本发明实施例提供一种图像处理装置,所述图像处理装置包括:解码分区单元,用于对视频进行解码处理得到帧图像,对得到的帧图像进行分区处理得到分区图像;迭代处理单元,用于对所述得到的每个分区图像进行迭代处理,所述迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行至少一次分类处理,以及在所述分类处理判定所述分区图像具有对象时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的对象特征点向量进行至少一次校准处理;评分单元,用于从所述分区图像提取特征向量,基于提取的所述分区图像的特征向量,以及所述迭代处理后得到的所述分区图像的对象特征点向量确定所述分区图像的得分;判决单元,用于基于所述分区图像的得分对所述分区图像进行对象判决,并基于判决结果确定具有对象的候选帧图像。本发明实施例提供一种计算机可读介质,存储有计算机可执行指令,用于引起至少一个处理器执行本发明实施例提供的图像处理方法。本发明实施例的技术方案能够普遍应用于视频中各种对象(如人脸、物体)的识别,从视频中截取到承载有对象的候选帧图像;例如当对象为人脸时,基于分类回归模型进行了迭代处理,其中分类校准模型的第一分支的节点用于对分区图像进行分类处理,第二分支的节点用于对分区图像的人脸特征点(对象特征点)向量进行校准,使人脸特征点向量能够准确反映人脸的特征点(如五官)在分区图像(以及帧图像)中的位置;也即是说,在利用分类校准模型对分区图像进行分类的同时也对分区图像的人脸特征点(如五官)进行了定位,对于分区图像中的人脸的识别和对分区图像中五官的定位可以通过对分类校准模型的迭代处理(包括校准处理和分类处理)一并完成,这较相关技术首先基于特定模型进行人脸的识别,然后基于另一特定模型进行五官的定位明显提升了人脸(对象)识别和五官(对象特征点)定位的处理效率,能够从视频中实时获取具有人脸的截图;在人脸检测和五官校准的过程中,五官校准的信息会影响人脸判断,在进行人脸检测的过程也同时进行了五官校准,使人脸检测和五官校准的耗时大幅缩减,处理效率高。附图说明图1是本发明实施例中图像处理方法的实现流程示意图一;图2是本发明实施例中分区图像的示意图一;图3是本发明实施例中分区图像的示意图二;图4是本发明实施例中分类校准模型的示意图图一;图5是本发明实施例中人脸特征点向量的图形化表示示意图;图6是本发明实施例中图像处理方法的实现流程示意图二;图7是本发明实施例中图像处理方法的实现流程示意图三;图8是本发明实施例中图像处理方法的实现流程示意图四;图9是本发明实施例中分类校准模型的示意图图二;图10是本发明实施例中图像处理方法的实现流程示意图五;图11是本发明实施例中分区图像同步分类和校准处理的示意图;图12是本发明实施例中图像处理方法的实现流程示意图六;图13是本发明实施例中图像处理方法的应用场景示意图;图14是本发明实施例中图像处理方法的实现流程示意图七;图15是本发明实施例中图像处理装置的功能结构示意图一;图16是本发明实施例中图像处理装置的功能结构示意图二。具体实施方式以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。本发明以下各实施例以图像中待识别的对象为人脸为例进行说明,需要指出的是,基于本发明提出的以下各实施例记载的技术方案,本领域技术人员能用于实施对视频中的其他类型的对象(如物体、动物、建筑等)的识别,因此,因此本发明提出的以下实施例对视频中人脸的识别不构成对本发明实施例记载技术方案识别对象类型的限定。实施例一本实施例记载一种图像处理方法,如图1所示,包括以下步骤:步骤S101,对视频进行解码处理得到帧图像,对得到的帧图像进行分区处理得到分区图像。对视频进行解码的方式取决于视频数据的编码方式,常见的编解码标准有国际电联的H.261、H.263、H.264,运动静止图像专家组的M-JPEG和国际标准化组织运动图像专家组的MPEG系列标准等,基于上述编解码标准可以得到构成视频的帧图像。鉴于人脸位于帧图像中间位置的情况较多,通常,如图2所示,可以将帧图像100的中间区域划分出一分区图像150,并将帧图像剩余的区域或划分为分区图像110至分区图像140,分区图像的数量视帧图像的尺寸以及分辨率确定;当然,帧图像的划分方式不仅限于以上所述,如图3所示,可以将帧图像100从其他起始区域(不包括帧图像的中间区域)划分为特定大小的分区图像110至分区图像160。同一视频的帧图像在划分时,可以采用统一的分割标准,例如将构成视频的所有帧图像划分为相同大小的分区图像,当然,不同的帧图像之间也可以采用不同的划分标准;对于一个帧图像进行划分时,可以将帧图像划分为相同大小的帧图像;也可以如图2和图3所示,将帧图像划分为大小不等的分区图像。步骤S102,对得到的每个分区图像进行T次迭代处理。对于将帧图像划分得到的分区图像,需要利用多个分类校准模型进行T次(T为大于1的整数)迭代处理,分类校准模型是一种包括多个节点的弱分类器,分类校准模型的一个示例如图4所示,每个节点都可以具有分类属性信息(使用F1至F6标识)和校准属性信息(使用J1至J6标识),节点的分类属性信息彼此不同,节点的校准属性信息也不相同。图4示出的分类校准模型既可以用于对分区图像进行分类处理,也可以用于对分区图像的人脸特征点向量进行校准,每次迭代处理使用分类校准模型一个分支的节点,每个分支的节点以Stage1的根节点为起始节点,经过Stage2的一个叶节点并以Stage3对应的叶节点结束,第一分支节点的一个示例为根节点F1|J1->叶节点F2|J2->叶节点F4|J4,第二分支节点的另一个示例为根节点F1|J1->叶节点F3|J3->叶节点F6|J6,可以看出在一个分类校准模型中,不同的分支节点均以根节点为开始,以不同的叶节点结束;需要说明的是,上述的第一分支节点和第二分支节点并未特指分类校准模型中的第一个分支节点和第二个分支节点,而是指分类校准模型中不同的两个节点的分支(具有相同的根节点)。下面分别对分区图像进行分类处理以及对分区图像的人脸特征点向量进行校准进行说明。1)对分区图像进行分类处理对分区图像进行分类处理的最终结果是判定分区图像具有人脸或分区图像不具有人脸,从而能够筛除划分帧图像得到的分区图像中不具有人脸的分区图像,如图2中的分区图像110、120、130、140、160、170、180和190,以及图3中的分区图像110、120和150。在一次迭代处理中图4的某一分支节点仅用于进行分类处理或校准处理,也就是说在一次迭代处理中,仅使用分支节点的分类属性信息或校准属性信息(而不是在一次迭代处理中同时使用分支节点的分类属性信息和校准属性信息),例如,如果使用图4中第一分支节点对分区图像(第一分支节点和第二分支节点并非预先确定,关于第一分支节点和第二分支节点的确定将在后续说明)进行分类处理,那么将使用第一分支节点的分类属性信息F1->F2->F4对分区图像进行分类处理,最终使用第一分支节点的叶节点的分类属性信息F4对分区图像是否具有人脸进行判决。2)对分区图像的人脸特征点向量进行校准所谓人脸特征点向量是指,人脸的特征点(如鼻子、眼睛和嘴的)的向量(对应特征点的二维坐标)表示,对于将帧图像划分得到的每个分区图像都对应有一个初始的人脸特征点向量,初始的人脸特征向量基于以下假设条件:如图4所示,人脸恰好占据分区图像的分布区域,并且人脸以正面和垂直的方式分布于分区图像的分布区域,那么对应的人脸特征点向量的图形化表示如图5中的特征点所示(图5中仅示出对应人脸五官的八个特征点,实际应用中特征点的数量不仅限于八个);但是,实际获取的分区图像中不全部包括人脸(对应未包括人脸的情况在后续说明),即使分区图像包括人脸,人脸在分区图像中分布也难以满足上述的假设条件,因此,需要利用分类校准模型的校准属性信息对分区图像的特征点向量进行校准处理,确定出对应所述分区图像的人脸特征点向量的校准偏移量,使用校准偏移量对人脸特征点向量进行校准(校准偏移量包括在节点的校准属性信息中,每个节点的校准属性信息中包括的校准偏移量不同),从而使校准后的人脸特征点向量能够准确反映人脸的特征点(如五官)在分区图像中的分布位置。如果使用图4中第二分支节点对分区图像的人脸特征点向量进行分类处理,那么将使用第二分支节点的校准属性信息J1->J3->J6对分区图像的人脸特征点向量进行分类处理,最终使用第二分支节点的叶节点的分类属性信息J6中包括的校准偏移量对分区图像的人脸特征向量进行校准。在T次迭代处理的起始几次(如前T/2)次的迭代处理中,由于分区图像中不具有人脸的数量较多,因此以对分区图像进行分类处理为主(例如在第一次迭代处理中对分区图像进行分类处理,相应地,图4中示出的第一层次Stage1的节点可以不具有校准属性信息),从而能够有效筛除不具备人脸的分区图像,在后T/2次的迭代处理中以对分区图像的人脸特征点向量进行校准为主(例如在第三次迭代处理中对分区图像进行分类处理,相应地,图4中示出的Stage3的节点可以不具有分类属性信息),由于经过前T/2次的迭代处理后得到的分区图像多数具有人脸,因此在后T/2次迭代过程中对分区图像的人脸特征点向量进行校准处理的效率较高;上述说明仅为示例,实际应用中,在后T/2次的迭代处理中也可能执行对分区图像的分类处理,在前T/2次的迭代处理中也可能对分区图像的人脸特征点向量进行校准处理。步骤S103,从所述分区图像提取特征向量。步骤S104,基于提取的所述分区图像的特征向量,以及所述T次迭代处理后得到的所述分区图像的人脸特征点向量(对象特征点向量)确定所述分区图像的得分。分区图像的得分实质是每次迭代处理后计算的分区图像的得分的累加,在每次迭代处理中,利用分区图像遍历K(K为大于1的整数)个分类回归模型的某一个分支的节点,例如前述的利用对第一分支的节点的分类属性信息对分区图像进行分类处理,或者,利用第二分支的节点的校准属性信息对分区图像的人脸特征点向量进行校准,对于每次迭代处理完成后,利用分区图像的特征向量、以及上次迭代处理完成后分区图像的人脸特征点向量(如当前在计算第t次迭代处理过程完成后分区图像的得分,则使用第t-1次迭代处理过程完成后分区图像的人脸特征点向量)确定分区图像的得分,第t次迭代处理中利用第k分类校准模型进行处理(分离处理或校准处理)后分区图像的得分如公式(1)所示:其中,St-1为第t-1次迭代处理过程完成后分区图像的人脸特征点向量,为第t次迭代处理中利用的第k分类校准模型。第t次迭代处理完成后分区图像的得分ft为利用K个分类校准模型(设每次迭代处理遍历K个分类校准模型)对分区图像进行处理(分类处理或校准处理)后的得分的累加,如公式(2)所示:相应地,T次迭代处理完成后分区图像的得分f为T次迭代处理中每次迭代处理完成后分区图像的得分的累加,如公式(3)所示:由于分区图像的得分不仅基于从分区图像提取的特征向量,还基于分区图像的特征点校准后对应的人脸特征点向量结合来确定分区图像的得分,这就较单一使用分区图像的特征向量确定分区图像的得分,使分区图像的得分更加准确描述分区图像具有人脸的概率,分区图像的得分越高则具有人脸的概率越高。步骤S105,基于所述分区图像的得分对所述分区图像进行人脸判决,并基于判决结果确定具有人脸(对象)的候选帧图像。使用分区图像的得分与得分阈值进行比较,若分区图像的得分高于得分阈值则表征分区图像具有人脸,若分区图像的得分小于或等于得分阈值则表征分区图像不具有人脸;对于构成帧图像的所有分区图像进行上述判决处理之后,可以确定帧图像中具有人脸的分区图像,如果某一帧图像的分区图像中具有人脸,则该帧图像为视频的潜在最优截图,也即是候选帧图像。本实施例中基于分类回归模型进行了迭代处理,其中分类校准模型的第一分支的节点用于对分区图像进行分类处理,第二分支的节点用于对分区图像的人脸特征点向量进行校准,使人脸特征点向量能够准确反映人脸的特征点(如五官)在分区图像(以及帧图像)中的位置;也即是说,在利用分类校准模型对分区图像进行分类的同时也对分区图像的人脸特征点(如五官)进行了定位,对于分区图像中的人脸的识别和对分区图像中五官的定位可以通过对分类校准模型的迭代处理一并完成,例如在分类处理判定不具备人脸时则退出对当前分区图像的处理并继续对下一分区图像进行迭代处理,如果在迭代处理(可以多次迭代)中总是判定分区图像具有人脸,则可以继续在对分区图像进行校准的迭代处理,通过利用分类校准模型实现了对分区图像的人脸识别和五官定位的一次性处理,这较相关技术首先基于特定模型进行人脸的识别,然后基于另一特定模型进行五官的定位明显提升了人脸识别和五官定位的处理效率,能够从视频中实时获取具有人脸的截图。实施例二本实施例对实施例一中的分类处理和校准处理进行说明。如图6所示,对分区图像进行第t次迭代处理(t取值满足1≤t≤T),可以通过以下步骤实现:步骤S201,确定所述第t次迭代处理的处理类型。鉴于将帧图像划分为分区图像后不具有人脸的分区图像最多(较进行分类处理筛除不具有人脸的分区图像之后),因此在T次迭代处理过程中,对于排序靠前的迭代处理过程倾向于基于分类校准模型某一分支(设为第一分支)的节点的分类属性信息进行分类处理,以筛除不具有人脸的分区图像,从而,对于排序靠后的迭代处理过程倾向于基于分类校准模型某一分支(设为第二分支)的节点的校准属性信息对分区图像的人脸特征点向量进行校准处理,从而实现分区图像的特征点(如五官)的定位;需要指出的是,如果对于某一分区图像的分类处理中判定该分区图像不具有人脸,则停止对该分区图像的处理(即不需要再进行校准处理,因为如果分区图像不具有人脸,自然也就没有必要对分区图像的进行校准以确定特征点如五官的位置以及五官定位)。基于上述分析,如图7所示,步骤S201中确定第t次迭代处理的处理类型可以通过以下步骤实现:步骤S2011,基于t确定第t次迭代处理的分类处理概率和校准处理概率。其中,所述分类处理概率与t正相关,可以采用任意具有正相关特性的函数表征t与分类处理概率P的关系,一个示例如公式(4)所示:p(t)=1-0.1t(4)步骤S2012,若所述分类处理概率大于所述校准处理概率,则确定所述第t次迭代处理的处理类型为利用所述分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行分类处理。基于公式(4),由于t的取值为1至T,当t为1时,也就是执行第1次迭代处理时,由于分类处理概率P为0.9,相应地校准处理概率为1-P也即0.1,在t取值为1至4时分类处理的概率P均大于校准处理的概率1-P,因此判定在第1至4次迭代处理中利用分类校准模型的第一分支(并非特指第一个分支,实际上第1至4次迭代处理使用的第一分支也不同)的节点的分类属性信息对分区图像进行分类处理。步骤S2013,若所述分类处理概率小于或等于所述校准处理概率,则确定所述第t次迭代处理的处理类型为利用所述分类校准模型的第二分支(与第一分支不同的分支)节点的校准属性信息对所述分区图像的人脸特征点向量进行校准处理。基于公式(4),当t取值大于或等于5时,分类处理的概率P等于或小于校准处理的概率1-P,因此判定在从第5次迭代处理开始利用分类校准模型的第二分支(实际上从第5次迭代处理开始每次迭代使用的第二分支也不同)节点的校准属性信息对分区图像的人脸特征量进行校准处理。步骤S202a,第t次迭代处理的处理类型为分类处理时,利用所述分类校准模型的第一分支节点的分类属性信息对所述分区图像进行分类处理。步骤S202b,第t次迭代处理的处理类型为校准处理时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的人脸特征点向量进行校准处理。对于每次迭代处理均执行步骤S201的判断处理,并基于判定的迭代处理类型对应执行步骤S202或步骤S203,直至完成对分区图像的T次迭代处理;如果在某一次迭代处理中利用分类校准模型对分区图像进行分类处理时判定分区图像不具备人脸,则终止对该分区图像的迭代处理,并对帧图像的下一个分区图像开始T次迭代处理,直至对帧图像的所有分区图像处理完毕。实施例三本实施例基于实施例二,对实施例二中记载的利用分类校准模型节点的第一分支的分类属性信息对分区图像进行分类处理、以及实施例二中记载的利用分类校准模型节点的第二分支的校准属性信息对分区图像的人脸特征点向量进行校准处理进行说明。如图8所示,进行第t次迭代处理时,基于实施例二记载的判断迭代处理的处理类型的判断方式,如果判断出第t次迭代处理的处理类型为利用分类校准模型节点第一分支的分类属性信息对分区图像进行分类处理(分类处理的最终结果是判定分区图像具有人脸或不具有人脸),可以通过以下步骤实现:步骤S301,利用基于分区图像提取的特征向量、以及第t-1次迭代处理后得到的人脸特征点向量确定分区图像的得分。也就是确定第t-1次迭代处理后分区图像的得分ft,基于公式(2),设每次迭代处理遍历的分类回归模型的数量为K,则第t-1次迭代处理完成后分区图像的得分(也就是说,分区图像在前t-1次的迭代处理中判定为具备人脸)如公式(5)所示:m的取值范围满足1≤m≤t-1,其中m为1时Sm-1为预设的初始人脸特征点向量;步骤S302,比较所述分区图像的得分与所述分类校准模型节点的分类属性信息中的分类得分阈值,基于比较结果确定所述第一分支。本实施例基于图9示出的分类校准模型进行说明,如图9所示每个节点具有进行分类判断时选择分支节点的分类得分阈值(以C表征)和进行校准时选择分支节点的校准得分阈值(以R表征),每个分支节点的分类属性信息中还具有选择分支在下一个stage的节点的判断逻辑:在Stage1,以根节点(C:25∣R:16)为例,如果当前的第t次迭代处理的处理类型为分类处理,在Stage1,根节点(C:25∣R:16)对应的判断逻辑为如果分区图像的得分x1<20(分类得分阈值为20的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:8),如果分区图像的得分x1>=20(分类得分阈值为20的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:22);在Stage2,叶节点(C:25∣R:8)的判断逻辑为如果分区图像的得分x1<25(分类得分阈值为25的判断逻辑),则分支的下一个节点为叶节点(C:6∣R:6),如果分区图像的得分x1>=25(分类得分阈值为25的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:16);叶节点(C:25∣R:8)的判断逻辑为如果分区图像的得分x1<25(分类得分阈值为25的判断逻辑),则分支的下一个节点为叶节点(C:6∣R:6),如果分区图像的得分x1>=25(分类得分阈值为25的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:16);步骤S303,第一分支的末端叶节点输出的得分与前t-1次迭代处理中分区图像的得分的累加值作为新的得分(参见公式(5)),与人脸的得分阈值比较来判断是否具有人脸。在第t次迭代处理时,如果对分区图像进行分类处理时使用的第一分支的节点,基于所述第一分支的末端叶节点输出的得分与前t-1次迭代处理中分区图像的得分的累加值作为新的得分(参见公式(5)),与人脸的得分阈值比较,如果大于得分阈值则分区图像具有人脸,否则分区图像不具有人脸。如图10所示,进行第t次迭代处理时,基于实施例二记载的判断迭代处理的处理类型的判断方式,如果判断出第t次迭代处理的处理类型为利用分类校准模型节点第二分支的校准属性信息对分区图像的人脸特征点向量进行校准处理处理(校准处理的最终结果是使人脸特征点向量能够准确表征人脸的特征点如五官在分区图像中的位置分布),可以通过以下步骤实现:步骤S401,利用基于分区图像提取的特征向量、以及第t-1次迭代处理后得到的人脸特征点向量确定分区图像的得分。也就是确定第t-1次迭代处理后分区图像的得分ft,基于公式(2),设每次迭代处理遍历的分类回归模型的数量为K,则第t-1次迭代处理完成后分区图像的得分(也就是说,分区图像在前t-1次的迭代处理中判定为具备人脸)如公式(5)所示:m的取值范围满足1≤m≤t-1,其中m为1时Sm-1为预设的初始人脸特征点向量;步骤S402,比较所述分区图像的得分与所述分类校准模型节点的分类属性信息中的分类得分阈值,基于比较结果确定所述第二分支节点。本实施例基于图9示出的分类校准模型进行说明,如图9所示每个节点具有进行分类判断时选择分支节点的分类得分阈值(以C表征)和进行校准时选择分支节点的校准得分阈值(以R表征),每个分支节点的分类属性信息中还具有选择分支在下一个stage的节点的判断逻辑:在Stage1,以根节点(C:25∣R:16)为例,如果当前的第t次迭代处理的处理类型为校准处理,在Stage1,根节点(C:25∣R:16)对应的判断逻辑为如果分区图像的得分x2<16(校准得分阈值为16的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:8),如果分区图像的得分x2>=16(校准得分阈值为16的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:22);在Stage2,叶节点(C:25∣R:8)的判断逻辑为如果分区图像的得分x2<8(校准得分阈值为8的判断逻辑),则分支的下一个节点为叶节点(C:6∣R:6),如果分区图像的得分x2>=8(校准得分阈值为8的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:16);叶节点(C:25∣R:8)的判断逻辑为如果分区图像的得分x2<8(校准得分阈值为8的判断逻辑),则分支的下一个节点为叶节点(C:6∣R:6),如果分区图像的得分x1>=8(校准得分阈值为8的判断逻辑),则分支的下一个节点为叶节点(C:25∣R:16);以此类推,可以确定在第t次迭代处理时,如果对分区图像进行校准处理时使用的第二分支,第二分支的末端叶节点指示了该分区图像的人脸特征向量的校准偏移量△S,图9中可以看出不同第二分支的末端叶节点指示的校准偏移量不同。步骤S403,基于所述校准偏移量对第t-1次迭代处理后得到的所述人脸特征点向量进行校准,得到第t次迭代处理后所述分区图像的人脸特征点向量。在T次迭代处理后得到的人脸特征点向量能够准确表征人脸特征点在分区图像中的位置,如图11所示,在T次迭代处理过程中,通过分类处理将不具有人脸的分区图像进行筛除,并使具有人脸的分区图像的人脸特征点向量不断得到校准,能够在T次迭代处理完成后准确表征人脸特征点在分区图像中的位置。实施例三本实施例基于实施例一和实施例二,对分类校准模型和分区图像的获取方式进行说明。分类校准模型采用查找表(LUT,look-uptable)与经典AdaBoost分类器相结合的lutAdaboost分类器,对图形库中的图像进行训练得到,包括得到分类校准模型中每个节点的分类属性信息(包括分类得分阈值和基于分类得分阈值的判断逻辑)和校准属性信息(包括校准得分阈值和基于校准得分阈值的判断逻辑);对于分类校准模型分支的末端叶节点的校准属性信息中的校准偏移量,可以采用以下训练方式:首先,对分区图像x初始化1个人脸特征点向量,人脸特征点向量表征人脸的特征点如五官在分区图像中的位置分布;其次,基于初始化的人脸特征点向量,提取每个人脸特征点的SRFern特征记作xFeatures;再次,计算初始化的人脸特征点向量与预先人工标识的人脸特征点对应的人脸特征点向量的差值△S,训练一个函数R()满足公式(6):△S=R(xFeatures,St-1)(6)第t次迭代处理后分区图像x的人脸特征点向量与第t-1次迭代处理后分区图像x的人脸特征点向量用公式(7)表示:St=St-1+Rt(xFeatures,St-1),t=1,...,T.(7)其中Rt(x,St-1)为回归函数模型,T是迭代次数,对于分区图像x的偏移量具体如公式(8)所示:W为线性回归参数矩阵,Φ代表SRFern特征提取函数。上述的基于初始化的人脸特征点向量,提取每个人脸特征点的SRFern特征记作xFeatures,如图12所示,可以通过以下步骤实现:步骤S501,对分区图像进行至少一个尺度的调整得到调整后分区图像。步骤S502,从分区图像中提取与人脸特征点向量中的每个人脸特征点的相邻的两个像素点。步骤S503,基于所提取的两个像素点在分区图像、以及调整后分区图像的像素偏移的差值确定特征向量的一个维度。以缩小调整为例,可以从以下缩小尺度(1/2、1/4、1/8)随机选择一个尺度对分区图像进行调整,对人脸特征点向量S(S为2维向量表示的L个人脸特征点)中的每一个特征点依次进行下面的操作:对于每个一个特征点,随机选择特征点相邻(或一定距离)的两个像素点,使用原始分区图像(未缩放)相同比例位置的像素点减去选择出来的两个像素点,得到两个像素偏移,最后将两个像素偏移的差值作为该特征点的一个特征值;对于每个特征点进行N次上面的操作,可以得到特征点的N个特征值,即可构成一个SRFern向量特征,L个特征点的L个SRFern向量构成分区图像的人脸特征点向量SRFerns,SRFerns是一种简化的特征,能够加快T次迭代处理的执行效率,便于迅速进行人脸识别和五官定位,同时,SRFerns对噪声的鲁棒性更好,使对人脸的检测更加准确。实施例四本实施例基于前述实施例,对构成视频的各帧图像的进行分区处理得到分区图像,对分区图像进行人脸识别和五官定位以后,可以确定视频的帧图像(也就是视频截图)中具有人脸的候选帧图像,并在候选帧图像中筛选出最优的帧图像作为视频的最优帧图像(也就是最优截图),这样在视频上线时,如图13所示,当用户持有终端300(如智能手机、平板电脑)访问视频门户网站时,网站后台服务器200会将视频(如用户请求的分类视频,或后台服务器200自动推送的推荐视频)的信息,包括视频内容、时长以及视频截图发送至终端,由终端中运行的客户端(如腾讯视频)呈现视频截图以及相关信息,便于用户对视频信息形成快速了解,当用户确定观看某一视频时,由终端300中运行的客户端向服务器200请求视频数据,并基于服务器200返回的视频数据进行解码播放。上述处理中服务器200向终端300中运行的客户端返回的视频的截图,是由服务器200基于视频数据库400新上线的视频进行上述实施例记载的处理得到候选帧图像,并基于候选帧图像进行筛选得到,如图14所示,基于候选帧图像筛选得到最优帧图像可以通过以下步骤实现:步骤S601,基于候选帧图像的各分区图像对应的人脸特征点向量,确定候选帧图像中的人脸区域。由于人脸特征点向量描述了人脸的特征点在分区图像中的位置,因此通过具有人脸的分区图像对应的人脸特征点向量,能够确定人脸在整个帧图像的占用的区域,如图3中的帧图像100的分区图像110、120和150会在前述的T词迭代处理中被判定为不具有人脸,而分区图像130、140和160被判定为具有人脸并定位了特征点(特征点在分区图像中的位置使用分区图像的人脸特征点向量表征)步骤S602,利用人脸筛选策略对候选帧图像进行筛选得到最优帧图像。下面结合示例对步骤S602进行说明:示例1)筛除满足以下条件至少之一候选帧图像:条件1)候选帧图像中的人脸的数量的超出人脸数量阈值,当候选帧图像中人脸的数量较多时往往会导致候选帧图像中的人脸的辨识性降低,无法保证用户能够准确辨识候选帧图像中的人脸;条件2)候选帧图像的人脸的占比小于占比阈值,表明人脸在候选帧图像中的占用的区域较小,难以保证用户能够辨识人脸。示例2)筛除满足以下条件至少之一候选帧图像:条件1)所述候选帧图像中的人脸位于边缘区域,基于黄金分割原理,最优帧图像中人脸应该位于帧图像的中间区域或位于黄金分割点位置,如果人脸位于候选帧图像的边缘区域,则降低了候选帧图像的美观程度;条件2)所述候选帧图像中的人脸区域长宽比例小于比例阈值时,表明人脸的呈现角度不端正或人脸不完整,如比例大于2:1时往往是人脸不完整,降低了人脸的可辨识度,筛除所述候选帧图像示例3)当基于人眼状态分类模型对人脸的眼部区域像素信息进行处理确定所述候选帧图像中人脸的人眼状态处于闭合状态时,筛除所述帧图像。分区图像的人脸特征点向量描述了人脸特征点的位置(坐标),通过将相应特征点的坐标以及灰度信息输入训练的人眼状态分类模型(用户识别人眼是闭合还是睁开),如果人眼处于闭合状态则筛除候选帧图像。当利用上述方式确定出两个以上候选帧图像时,还可以基于候选帧图像的轮廓清晰度选取最优帧图像,候选帧图像的轮廓清晰度可以通过图像边缘检测Sobel算子来计算得到,并对最优帧图像进行对比度增强、饱和度增强以及肤色处理等美化处理,提升最优帧图像的视觉效果。实施例五本实施例记载一种计算机可读介质,可以为ROM(例如,只读存储器、FLASH存储器、转移装置等)、磁存储介质(例如,磁带、磁盘驱动器等)、光学存储介质(例如,CD-ROM、DVD-ROM、纸卡、纸带等)以及其他熟知类型的程序存储器;所述计算机可读介质中存储有计算机可执行指令,当执行所述指令时,引起至少一个处理器执行包括以下的操作:对视频进行解码处理得到帧图像,对得到的帧图像进行分区处理得到分区图像;对得到的每个分区图像进行迭代处理,所述迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行至少一次分类处理,以及在所述分类处理判定所述分区图像具有人脸时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的人脸特征点向量进行至少一次校准处理;从所述分区图像提取特征向量,基于提取的所述分区图像的特征向量,以及所述迭代处理后得到的所述分区图像的人脸特征点向量确定所述分区图像的得分;基于所述分区图像的得分对所述分区图像进行人脸判决,并基于判决结果确定具有人脸的候选帧图像。实施例六本实施例记载一种图像处理装置,可以设置于前述实施例五记载的服务器,用于在用户通过终端中运行的客户端请求视频信息时,基于视频获取最优帧图像作为视频截图,连通视频的相关信息发送至客户端,供用户基于视频截图对视频内容形成准确快速了解。如图15所示,本实施例记载的图像处理装置500包括:解码分区单元510,用于对视频进行解码处理得到帧图像,对得到的帧图像进行分区处理得到分区图像;迭代处理单元520,与迭代处理单元520连接,用于对所述得到的每个分区图像进行迭代处理,所述迭代处理包括利用分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行至少一次分类处理,以及在所述分类处理判定所述分区图像具有人脸时,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的人脸特征点向量(对象特征点向量)进行至少一次校准处理;评分单元530,与迭代处理单元520连接,用于从所述分区图像提取特征向量,基于提取的所述分区图像的特征向量,以及所述迭代处理后得到的所述分区图像的人脸特征点向量确定所述分区图像的得分;判决单元540,与评分单元530连接,用于基于所述分区图像的得分对所述分区图像进行人脸判决,并基于判决结果确定具有人脸(对应对象)的候选帧图像。作为一个示例,迭代处理单元520包括:类型确定模块5201,用于在对所述分区图像进行第t次迭代处理时,确定所述第t次迭代处理的处理类型;迭代处理模块5202,与类型确定模块5201连接,用于基于所述第t次迭代处理的处理类型,利用所述分类校准模型的第一分支的节点的分类属性信息对所述分区图像进行分类处理,或者,利用所述分类校准模型的第二分支的节点的校准属性信息对所述分区图像的人脸特征点向量进行校准处理;直至,对所述分区图像完成第T次迭代处理,或者在所述第t次迭代处理中对所述分区图像进行分类处理时判定所述分区图像不具备人脸(对象),t取值满足1≤t≤T,T为大于1的整数。作为一个示例,所述迭代处理模块5202包括:概率确定子模块52021,用于基于t确定第t次迭代处理的分类处理概率和校准处理概率,其中,所述分类处理概率与t正相关;类型确定子模块52022,与概率确定子模块52021连接,用于在所述分类处理概率大于所述校准处理概率时,确定所述第t次迭代处理的处理类型为利用所述分类校准模型第一分支的节点的分类属性信息对所述分区图像进行分类处理;所述类型确定子模块52023,还用于在所述分类处理概率小于或等于所述校准处理概率时,确定所述第t次迭代处理的处理类型为利用所述分类校准模型第二分支的节点的分类属性信息对所述分区图像进行校准处理。作为一个示例,所述迭代处理模块5202包括;第一得分确定子模块52024,用于利用基于所述分区图像提取的特征向量、以及第t-1次迭代处理后得到的所述人脸特征点向量确定所述分区图像的得分;第一比较子模块52025,与第一得分确定子模块52024连接,用于比较所述分区图像的得分与所述分类校准模型的节点的分类属性信息中的校准得分阈值,基于比较结果确定所述第一分支,并基于所述第一分支的末端叶节点判定所述分区图像具有人脸或不具有人脸。作为一个示例,所述迭代处理模块5202包括:第二得分确定子模块52026,用于利用基于所述分区图像提取的特征向量、以及第t-1次迭代处理后得到的所述人脸特征点向量确定所述分区图像的得分;第二比较子模块52027,与第二得分确定子模块52026连接,用于比较所述分区图像的得分与所述分类校准模型节点的校准属性信息中的校准得分阈值,基于比较结果确定所述第二分支,并基于所述第二分支的末端叶节点确定出对应所述分区图像的人脸特征点向量的校准偏移量;其中,所述校准偏移量用于基于所述校准偏移量对第t-1次迭代处理后得到的所述人脸特征点向量进行校准,得到第t次迭代处理后所述分区图像的人脸特征点向量。作为一个示例,所述评分单元530包括:调整模块5301,用于对所述分区图像进行至少一个尺度的调整得到调整后分区图像;提取模块5302,与调整模块5301连接,用于从所述分区图像中提取与人脸特征点向量(对象特征点向量)中的每个人脸特征点(对象特征点)的相邻的两个像素点;确定模块5303,与提取模块5302连接,用于基于所提取的两个像素点在所述分区图像、以及所述调整后分区图像的像素偏移的差值确定所述特征向量的一个维度。作为一个示例,如图16所示,所述图像处理装置500还包括:人脸区域确定单元550(对应对象区域确定单元),与判决单元540连接,用于基于所述候选帧图像的各分区图像对应的人脸特征点向量,确定所述候选帧图像中的人脸区域;筛选单元560,与人脸区域确定单元550连接,用于利用人脸筛选策略(对象筛选策略)对所述候选帧图像进行筛选得到最优帧图像。作为一个示例,所述筛选单元560,还用于执行以下处理至少之一:当所述候选帧图像中的人脸(对象)的数量的超出人脸数量阈值(对象数量阈值),和/或所述候选帧图像的人脸的占比小于占比阈值时,筛除所述候选帧图像;当所述候选帧图像中的人脸位于边缘区域,和/或所述候选帧图像中的人脸区域长宽比例小于比例阈值时,筛除所述候选视频帧图像;当基于人眼状态分类模型对人脸的眼部区域像素信息(特定区域像素信息)进行处理确定所述候选帧图像中人脸(对象)的人眼(特定区域)状态处于闭合状态(预定状态)时筛除所述帧图像。实际应用中,图像处理装置500中的各单元可由微处理器(MCU)、逻辑可编程门阵列(FPGA)、专用集成电路(ASIC)或图形理单元(GPU)实现。综上所述,本发明具有以下有益效果:1)在利用分类校准模型对分区图像进行分类的同时也对分区图像的人脸特征点(如五官)进行了定位,对于分区图像中的人脸的识别和对分区图像中五官的定位可以通过对分类校准模型的迭代处理一并完成,这较相关技术首先基于特定模型进行人脸的识别,然后基于另一特定模型进行五官的定位明显提升了人脸识别和五官定位的处理效率,能够从视频中实时获取具有人脸的截图;2)利用简化SRFerns特征,能够加快T次迭代处理的执行效率,便于迅速进行人脸识别和五官定位,同时,SRFerns对噪声的鲁棒性更好,使对人脸的检测更加准确。本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、随机存取存储器(RAM,RandomAccessMemory)、只读存储器(ROM,Read-OnlyMemory)、磁碟或者光盘等各种可以存储程序代码的介质。或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、RAM、ROM、磁碟或者光盘等各种可以存储程序代码的介质。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
:的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1