手持证件模式下的对焦方法和装置的制造方法_4

文档序号:9911607阅读:来源:国知局
确定证件候选区域。
[0177]手持证件拍摄模式下,为了使待拍摄对象的人脸以及待拍摄证件均落入拍摄图像中,人脸与证件之间存在一定的位置关系,一般地,证件位于人脸的左侧或右侧区域中。
[0178]候选区域确定子模块131从待对焦图像中确定人脸区域后,在人脸区域的左侧、右侧的预设范围中划定证件候选区域,并从证件候选区域中确定证件区域。
[0179]示例二:候选区域确定子模块131,具体被配置为:确定待拍摄证件上是否有待拍摄对象的头像,若有,则在待对焦图像中确定待拍摄对象的头像位置;根据待拍摄对象的头像位置,在待对焦图像中确定证件候选区域。
[0180]手持证件拍摄模式下,待拍摄的证件上有时会有待拍摄对象的头像,且一般的待拍摄对象的头像相对比较容易识别,此时可以首先确定证件上的头像位置,之后根据头像位置在待对焦图像中确定证件候选区域。
[0181]扫描子模块132,被配置为采用金字塔层级遍历扫描装置,从证件候选区域中得到N个扫描图像。
[0182]金字塔层级遍历扫描方法是指,由于不确定待对焦图像中证件区域的位置及大小,因此证件识别模型中的识别样本大小可能与证件区域中的文字大小不匹配,如证件识别模型中的识别样本中的文字小于证件区域上的文字,此时难易扫描得到完整的文字图像,因此可以采用对识别样本进行缩放,以匹配证件区域中的文字大小;另外为了匹配待对焦图中中的证件位置,在证件候选区域中进行逐层遍历扫描,从而保证识别覆盖整个证件候选区域。
[0183]归一化子模块133,被配置为对得到的N个扫描图像进行归一化处理。
[0184]在实际应用中,为了进一步保证识别处理的速度和识别结果的准确性,可以对得到的N个扫描图像进行一定的预处理,该预处理包括进行图像的归一化处理。比如对尺寸、坐标中心化、X-Shear ing、缩放和旋转等进行归一化处理。
[0185]字符区域确定子模块134,被配置为采用证件识别模型,分别确定归一化后的N个扫描图像是否为证件上的字符区域。
[0186]其中,字符区域确定子模块134,具体被配置为:采用证件识别模型,分别对N个扫描图像的方向梯度直方图HOG以及线性判别式分析LDA特征进行识别;根据识别的结果,分别确定N个扫描图像是否为证件上的字符区域。
[0187]图3是HOG特征提取过程的示意图。从图3可以看出,HOG特征提取过程包括:
[0188]步骤301:归一化图像
[0189]为了减少光照因素的影响,首先对检测窗口中的图像进行归一化。在图像的纹理强度中,局部的表层曝光贡献比重较大,所以,这种压缩处理能够有效地降低图像局部的阴影和光照变化。
[0190]步骤302:计算图像梯度
[0191]计算图像在设定的横坐标和纵坐标方向的梯度,并据此计算每个像素位置的梯度方向值,其中求取梯度方向值的操作不仅能够捕获轮廓,人影和一些纹理信息,还能进一步弱化光照的影响。
[0192]步骤303:为每个细胞单元构建梯度方向直方图
[0193]本步骤的目的是为局部图像区域提供一个编码,同时能够保持对图像中人体对象的姿势和外观的弱敏感性。
[0194]本步骤中,将图像分成若干个“单元格cell”,例如每个CelI为6*6个像素。对Cel I内的每个像素用梯度方向在直方图中进行加权投影(映射到固定的角度范围),就可以得到这个Ce 11的梯度方向直方图了。
[0195]步骤304:把细胞单元组合成大的块(Block),块内归一化梯度直方图
[0196]由于局部光照的变化以及前景-背景对比度的变化,使得梯度强度的变化范围非常大。这就需要对梯度强度做归一化。归一化能够进一步地对光照、阴影和边缘进行压缩。
[0197]具体实现方法包括:把各个细胞单元组合成大的、空间上连通的区间(Blocks)。这样,一个Block内所有Cel I的特征向量串联起来便得到该Block的HOG特征。这些区间是互有重叠的,这就意味着:每一个单元格的特征会以不同的结果多次出现在最后的特征向量中。我们将归一化之后的块描述符(向量)就称之为HOG描述符。
[0198]步骤305:收集HOG特征
[0199]最后一步就是将检测窗口中所有重叠的块进行HOG特征的收集,并将它们结合成最终的特征向量供分类使用。
[0200]聚类合并子模块135,被配置为对N个扫描图像是否为字符区域的确定结果进行聚类合并。
[0201]证件区域确定子模块136,被配置为根据聚类合并的结果,确定证件候选区域中的证件区域。
[0202]图8是根据一示例性实施例示出的一种手持证件模式下的对焦装置实施例三的框图,如图8所示,在图7所示实施例的基础上,装置还包括:第二获取模块21、归一化模块22以及训练模块23,其中:
[0203]第二获取模块21,被配置为获取训练样本集,训练样本集中的正样本为文字样本图像,负样本为非文字样本图像。
[0204]归一化模块22,被配置为对文字样本图像和非文字样本图像进行归一化处理。
[0205]训练模块23,被配置为采用Adaboost训练装置对文字样本图像和非文字样本图像的方向梯度直方图HOG以及线性判别式分析LDA特征进行训练,得到证件识别模型。
[0206]本实施例中,为了保证证件识别模型的准确可靠,训练时,需要采集大量的文字样本图像和非文字样本图像,比如文字样本图像20万张。图5示出了文字样本图像的示意图。如图5所示,每张文字样本图像都可以从身份证或者其它证件里面抠取出一些字符区域,文字在样本图像中占比个数可以从3?8个不等。
[0207]为了提高证件识别模型的精确度,准确的非文字样本图像的数量可以远大于文字样本图像的个数,如当文字样本图像为20万张时,准确500万张非文字样本图像。
[0208]为了保证训练结果的准确可靠,可以先对各样本图像进行归一化处理,比如进行尺寸、坐标中心化、X-Shear ing、缩放和旋转等归一化处理。
[0209]以上描述了手持证件模式下的对焦装置的内部功能和结构,如图9所示,图9是根据一示例性实施例示出的一种手持证件模式下的对焦装置的框图;该手持证件模式下的对焦装置装置可实现为:
[0210]存储器;
[0211]用于存储处理器可执行指令的存储器;
[0212]其中,处理器被配置为:
[0213]获取待对焦图像;
[0214]从待对焦图像中确定人脸区域;
[0215]根据人脸区域,采用证件识别模型在待对焦图像中确定证件区域,其中证件识别模型是通过对训练样本集进行训练后得到的,证件识别模型用于识别图像中的字符内容;
[0216]将人脸区域及证件区域确定为对焦区域进行对焦。
[0217]本发明实施例中,终端设备首先确定待对焦图像上的人脸区域,之后利用证件识别模型识别待对焦图像上的证件区域,并对待对焦图像上的人脸区域以及证件区域均进行对焦,从而提高拍摄出的图像中证件上信息的清晰程度。
[0218]图10是根据一示例性实施例示出的另一种手持证件模式下的对焦装置的框图。例如,装置800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。
[0219]参照图10,装置800可以包括以下一个或多个组件:处理组件802,存储器804,电力组件806,多媒体组件808,音频组件810,输入/输出(I/O)的接口 812,传感器组件814,以及通信组件816。
[0220]处理组件802通常控制装置800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。
[0221]存储器804被配置为存储各种类型的数据以支持在设备800的操作。这些数据的示例包括用于在装置800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
[0222]电力组件806为装置800的各种组件提供电力。电力组件806可以包括电源管理系统,一个或多个电源,及其他与为装置800生成、管理和分配电力相关联的组件。
[0223]多媒体组件808包括在装置800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
[0224]音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(MIC),当装置800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。
[0225]I/O接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
[0226]传感器组件814包括一个或多个传感器,用于为装置800提供各个方面的状态评估。例如,传感器组件814可以检测到设备800的打开/关闭状态,组件的相对定位,例如组
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1