身份信息录入方法和装置的制作方法

文档序号:6432095阅读:179来源:国知局
专利名称:身份信息录入方法和装置的制作方法
技术领域
本发明涉及数据加工领域,特别涉及一种身份信息录入方法和装置。
背景技术
身份证是适用于标识个人身份的证件。日常生活中,人们在办理电信业务,使用银行业务等都需要提供身份证,并由电信部门、银行对身份证进行复印以记录针对用户的电子信息,这些电子信息包括身份证表明印刷的用户姓名、性别和头像信息等。
由于身份证复印件的复印效果与复印设备及设置直接相关,身份证复印件的复印效果往往存在差异,特别是其上的底纹对身份信息的读取影响很大,很难保证复印设备输出的身份证复印件都适合进行数据录入,尤其在电信、银行业务中,身份证复印件往往与大量的票据混合在一起,对身份证的类型确认和录入都存在很大的困难。所以,需要一种身份信息录入方法,不但能读取出身份证复印件上的身份信息,而且在其他单据的批量处理中对身份证复印件进行独立识别。

发明内容
本发明提供了一种身份信息录入方法和装置,通过特定的图像模糊处理消除底纹对身份证复印件定位的影响,根据得到的身份证号码的位置,进一步提取身份证复印件上的其他身份信息,使身份证复印件与其他的票据混合也能准确地将其上的身份信息进行区分和录入。本发明公开了一种身份信息录入方法,包括
读取身份证复印件的扫描图像,定位身份证号码所在区域;
根据身份证号码所在区域的位置,确定身份证复印件的扫描图像中的各信息区域,对各信息区域进行识别,得到身份证复印件对应的身份信息。所述方法还包括对身份证号码所在区域进行识别,并对识别结果进行验证。所述定位身份证号码所在区域时,对图像进行自适应滤波,根据自适应滤波得到的像素区域进行提取,得到身份证号码所在区域的基线,并根据基线进行倾斜校正。所述对图像进行自适应滤波时,滤波窗口中心位置的权值为零,周边位置的权值为正;根据滤波窗口中的权值对扫描图像中各像素进行加权平均。所述滤波窗口为4X4窗口,中心2X2的权值为零。所述确定身份证复印件的扫描图像中的信息区域时,根据身份证号码所在区域和扫描图像中的各信息区域的相对位置关系,确定扫描图像中的各信息区域的位置。本发明还公开了一种身份信息录入装置,包括
定位模块,读取身份证复印件的扫描图像,定位身份证号码所在区域;
确定模块,根据身份证号码所在区域的位置,确定身份证复印件的扫描图像中的各信息区域,对各信息区域进行识别,得到身份证复印件对应的身份信息。所述装置还包括验证模块,对身份证号码所在区域进行识别,并对识别结果进行验证。所述定位模块在定位身份证号码所在区域时,对图像进行自适应滤波,根据自适应滤波得到的像素区域进行提取,得到身份证号码所在区域的基线,并根据基线进行倾斜校正。所述对图像进行自适应滤波时,滤波窗口中心位置的权值为零,周边位置的权值为正;根据滤波窗口中的权值对扫描图像中各像素进行加权平均。所述滤波窗口为4X4窗口,中心2X2的权值为零。所述确定身份证复印件的扫描图像中的信息区域时,根据身份证号码所在区域和·扫描图像中的各信息区域的相对位置关系,确定扫描图像中的各信息区域的位置。本发明公开的身份信息录入方法和装置,通过模糊处理消除底纹对身份证复印件的影响,根据得到的身份证号码的位置,提取身份证复印件上的其他身份信息,不但能读取出身份证复印件上的身份信息,而且在其他单据的批量处理中对身份证复印件进行独立识别。


图I为本发明实施例中身份信息录入方法流程 图2为本发明实施例中身份信息录入方法的滤波窗口示意 图3为本发明实施例中身份信息录入方法的身份证复印件的扫描图像;
图4为本发明实施例中身份信息录入方法滤波后的身份证复印件的扫描图像;
图5为本发明实施例中身份信息录入方法滤波后的身份证复印件的扫描图像对应的二值图像;
图6为本发明实施例中对图5中的连通域进行合并后的示意 图7为本发明实施例中对图5倾斜校正后进行连通域分析后得到的示意 图8为本发明实施例中对身份证号码所在区域进行二值化后的结果图。
具体实施例方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。二代身份证是有多层聚酯材料复合而成的单页卡式证件,采用非接触式IC卡技术制作,具备视读和机读两种功能。证件尺寸设计长85. 6毫米,宽54毫米,厚I. O毫米。证件正面有签发机关和有效期限2个登记项目,印有国徽图案、证件名称、写意长城图案和彩色底纹;证件背面有此证人的姓名、性别、民族、出生日期、常住户口所在地住址、公民身份号码和本人相片7个登记项目,印有彩色底纹。
在对二代身份证复印后,彩色底纹显示为灰度纹理。身份证复印件的扫描图像往往由于灰度纹理的干扰使文字信息在进行识别时识别率大大降低。本发明实施例提供了一种身份信息录入方法,如图I所示,包括以下步骤
步骤I :读取身份证复印件的扫描图像,定位身份证号码所在区域;
读取身份证复印件的扫描图像后,对图像进行自适应滤波,根据自适应滤波得到的图像进行二值化,将二值化后图像中的像素区域进行连通域分析后像素提取,得到身份证号码所在区域的基线,并根据基线进行倾斜校正。对图像进行自适应滤波时,滤波窗口中心位置的权值为零,周边位置的权值为正,根据滤波窗口中的权值对扫描图像中各像素进行加权平均。本实施例中,如图2、图3所示,滤波窗口为4 X 4窗口,中心2 X 2的权值为零,窗口的四个角点处的权值为I,边框处的权值为2。采用此滤波窗口对如图3所示的身份证复印件的扫描图像进行滤波,根据滤波窗口对·应位置的权值对扫描图像逐像素进行加权平均,滤波后像素点的像素值为原位置的像素点的像素值与该像素点周边八个像素点的像素值的加权平均值,得到如图4所示的滤波后的身份证复印件的扫描图像。采用如图2所示的滤波窗口进行滤波时,由于滤波窗口中心的权值为零,则滤波后扫描图像中滤波后与滤波窗口中心对应的像素点的像素值=(滤波前与滤波窗口中心对应的像素点的像素值XO+滤波前与滤波窗口中心对应的像素点的周边像素点的像素值X滤波前与滤波窗口中心对应的像素点的周边像素点的权值)/20 ;
在身份证复印件的扫描图像中,背景底纹处由于比较细,像素值受滤波的影响变化比较大,已经基本上失去了原有的信息,滤波后的背景底纹已经变得比较贴近背景色。相反,由于扫描图像中的文字部分的笔画较粗,笔画中心位置受滤波的影响相对较小,仍然保持着原有的信息,从而在后面的二值化处理中可以方便的将文字部分从背景底纹中区分出来。这样,在滤波后的身份证复印件的扫描图像中,虽然文字部分的边缘处对应的像素信息也受到了滤波的干扰,但文字部分的中心位置对应的像素达到了定位的需求。根据自适应滤波得到的图像进行二值化,采用二值化算法对自适应滤波得到的图像进行二值化处理后,对得到的如图5所示的二值图像进行连通域分析。如图6所示,将得到的连通域进行合并,得到二值图像中各连通域对应的基线,本实施例中,二值图像合并得到的宽度最大的连通域对应基线倾斜的角度为5度,并对根据基线对图5所示的二值图像顺时针旋转5度进行倾斜校正。对倾斜校正后得到的二值图像进行连通域分析,将得到的连通域进行合并,如图7所示的各连通域,从图7中查找具有既定长宽比的连通域,本实施例中,如图7中的虚线框所示,既定长宽比为13:1,将该连通域对应的区域作为身份证号码所在区域,对身份证号码所在区域进行二值化。步骤1-2 :对身份证号码所在区域进行识别,并对识别结果进行验证;
如图8所示,将对应区域的二值化图像采用OCR引擎进行识别,如果得到的身份证号码所在区域对应的识别结果经加权校验后通过,则该识别结果为身份证号码,该区域为身份证号码所在区域。本实施例中,OCR引擎识别结果为412823197404101733,经加权校验后通过,则该识别结果为身份证号码,该区域为身份证号码所在区域,该区域对应的坐标为((245,354),(611,394)), (245,354)为该区域的左上角坐标,(611,394)为该区域的右下角坐标。
步骤2 :根据身份证号码所在区域的位置,确定身份证复印件的扫描图像中的各信息区域,对各信息区域进行识别,得到身份证复印件对应的身份信息。由于身份证的各信息区域的位置相对固定,则根据身份证号码所在区域的位置对身份证复印件的扫描图像中的各信息区域进行定位。本实施例中,将身份证号码对应位置的连通域进行合并后,对身份证复印件的扫描图像进行倾斜校正,并以人工的方式对身份证的各信息区域的位置进行手工标记,或者利用边缘提取方法对扫描图像上的各信息区域进行检测,得到身份证号码所在区域与其他信息区域的相对偏移,从而确定扫描图像中的各信息区域的位置。本实施例中,身份证复印件的扫描图像为300DPI,以扫描图像的左上角为坐标原点,水平向右为横坐标的正方向,竖直向下为纵坐标的正方向;
检测所得的姓名区域相对于身份证号区域的左上角分别偏移量为左-110,上-310, 右+30,下-262 ;则将身份证号区域的左上角水平向左偏移110处对应的横坐标为姓名区域的左边界,竖直向上偏移310处对应的纵坐标为姓名区域的上边界,水平向右偏移30处对应的横坐标为姓名区域的右边界;竖直向上偏移262处对应的纵坐标为姓名区域的下边界,即姓名区域对应的坐标为((135,44)、(275,92))。检测所得的性别区域相对于身份证号区域的左上角分别偏移量为左-110,上-270,右-60,下-225 ;则将身份证号区域的左上角水平向左偏移110处对应的横坐标为性别区域的左边界,竖直向上偏移270处对应的纵坐标为性别区域的上边界,水平向左偏移60处对应的横坐标为性别区域的右边界;竖直向上偏移225处对应的纵坐标为性别区域的下边界,即性别区域对应的坐标为((135,84)、(185,129))。检测所得的民族区域相对于身份证号区域的左上角分别偏移量为左+20,上-270,右+65,下-225 ;则将身份证号区域的左上角水平向右偏移20处对应的横坐标为民族区域的左边界,竖直向上偏移270处对应的纵坐标为民族区域的上边界,水平向右偏移65处对应的横坐标为民族区域的右边界;竖直向上偏移225处对应的纵坐标为民族区域的下边界,即民族区域对应的坐标为((265,84)、(310,129))。检测所得的出生区域相对于身份证号区域的左上角分别偏移量为左-110,上-230,右+140,下-185 ;则将身份证号区域的左上角水平向左偏移110处对应的横坐标为出生区域的左边界,竖直向上偏移-230处对应的纵坐标为出生区域的上边界,水平向右偏移140处对应的横坐标为出生区域的右边界;竖直向上偏移185处对应的纵坐标为出生区域的下边界,即出生区域对应的坐标为((135,124)、(385,169))。检测所得的住址区域相对于身份证号区域的左上角分别偏移量为左-110,上-200,右+180,下-60 ;则将身份证号区域的左上角水平向左偏移110处对应的横坐标为住址区域的左边界,竖直向上偏移200处对应的纵坐标为住址区域的上边界,水平向右偏移180处对应的横坐标为住址区域的右边界;竖直向上偏移60处对应的纵坐标为住址区域的下边界,即住址区域对应的坐标为((135,154)、(425,294))。对得到的各信息区域进行OCR识别,得到身份证复印件对应的身份信息。一种身份信息录入装置,包括
定位模块,读取身份证复印件的扫描图像,定位身份证号码所在区域;
确定模块,根据身份证号码所在区域的位置,确定身份证复印件的扫描图像中的各信息区域,对各信息区域进行识别,得到身份证复印件对应的身份信息。所述装置还包括验证模块,对身份证号码所在区域进行识别,并对识别结果进行验证。所述定位模块在定位身份证号码所在区域时,对图像进行自适应滤波,根据自适应滤波得到的像素区域进行提取,得到身份证号码所在区域的基线,并根据基线进行倾斜校正。所述对图像进行自适应滤波时,滤波窗口中心位置的权值为零,周边位置的权值为正;根据滤波窗口中的权值对扫描图像中各像素进行加权平均。
所述滤波窗口为4X4窗口,中心2X2的权值为零。所述确定身份证复印件的扫描图像中的信息区域时,根据身份证号码所在区域和扫描图像中的各信息区域的相对位置关系,确定扫描图像中的各信息区域的位置。本发明公开的身份信息录入方法和装置,通过模糊处理消除底纹对身份证复印件的影响,根据得到的身份证号码的位置,提取身份证复印件上的其他身份信息,不但能读取出身份证复印件上的身份信息,而且在其他单据的批量处理中对身份证复印件进行独立识别。本领域技术人员可以理解,虽然上述说明中,为便于理解,对方法的步骤采用了顺序性描述,但是应当指出,对于上述步骤的顺序并不作严格限制。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读取存储介质中,如R0M/RAM、磁碟、光盘等。还可以理解的是,附图或实施例中所示的装置结构仅仅是示意性的,表示逻辑结构。其中作为分离部件显示的模块可能是或者可能不是物理上分开的,作为模块显示的部件可能是或者可能不是物理模块。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种身份信息录入方法,其特征在于,包括如下步骤 读取身份证复印件的扫描图像,定位身份证号码所在区域; 根据身份证号码所在区域的位置,确定身份证复印件的扫描图像中的各信息区域,对各信息区域进行识别,得到身份证复印件包含的身份信息。
2.根据权利要求I所述的方法,其特征在于所述方法还包括对身份证号码所在区域进行识别,并对识别结果进行验证。
3.根据权利要求I所述的方法,其特征在于所述定位身份证号码所在区域时,对图像进行自适应滤波,根据自适应滤波得到的像素区域进行提取,得到身份证号码所在区域的基线,并根据基线进行倾斜校正。
4.根据权利要求3所述的方法,其特征在于所述对图像进行自适应滤波时,滤波窗口中心位置的权值为零,周边位置的权值为正;根据滤波窗口中的权值对扫描图像中各像素进行加权平均。
5.根据权利要求4所述的方法,其特征在于所述滤波窗口为4X4窗口,中心2 X 2的权值为零。
6.根据权利要求I所述的方法,其特征在于所述确定身份证复印件的扫描图像中的各信息区域时,根据身份证号码所在区域和扫描图像中的各信息区域的相对位置关系,确定扫描图像中的各信息区域的位置。
7.一种身份信息录入装置,其特征在于,包括如下模块 定位模块,读取身份证复印件的扫描图像,定位身份证号码所在区域; 确定模块,根据身份证号码所在区域的位置,确定身份证复印件的扫描图像中的各信息区域,对各信息区域进行识别,得到身份证复印件包含的身份信息。
8.根据权利要求7所述的装置,其特征在于所述装置还包括验证模块,对身份证号码所在区域进行识别,并对识别结果进行验证。
9.根据权利要求7所述的装置,其特征在于所述定位模块在定位身份证号码所在区域时,对图像进行自适应滤波,根据自适应滤波得到的像素区域进行提取,得到身份证号码所在区域的基线,并根据基线进行倾斜校正。
10.根据权利要求9所述的装置,其特征在于所述对图像进行自适应滤波时,滤波窗口中心位置的权值为零,周边位置的权值为正;根据滤波窗口中的权值对扫描图像中各像素进行加权平均;所述滤波窗口为4X4窗口,中心2X2的权值为零。
11.根据权利要求7所述的装置,其特征在于所述确定身份证复印件的扫描图像中的各信息区域时,根据身份证号码所在区域和扫描图像中的各信息区域的相对位置关系,确定扫描图像中的各信息区域的位置。
全文摘要
本发明公开了一种身份信息录入方法和装置,属于图像处理领域。方法包括读取身份证复印件的扫描图像,定位身份证号码所在区域;根据身份证号码所在区域的位置,确定身份证复印件的扫描图像中的各信息区域,对各信息区域进行识别,得到身份证复印件包含的身份信息。本发明通过模糊处理消除底纹对身份证复印件的影响,根据得到的身份证号码的位置,提取身份证复印件上的其他身份信息,不但能读取出身份证复印件上的身份信息,而且在其他单据的批量处理中对身份证复印件进行独立识别。
文档编号G06K9/20GK102955941SQ201110255110
公开日2013年3月6日 申请日期2011年8月31日 优先权日2011年8月31日
发明者郭健 申请人:汉王科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1