基于ocr技术的票证票号识别方法

文档序号:6398666阅读:671来源:国知局
专利名称:基于ocr技术的票证票号识别方法
技术领域
本发明属于票据票证信息识别方法技术领域,具体涉及一种基于OCR技术的票证票号识别方法。
背景技术
随着电子客票与EMD在全球的推广,各种票据票证特别是民航客运票证的电子化程度越来越高,但仍存在大量的纸质票证,特别是纸质行李票与MC0。在民航客运结算系统中,上述纸质票证的影像,通过扫描,被采集进系统。票号,作为票证影像的关键检索项,需从影像中被自动识别出来,以降低人工成本,提高工作效率。光学字符识别(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析处理,获取文字及版面信息的过程。现有技术中均是直接利用OCR技术,对客运票证的票号进行识别。直接利用OCR技术对客运票证的票号识别,一般需要预先指定票号区域,但不同航空公司、不同类型的票证,票号位置有所不同,再加上票证印刷、运输与扫描过程的干扰因素,造成票号识别率相对较低。

发明内容
本发明的目的在于提供一种基于OCR技术的票证票号识别方法,利用本发明的票证票号识别方法,可以不需要预先指定票号区域,且识别正确率高。本发明的技术方案如下:一种基于OCR技术的票证票号识别方法,依次进行如下步骤:步骤1、采集票证图像;步骤2、对票据图像进行二值化处理;步骤3、利用Freeman直线检测算法,以获得可能的票号区域并进入步骤4,如无可能的票号区域则跳转到步骤7 ;步骤4、根据系统预先设定的票号识别特征进行细化识别,以获得票号在步骤3得到的可能的票号区域中的具体位置并进入步骤5,否则跳转到步骤3 ;步骤5、使用OCR识别方法,在步骤4获得的具体位置进行识别,以获得票号识别结果;步骤6、根据系统预先设定的票号校验特征对步骤5的票号识别结果进行校验,校验成功,则输出识别结果并进入步骤7,否则进入步骤3 ;步骤7、结束。进一步的,步骤4中,票号识别特征为票号位数和票号字符间间距。进一步的,步骤6中,票号校验特征为票号长度和票号检查号计算规则。本发明的技术效果在于:本发明基于OCR技术的票证票号识别方法,能自动快速定位票号位置,并对识别结果进行校验,具有较高的识别速度与正确率,能够降低人力成本,提高工作效率。


图1所示为本发明基于OCR技术的票证票号识别方法的流程图。
具体实施例方式以下结合附图对本发明做进一步说明。如图1所示,本发明一种基于OCR技术的票证票号识别方法,依次进行如下步骤:步骤1、采集票证图像。步骤2、对票据图像进行二值化处理。图像二值化是指将图像上的灰度设置为O或255,也就是将整个图像呈现出明显的黑白效果,降低干扰因素的影响,凸显票号区域轮廓。本实施例中,设定特定的阈值,对图像进行二值化处理,降低干扰因素的影响,凸显票号区域轮廓。步骤3、利用Freeman直线检测算法,以获得可能的票号区域并进入步骤4,如无可能的票号区域则跳转到步骤7。Freeman直线检测算法,相对于现有其它算法,是一种简单而高效的在二值图像中检测目标物体直线边界的算法。本实施例中,如为第一次票号区域识别,则以图像的右下角为起点,否则以上一次识别出的可能的票号区域左下角为起点应用Freeman直线检测算法,向左查找垂直于底边、与底边相交且宽度大于一定值的直线。如找到符合条件的直线,则以当前直线为高,宽为直线的低端到起点的矩形区域,为可能的票号区域,则进行步骤4操作,否则跳转到步骤7。步骤4、根据系统预先设定的票号识别特征进行细化识别,以获得票号在步骤3得到的可能的票号区域中的具体位置并进入步骤5,否则跳转到步骤3。通常,票号识别特征为票号位数和票号字符间间距。步骤5、使用OCR识别方法,在步骤4获得的具体位置进行识别,以获得票号识别结
果O步骤6、根据系统预先设定的票号校验特征对步骤5的票号识别结果进行校验,校验成功,则输出识别结果并进入步骤7,否则进入步骤3。通常,票号校验特征为票号长度和票号检查号计算规则。步骤7、结束。综上所述,与现有的直接利用ORC技术进行民航客运票证票号相比,本发明的基于ORC技术的票证票号识别方法可自动快速定位票号位置,并对识别结果进行校验,提高识别速度与正确率,降低人力成本,提高工作效率。
权利要求
1.一种基于OCR技术的票证票号识别方法,其特征在于,依次进行如下步骤: 步骤1、采集票证图像; 步骤2、对票据图像进行二值化处理; 步骤3、利用Freeman直线检测算法,以获得可能的票号区域并进入步骤4,如无可能的票号区域则跳转到步骤7; 步骤4、根据系统预先设定的票号识别特征进行细化识别,以获得票号在步骤3得到的可能的票号区域中的具体位置并进入步骤5,否则跳转到步骤3 ; 步骤5、使用OCR识别方法,在步骤4获得的具体位置进行识别,以获得票号识别结果;步骤6、根据系统预先设定的票号校验特征对步骤5的票号识别结果进行校验,校验成功,则输出识别结果并进入步骤7,否则进入步骤3 ; 步骤7、结束。
2.按照权利要求1所述基于OCR技术的票证票号识别方法,其特征在于,步骤4中,所述票号识别特征为票号位数和票号字符间间距。
3.按照权利要求1所述基于OCR技术的票证票号识别方法,其特征在于,步骤6中,所述票号校验特征为票号长度和票号检查号计算规则。
全文摘要
本发明提供一种基于OCR技术的票证票号识别方法,依次进行如下步骤采集票证图像;对票据图像进行二值化处理;利用Freeman直线检测算法,以获得可能的票号区域;根据系统预先设定的票号识别特征进行细化识别;使用OCR识别方法获得票号识别结果;进行校验后结束。本发明在识别过程中不需要预先指定票号区域,且识别正确率高。
文档编号G06K9/20GK103093219SQ20131003066
公开日2013年5月8日 申请日期2013年1月28日 优先权日2013年1月28日
发明者杜国洪, 袁永俊, 郑朝晖, 刘智恒, 李樟标, 奚兵, 韩征, 杨峥, 孙巍巍, 蔡琪, 王雷, 耿谨, 其他发明人请求不公开姓名 申请人:中国航空结算有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1