一种基于ocr的票据自动识别与处理系统的制作方法

文档序号:9766196阅读:489来源:国知局
一种基于ocr的票据自动识别与处理系统的制作方法
【技术领域】
[0001]本发明属于模式识别与人工智能技术领域,特别是涉及一种基于OCR的票据自动识别与处理系统。
【背景技术】
[0002]基于OCR的票据自动识别与处理技术是指通过计算机等设备,利用OCR技术(光学字符识别)将纸质票据中的符号自动提取和识别出来,并进行相应处理。它是实现票据计算机自动处理的关键技术之一。尽管电子支付、电子票据等发展日益增多,传统纸质票据仍然是现实工作和生活中广泛使用的方式之一,如各类纸质发票、金融票据等。现有纸质票据的计算机自动处理一般有以下几种方式:(I)票据图像的自动采集和存储,一般通过专门的设备进行纸质票据的自动采集和压缩存储。但由于没有进行票据中文本等信息的自动识别与处理,难以进行按票据内容的自动检索和后续的有效管理,如票据内容的计算机自动验证和核对等。(2)票据内容的人工录入,一般通过人工的方式对票据信息进行手工录入和保存,以便于后续的票据计算机自动管理。这种方式不适用于大规模票据自动处理,且手工录入也容易出现录入错误,人力成本较高。(3)具有简单版式的票据计算机自动识别与处理,这种方式一般针对版式相对简单的票据,如银行支票等。这种方式中待识别的票据信息一般具有固定的几何位置或特殊的定位符号,通过定位符号或者简单几何换算可以实现票据信息的提取,并利用OCR技术进行字符的识别。对于具有较为复杂版面票据,特别是发票票据,由于票据种类繁多,票据版面格式复杂多样,目前还没有一种通用的方法或设备可以有效地自动识别票据中的文本信息。针对以上分析,本发明针对具有复杂版式的发票票据的信息自动录入与处理,特别是针对增值税发票票据,提供了一种有效的自动识别与处理的方法与系统。

【发明内容】

[0003]本发明的目的在于克服上述票据处理方式与系统的不足,提供一种快速、高精度的增值税发票票据自动识别与处理系统,其特点是采用高速扫描仪进行发票票据的图像采集,能够快速、高精度地提取和识别增值税发票中的购销双方企业名称与纳税人识别号、商品信息(包括商品名称、计量单位、数量、金额、税额)、开票日期等票据信息,并可以完成票据图像的压缩保存和检索。
[0004]—种基于OCR的票据自动识别与处理系统,包括票据图像采集模块、快速图像二值化模块、文本块检测与定位模块、单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块、文本识别模块和票据图像检索模块;图像采集模块采集发票票据图像后,快速图像二值化模块对图像进行二值化处理,文本块检测与定位模块进行文本块检测与定位,并根据检测中确定的水平分割线倾角,对图像进行倾斜检测和校正;根据定位的文本块,分别通过单栏文本块的精确定位模块、多栏文本块的精确定位与分割模块进行精确定位与分割,从而得到待识别的票据信息文本行;文本行识别模块将文本行分为纯数字串和中文字符串两种,分别进行识别处理;票据图像检索模块将采集的票据图像与识别结果进行关联存储,完成票据图像数据中的检索,检索内容包括票据图像的购方信息、销方信息、商品信息、开票日期。
[0005]进一步地,系统还包括高清摄像头,实现发票图像的采集,并将图像传输到高性能电脑保存;用户只需将发票平整放置于摄像头下方,由图像采集模块触发摄像头进行发票图像采集,并保存到电脑的指定目录。
[0006]进一步地,用户启动系统后,本系统处于等待状态,用户将平整发票放置于摄像头下方,由图像采集模块根据连续帧图像计算触发信号,并触发摄像头进行发票图像采集,并保存到PC电脑的指定目录;然后,系统进行票据图像的自动处理与识别,分别提取与识别增值税发票票据中的购销双方名称与纳税人识别号、商品信息、开票日期信息,并完成票据图像的压缩保存,以及识别信息关联;根据生成的票据图像与识别信息数据,系统完成票据图像检索与归档自动化管理,并能依据识别信息,实现与税务机关数据库中相关票据信息进行认证管理。
[0007]进一步地,票据图像采集模块负责对高清摄像头进行触发控制,并将采集的票据图像传输到高性能电脑进行存储;触发信号根据高清摄像头采集的图像序列的帧间差进行计算;如果相邻帧间图像差小于设定阈值,且图像的前景像素点数所占比例大于预定值,则发送触发信号进行票据图像采集。
[0008]进一步地,快速图像二值化模块对发票图像进行二值化,采用基于最大类间方差方法以及局部分块的二值化方法;首先将图像进行灰度化,并等分为N个子区域,这里N的取值根据笔画宽度进行设定,然后在每个子区域中,利用最大类间方差方法确定图像二值化阈值T,并根据T进行图像二值化;若子区域内图像最大与最小灰度值差小于预设值,则置该子区域为背景。
[0009]进一步地,文本块检测与定位模块根据增值税发票票据的版式,将待识别内容分为购方信息、销方信息、商品信息、开票日期文本块,并利用基于直线检测的方法定位与分割出相应文本图像块;首先利用Hough变换直线检测方法检测倾角小于45°的横线,并根据检测的横线倾斜角度进行图像的倾斜校正;然后,分别取最长的前5条横线,并利用线间距的几何比例约束,定位出增值税发票的水平分割线;最后根据水平分隔线以及票据信息块的几何位置,定位出待识别的发票文本信息块;定位的文本信息块分为单栏文本块和多栏文本块,单栏文本块包括购方名称与纳税人识别号、销方名称与纳税人识别号、开票日期;多栏文本块包括商品信息块,商品信息块包括商品名称、计量单位、数量、金额、税额栏;如果文本块分割失败,则判断为无效票据。
[0010]进一步地,单栏文本块的精确定位模块主要处理单栏文本块的精确定位,对每个单栏文本图像块,首先按行进行扫描,并计算每行的笔画穿越数,然后以笔画穿越数最大的行为起始行,分别向上下扫描,若存在连续K行的笔画穿越数小于预定阈值(K由实验确定),则认为为行边缘,从而定位一行文本;然后对剩余部分图像重复上述步骤,直到定位到所有文本彳丁为止;最后利用同一文本块中文本彳丁尚近似相等的特性,剔除彳丁尚异常的彳丁,从而精确定位每个单栏文本图像块中的待识别文本行;如果文本行分割失败,则判断为无效票据;
多栏文本块的精确定位与分割模块主要处理多栏文本块的精确定位,即商品信息图像块;首先利用基于Hough变换直线检测方法,定位图像块中的垂直分隔线,并利用分隔线间的几何比例约束条件,剔除无效的分隔线,从而定位出商品名称、计量单位、数量、金额、税额栏对应的图像位置;最后根据每条商品信息图像位置满足水平对齐的特性,从而精确定位与分割出待识别的文本行图像;如果文本行分割失败,则判断为无效票据。
[0011]进一步地,文本行识别模块将文本行分为纯数字串和中文字符串两种,分别进行识别处理;文本行的识别过程为:首先进行基于垂直投影分析的行字符分割,然后采用动态规划的方法计算最优分割路径,得到字符识别结果;对于纯数字串的识别,对每个候选字符分割块,首先计算8方向梯度特征,并进行LDA降维,然后在降维后的特征矢量空间中,利用最近邻方法进行分类,得到每个候选字符的识别可信度,并代入到文本行识别的最优分割路径计
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1