一种基于图像处理的增值税发票识别方法与流程

文档序号:15462837发布日期:2018-09-18 18:35阅读:来源:国知局

技术特征:

1.一种基于图像处理的增值税发票识别方法,其特征在于,包括以下步骤:

步骤1,采集发票图像并进行预处理以及几何校正;

步骤2,将步骤1中校正后的图像处理成标准尺寸;

步骤3,将步骤2处理后的图像分割出八个文本区域;

步骤4,从步骤3中的八个文本区域中,分别分割出其中的文本框;

步骤5,将步骤4中的每个文本框分别输入OCR软件进行识别,得到其中的文字信息;

步骤6,根据步骤5中识别的信息,核对发票金额。

2.根据权利要求1所述的一种基于图像处理的增值税发票识别方法,其特征在于,所述预处理为:首先,对采集发票图像进行灰度处理,然后,通过霍夫变换算法提取发票图像的外边框,最后,裁剪掉图像外边框以外的部分。

3.根据权利要求2所述的一种基于图像处理的增值税发票识别方法,其特征在于,根据提取的外边框使用Hough变换检测出发票图像的倾斜角,并根据进行几何校正。

4.根据权利要求3所述的一种基于图像处理的增值税发票识别方法,其特征在于,使用Hough变换检测出发票图像的倾斜角,具体为:

步骤A,在直角坐标系下将校正后的发票图像C离散化,并计算出图像C的长m和宽n;

步骤B,建立离散化的参数空间ρ-θ,并将其初始化,建立二维累加数组K(θ,ρ),其中,θ∈[0,180],

步骤C,遍历步骤A中离散化的图像C,找出所有像素值不为0的点,对找出的每个点,将其坐标(x,y)带入方程ρ=xcosθ+ysinθ中,并以1为步长遍历θ∈[0,180],求出每个θi所对应的ρi,在相应的二维累加数组K(θi,ρi)上加1,其中,θi为第i次遍历的θ值,ρi为第i次遍历的θ值对应的ρ的值;

步骤D,遍历二维累加数组K(θ,ρ),找出其中的最大值,最大值对应的θ值即为图像C的倾斜角。

5.根据权利要求4所述的一种基于图像处理的增值税发票识别方法,其特征在于,根据图像C的倾斜角,将图像旋转90-θ或者180-θ即得到校正水平或者竖直的发票图像。

6.根据权利要求2所述的一种基于图像处理的增值税发票识别方法,其特征在于,步骤2具体为:将发票图像的外边框和增值税发票的标准长度进行计算得出比例,按比例将矫正后的发票图像进行缩放,最终将图像处理成标准尺寸。

7.根据权利要求6所述的一种基于图像处理的增值税发票识别方法,其特征在于,比例大小为:x0、y0分别为标准增值税发票上边框、左边框的长度,x、y分别为校正后的发票图像的上边框、左边框的长度。

8.根据权利要求1所述的一种基于图像处理的增值税发票识别方法,其特征在于,步骤3具体为:根据增值税发票的内容,将步骤2处理后的图像分割出八个文本区域,其中,文本区域1:发票号码;文本区域2:开票日期;文本区域3:购买方信息;文本区域4:货物或应税劳务、服务名称和规格型号、单位、数量、单价、金额、税率、税额;文本区域5:合计;文本区域6:价税合计;文本区域7:销售方信息;文本区域8:收款人、复核、开票人、销售方。

9.根据权利要求8所述的一种基于图像处理的增值税发票识别方法,其特征在于,步骤4具体为:分别检测八个文本区域内的文本信息,分割出其中的文本框,并依据其中文本区域中的位置按照从上往下或从左往右的顺序排列。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1