本发明涉及图像处理和计算机视觉,具体为一种根据位置提取增值税发票信息的方法。
背景技术:
1、在税务管理和财务审计中,增值税发票是一种重要的财务凭证。从增值税发票中提取准确的信息对于税务机关、企业财务部门和审计机构等具有重要意义。
2、现有技术中,传统的增值税发票信息提取方法存在一些问题。其中一个主要问题是,增值税发票通常具有复杂的布局和格式,发票上的信息可能以不同的字体、大小、颜色和位置呈现,传统方法通常依赖于文本检测模型来识别发票上的文字内容区域。这些模型往往容易受到背景、阴影等因素的干扰,导致提取的文字内容区域不准确,从而影响提取的准确性。
3、并且,对于增值税发票上的特定字段标题(例如“购买方纳税人识别号”),传统方法通常依赖于文本检核和文字识别来确定内容。然而,由于自动识别的限制,可能存在识别错误的情况,从而导致提取的信息不准确。
技术实现思路
1、本发明的目的在于提供一种根据位置提取增值税发票信息的方法,以解决上述背景技术中提出的问题。
2、为实现上述目的,本发明提供如下技术方案:一种根据位置提取增值税发票信息的方法,所述方法包括以下步骤:
3、步骤1:模板拍摄;
4、步骤2:框选模板内容区域;
5、步骤3:区域截取效果测试;
6、步骤4:目标检测提取发票区域;
7、步骤5:文本识别;
8、步骤6:文字后处理。
9、优选的,模板拍摄的具体操作包括:
10、拍摄一张增值税专用发票的图片,发票摆放端正、平整,拍摄时避免过曝、阴影不良情况,去掉拍摄的照片中的背景区域,使增值税发票的四个角与图片的四个角对齐,传入python程序。
11、优选的,框选模板内容区域的具体操作包括:
12、使用python的opencv和matplotlib库打开步骤1得到的图片,设图片左上角为原点,使用鼠标事件回调函数手动标记图像上的每个内容信息的区域,并将每个内容区域的坐标存储下来并以字段名称命名。
13、优选的,区域截取效果测试的具体操作包括:
14、使用步骤2生成的模板中各字段的内容区域坐标,对其他剪掉背景区域的增值税发票图片,使用python程序根据左上角坐标对所有内容区域进行截取效果测试,如果多次测试的结果准确,即内容文字完整出现在重新截取后的内容区域图片中,即可保留步骤2得到的各字段的内容区域坐标,否则,要更换模板图片重新执行步骤2,直到测试结果准确。
15、优选的,目标检测提取发票区域的具体操作包括:
16、对于待提取的发票图片,训练一个目标检测模型,使目标检测模型在原拍摄照片中检测增值税发票的区域,即增值税发票4个角内的区域,并将区域提取出后保存,送至下一步骤中的文本识别模型。
17、优选的,文本识别的具体操作包括:
18、根据步骤3得到的各字段的内容区域坐标和步骤4得到的处理后的待识别发票图片,将所有内容区域按照坐标信息截取出来并送入一个开源的文本识别模型,获得各区域内的中文、数字、标点字符。
19、优选的,文字后处理的具体操作包括:
20、设定各种后处理规则,对步骤6得到的识别结果中可能存在的错误进行进一步纠正。
21、与现有技术相比,本发明的有益效果是:
22、本发明提出的根据位置提取增值税发票信息的方法,利用模板和坐标对应关系替代传统的文本检测模型,避免因背景、阴影等干扰因素带来的文本检测模型提取的文字内容区域不准确的弊端,而且对于字段标题比如“购买方纳税人识别号”等因为是手动输入,所以保证不会识别错误。本发明仅通过目标检测模型和文本识别模型进行需要关注的文字内容的提取,简化提取增值税发票信息的流程,提高提取增值税发票信息的准确率。
1.一种根据位置提取增值税发票信息的方法,其特征在于:所述方法包括以下步骤:
2.根据权利要求1所述的一种根据位置提取增值税发票信息的方法,其特征在于:模板拍摄的具体操作包括:
3.根据权利要求2所述的一种根据位置提取增值税发票信息的方法,其特征在于:框选模板内容区域的具体操作包括:
4.根据权利要求3所述的一种根据位置提取增值税发票信息的方法,其特征在于:区域截取效果测试的具体操作包括:
5.根据权利要求4所述的一种根据位置提取增值税发票信息的方法,其特征在于:目标检测提取发票区域的具体操作包括:
6.根据权利要求5所述的一种根据位置提取增值税发票信息的方法,其特征在于:文本识别的具体操作包括:
7.根据权利要求6所述的一种根据位置提取增值税发票信息的方法,其特征在于:文字后处理的具体操作包括: