本申请涉及人工智能中的图像处理,尤其涉及一种发票入池方法、装置、计算机设备及存储介质
背景技术:
1、目前发票侧重于融入各种业务场景中进行管理,并无集中管理企业发票池,通常由各业务专责人工收集、人工核对、人工查验再应用到具体业务场景,管理过程散乱,无法统一控制,发票重复使用风险、认证风险、合规风险等均无法有效识别,同时发票资源数据的共享和应用水平较低下。
2、然而,申请人发现传统的发票管理方法存在管理分散、传统手工收集发票、人工识别查验发票的局限性的问题。
技术实现思路
1、本申请实施例的目的在于提出一种发票入池方法、装置、计算机设备及存储介质,以解决传统的发票管理方法存在管理分散、传统手工收集发票、人工识别查验发票的局限性的问题。
2、为了解决上述技术问题,本申请实施例提供一种发票入池方法,采用了如下所述的技术方案:
3、获取待入池的发票图像信息;
4、对所述发票图像信息进行文本识别处理,得到发票文本信息;
5、对所述发票文本信息进行结构化处理,得到发票结构化数据;
6、调用税局查验接口,并通过所述税局查验接口将所述发票结构化数据发送至税局抵账库,以使所述税局抵账库对所述发票结构化数据进行查验处理;
7、接收所述税局抵账库发送的发票查验结果;
8、若所述发票查验结果为查验不通过,则根据所述发票查验结果携带的差异比对信息对所述发票结构化数据进行修正,得到符合查验条件的目标发票数据;
9、若所述发票查验结果为查验通过,则直接将所述发票结构化数据作为所述目标发票数据;
10、将所述目标发票数据写入企业级发票池。
11、进一步的,在所述对所述发票图像信息进行文本识别处理,得到发票文本信息的步骤之前,还包括下述步骤:
12、对所述发票图像信息进行灰度化操作。
13、进一步的,所述对所述发票图像信息进行文本识别处理,得到发票文本信息的步骤,具体包括下述步骤:
14、对所述发票图像信息进行预识别操作,得到发票类型数据;
15、读取数据库,在所述数据库中获取与所述发票类型数据相对应的截图模版数据;
16、基于所述截图模版数据对所述发票图像信息进行图像截取操作,得到模版匹配截图;
17、在所述截图模板数据中对所述模版匹配截图进行相似匹配操作,得到模版匹配字段;
18、将所述模版匹配字段输入至文字识别模型进行文字识别操作,得到所述发票文本信息。
19、进一步的,在所述截图模板数据中对所述模版匹配截图进行相似匹配操作,得到模版匹配字段的步骤之后,包括下述步骤:
20、若所述相似匹配操作后存在不匹配的模板匹配截图,则对所述不匹配的模板匹配截图输入至图像分割模型进行语义分割操作,得到所述模版匹配字段。
21、进一步的,所述图像分割模型以u-net作为网络架构。
22、为了解决上述技术问题,本申请实施例还提供一种发票入池装置,采用了如下所述的技术方案:
23、图像获取模块,用于获取待入池的发票图像信息;
24、文本识别模块,用于对所述发票图像信息进行文本识别处理,得到发票文本信息;
25、结构化模块,用于对所述发票文本信息进行结构化处理,得到发票结构化数据;
26、查验处理模块,用于调用税局查验接口,并通过所述税局查验接口将所述发票结构化数据发送至税局抵账库,以使所述税局抵账库对所述发票结构化数据进行查验处理;
27、结果接收模块,用于接收所述税局抵账库发送的发票查验结果;
28、数据修正模块,用于若所述发票查验结果为查验不通过,则根据所述发票查验结果携带的差异比对信息对所述发票结构化数据进行修正,得到符合查验条件的目标发票数据;
29、数据确认模块,用于若所述发票查验结果为查验通过,则直接将所述发票结构化数据作为所述目标发票数据;
30、数据写入模块,用于将所述目标发票数据写入企业级发票池。
31、为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
32、包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上所述的发票入池方法的步骤。
33、为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
34、所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上所述的发票入池方法的步骤。
35、本申请提供了一种发票入池方法,包括:获取待入池的发票图像信息;对所述发票图像信息进行文本识别处理,得到发票文本信息;对所述发票文本信息进行结构化处理,得到发票结构化数据;调用税局查验接口,并通过所述税局查验接口将所述发票结构化数据发送至税局抵账库,以使所述税局抵账库对所述发票结构化数据进行查验处理;接收所述税局抵账库发送的发票查验结果;若所述发票查验结果为查验不通过,则根据所述发票查验结果携带的差异比对信息对所述发票结构化数据进行修正,得到符合查验条件的目标发票数据;若所述发票查验结果为查验通过,则直接将所述发票结构化数据作为所述目标发票数据;将所述目标发票数据写入企业级发票池。与现有技术相比,本申请通过对待入池的发票图像信息进行文本识别处理以提取该发票图像信息的发票文本信息后,对该发票文本信息进行结构化处理,以得到税局抵账库能够进行查验的结构标准化的发票结构化数据,并通过该税局抵账库对该发票结构化数据进行查验,最终将符合查验的发票结构化数据写入企业级发票池,从而有效解决解决发票管理分散、传统手工收集发票、人工识别查验发票的局限性的问题,建设一套基于企业多业务场景下的自动归集获取发票、自动ocr识别并提取发票全票面信息、自动连通税局底账库信息查验、自动与发票版式文件进行关联,并自动按照入池标准确认写入企业级发票池的方法和组件装置,为企业发票池数据管理的规范性、多场景性、准确性和便捷性提供有效技术支撑。
1.一种发票入池方法,其特征在于,包括下述步骤:
2.根据权利要求1所述的发票入池方法,其特征在于,在所述对所述发票图像信息进行文本识别处理,得到发票文本信息的步骤之前,还包括下述步骤:
3.根据权利要求1所述的发票入池方法,其特征在于,所述对所述发票图像信息进行文本识别处理,得到发票文本信息的步骤,具体包括下述步骤:
4.根据权利要求3所述的发票入池方法,其特征在于,在所述截图模板数据中对所述模版匹配截图进行相似匹配操作,得到模版匹配字段的步骤之后,包括下述步骤:
5.根据权利要求4所述的发票入池方法,其特征在于,所述图像分割模型以u-net作为网络架构。
6.一种发票入池装置,其特征在于,包括:
7.根据权利要求6所述的发票入池装置,其特征在于,所述装置还包括:
8.根据权利要求6所述的发票入池装置,其特征在于,所述文本识别模块包括:
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至5中任一项所述的发票入池方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至5中任一项所述的发票入池方法的步骤。