本发明涉及数据识别,特别是涉及一种报关单数据识别方法及系统。
背景技术:
1、传统的跨境物流进出口报关由贸易方委托报关行来完成进出口报关业务,报关行以线下方式提供报关单证,因此存在跨境贸易和跨境物流通关数据孤岛的问题,总结起来存在以下核心问题:(1)数据孤岛的问题导致报关信息和物流通关数据无法以结构化数据进行管理维护;(2)贸易方传统的手工录入报关数据维护到信息化系统中,不仅工作量大,而且重复的劳动,容易出错;(3)报关单证无法鉴真;(4)无法实时监控查询物流通关状态。
技术实现思路
1、鉴于以上所述现有技术的缺点,本发明的目的在于提供一种报关单数据识别方法及系统,用于解决现有技术中数据孤岛的问题导致报关信息和物流通关数据无法以结构化数据进行管理维护的问题。
2、本发明的实施方式提供了一种报关单数据识别方法,包括以下步骤:获取用户上传的待识别的报关单,其中,所述报关单包括进口报关单和出口报关单;根据光学字符识别技术确定所述报关单的图像数据;获取对应所述报关单的预先设置的报关单模板;对齐所述图像数据和报关单的模板,根据对齐结果得出对齐后的图像数据;识别对齐后的图像数据对应报关单模板上识别区中的字符;将所述字符填入数据库表格内,根据填好的数据库表格生成电子版报关单。
3、本发明的实施方式还提供了一种报关单数据识别系统,包括:获取模块,用于获取用户上传的待识别的报关单,其中,所述报关单包括进口报关单和出口报关单;获取对应所述报关单的预先设置的报关单模板;确定模块,用于根据光学字符识别技术确定所述报关单的图像数据;处理模块,用于对齐所述图像数据和报关单的模板,根据对齐结果得出对齐后的图像数据;识别对齐后的图像数据对应报关单模板上识别区中的字符;将所述字符填入数据库表格内,根据填好的数据库表格生成电子版报关单。
4、本发明的实施方式还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上述的报关单数据识别方法。
5、本发明实施方式相对于现有技术而言,主要区别及其效果在于:本发明通过光学字符识别技术将进口报关单或者出口报关单上的文字转化为图像数据,然后识别出图像数据中的字符,再将字符转化为结构化数据,也就是电子版进口报关单或者出口报关单,从而使得在报关单录入方面通过使用报关单识别的方式避免了重复性劳动,不仅提高了工作效率,也极大的提高了录入数据的准确性,本发明解决传统跨境贸易和跨境物流通关数据孤岛的问题,从而减少重复性劳动,提高工作效率,并且还可以主动对报关数据进行鉴真和通关状态查询。
6、作为进一步改进,所述根据光学字符识别技术确定所述报关单的图像数据,包括:使用光学字符识别技术对报关单进行处理,根据处理结果生成报关单的图像数据。
7、作为进一步改进,在所述根据光学字符识别技术确定所述报关单的图像数据之后,所述获取对应所述报关单的预先设置的报关单模板之前,包括:对所述报关单的图像数据进行预处理。
8、作为进一步改进,在所述获取对应所述报关单的预先设置的报关单模板之后,所述对齐所述图像数据和报关单的模板,根据对齐结果得出对齐后的图像数据之前,包括:比对图像数据和报关单的模板,根据比对结果确认图像数据是否为报关单的图像数据;若是,则执行对齐报关单的图像数据和报关单的模板。
9、上述方案通过将图像数据和报关单的模板进行比对,可以判别出该图像数据是否是报关单的图像数据,从而可以避免用户将报关单上传错误的情况。
10、作为进一步改进,所述进口报关单和出口报关单都有固定的单证表格格式,所述数据库表格是在获取用户上传的待识别的报关单之前根据报关单的单证表格格式进行设计的。
11、作为进一步改进,在所述将所述字符填入数据库表格内,根据填好的数据库表格生成电子版报关单之后,包括:核对所述电子版报关单,根据核对结果得出核对后的电子版报关单。
12、上述方案通过对电子版报关单进行核对,可以避免了在识别图像数据内的字符时,识别出来的字符错误的问题,从而保证了识别的准确性。
13、作为进一步改进,在所述核对所述电子版报关单,根据核对结果得出核对后的电子版报关单之后,包括:获取国家贸易单一窗口内的报关单数据;比对所述核对后的电子版报关单和国家贸易单一窗口内的报关单数据,根据比对结果确认所述核对后的电子版报关单是否与国家贸易单一窗口内的报关单数据相同。
14、作为进一步改进,所述比对所述核对后的电子版报关单和国家贸易单一窗口内的报关单数据,根据比对结果确认所述核对后的电子版报关单是否与国家贸易单一窗口内的报关单数据相同,包括:判断所述核对后的电子版报关单和国家贸易单一窗口内的报关单数据是否相同;若是,则所述核对后的电子版报关单通过;若否,则所述核对后的电子版报关单不通过。
15、上述方案通过判断核对后的电子版报关单和国家贸易单一窗口内的报关单数据是否相同,则可以实现了对核对后的电子版报关单进行单证鉴真操作,从而避免了报关单造假。
1.一种报关单数据识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种报关单数据识别方法,其特征在于:所述根据光学字符识别技术确定所述报关单的图像数据,包括:
3.根据权利要求1所述的一种报关单数据识别方法,其特征在于:在所述根据光学字符识别技术确定所述报关单的图像数据之后,所述获取对应所述报关单的预先设置的报关单模板之前,包括:
4.根据权利要求1所述的一种报关单数据识别方法,其特征在于:在所述获取对应所述报关单的预先设置的报关单模板之后,所述对齐所述图像数据和报关单的模板,根据对齐结果得出对齐后的图像数据之前,包括:
5.根据权利要求1所述的一种报关单数据识别方法,其特征在于:所述进口报关单和出口报关单都有固定的单证表格格式,所述数据库表格是在获取用户上传的待识别的报关单之前根据报关单的单证表格格式进行设计的。
6.根据权利要求1所述的一种报关单数据识别方法,其特征在于:在所述将所述字符填入数据库表格内,根据填好的数据库表格生成电子版报关单之后,包括:
7.根据权利要求6所述的一种报关单数据识别方法,其特征在于:在所述核对所述电子版报关单,根据核对结果得出核对后的电子版报关单之后,包括:
8.根据权利要求7所述的一种报关单数据识别方法,其特征在于:所述比对所述核对后的电子版报关单和国家贸易单一窗口内的报关单数据,根据比对结果确认所述核对后的电子版报关单是否与国家贸易单一窗口内的报关单数据相同,包括:
9.一种报关单数据识别系统,其特征在于:包括:
10.一种电子设备,其特征在于,包括: