报关信息处理方法、装置及电子设备与流程

文档序号:26404613发布日期:2021-08-24 16:18阅读:208来源:国知局
报关信息处理方法、装置及电子设备与流程

本申请涉及跨境供应链系统技术领域,特别是涉及报关信息处理方法、装置及电子设备。



背景技术:

跨境商品对象信息系统可以为用户提供“全球买全球卖”的服务,也即,无论是买家还是卖家都可以来自多个不同的国家。在这种场景下,买卖双方在线上达成交易之后,在后续的履约环节,需要通过关务、税务、跨境物流等一系列复杂的环节,才能够将货品送达买家用户指定的收货地址。

其中,关务环节,就是在货物出口之前,卖家用户需要委托专业或代理报关企业(通常可以称为“报关行”或者报关公司等)向出口海岸海关办理申报手续。在传统的方式下,具备报关资格的报关行需要预先在海关系统中进行备案,海关系统可以为其提供相关的账号等信息。这样,报关行在接收到其客户的报关委托后,就可以利用上述账号信息登录到海关系统,填写报关单,以进行具体报关所需数据的录入或者附件等材料的提交等处理。之后,海关系统做内部的检查和处理,在检查无误的情况下,完成报关工作。

为了便于完成上述跨境贸易的履约过程,一些系统还可以为用户提供跨境供应链服务,其中就包括关务环节的服务,跨境物流环节的服务。在这种跨境供应链系统出现以后,可以将报关行准入到具体的供应链系统中,使得报关行成为跨境供应链系统的用户。这样,在报关行接收到具体客户的委托之后,便可以通过该供应链系统进行报关单的填写,之后,供应链系统可以将具体的报关单信息提交给海关系统。在此过程中,报关行可以利用供应链系统提供的相关服务,达到提升效率,简化数据管理等目的。

但是,现有的供应链系统在帮助用户提升效率方面还存在进一步的提升空间。例如,报关单中涉及到的字段往往非常多,而报关单的填写是一个严肃的过程,因此,通常涉及到大量的需要输单员手动输入的工作,以至于造成对报关行人力资源的占用。另外,手动输入的过程,也可能会容易出错,导致报关失败等情况发生,甚至可能使得跨境订单的配送时效被延误,影响买卖双方用户的体验。

因此,如何进一步提升报关单生成过程中的工作效率,成为需要本领域技术人员解决的技术问题。



技术实现要素:

本申请提供了报关信息处理方法、装置及电子设备,可以提升报关单生成效率,同时降低由于手动输入过程造成的输入错误等情况的发生概率。

本申请提供了如下方案:

一种报关信息处理方法,包括:

确定待生成的报关单关联的报关材料文件;

对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

一种报关信息处理方法,包括:

确定待生成的报关单关联的报关材料文件;

对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体对,其中,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息,所述命名实体包括:所述文本信息内容中的连续字符片段;

根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中;

在针对所述报关单中未自动匹配成功的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

一种生成报关单的方法,包括:

确定待生成的报关单关联的报关材料文件;

对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息;

根据所述目标字段中的已输入信息,生成所述报关单。

一种待申报信息处理方法,包括:

确定待生成的待申报信息关联的申报材料文件;

对所述申报材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

在针对所述待申报信息中的目标字段进行信息录入操作的过程中,根据从所述申报材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

一种报关信息处理装置,包括:

报关材料文件确定单元,用于确定待生成的报关单关联的报关材料文件;

命名实体识别单元,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元,用于在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

一种报关信息处理装置,包括:

报关材料文件确定单元,用于确定待生成的报关单关联的报关材料文件;

命名实体对识别单元,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体对,其中,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息,所述命名实体包括:所述文本信息内容中的连续字符片段;

匹配单元,用于根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中;

推荐信息提供单元,用于在针对所述报关单中未自动匹配成功的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

一种生成报关单的装置,包括:

报关材料文件确定单元,用于确定待生成的报关单关联的报关材料文件;

命名实体识别单元,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元,用于在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息;

报关单生成单元,用于根据所述目标字段中的已输入信息,生成所述报关单。

一种待申报信息处理装置,包括:

申报材料文件确定单元,用于确定待生成的待申报信息关联的申报材料文件;

命名实体识别单元,用于对所述申报材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元,用于在针对所述待申报信息中的目标字段进行信息录入操作的过程中,根据从所述申报材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

根据本申请提供的具体实施例,本申请公开了以下技术效果:

通过本申请实施例,能够确定出确定待生成的报关单关联的报关材料文件,并对所述报关材料文件的文本信息内容进行识别,确定其中包括的多个命名实体,这样,在接收针对所述报关单中的目标字段的信息录入操作的过程中,可以根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。通过这种方式,由于报关材料文件作为报关单的填写依据,其中包含的信息与当前报关单是息息相关的,因此,根据具体对报关材料文件的命名实体识别结果,对报关单填写过程中具体字段待输入内容进行推荐,可以获得较高的推荐准确度,使得输单员直接从推荐信息中选择具体需要录入的内容即可,因此可以提升报关单生成效率,同时降低由于手动输入过程造成的输入错误等情况的发生概率。

当然,实施本申请的任一产品并不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的系统架构的示意图;

图2是本申请实施例提供的第一方法的流程图;

图3是本申请实施例提供的界面的示意图;

图4是本申请实施例提供的第二方法的流程图;

图5是本申请实施例提供的第三方法的流程图;

图6是本申请实施例提供的第四方法的流程图;

图7是本申请实施例提供的第一装置的示意图;

图8是本申请实施例提供的第二装置的示意图;

图9是本申请实施例提供的第三装置的示意图;

图10是本申请实施例提供的第四装置的示意图;

图11是本申请实施例提供的电子设备的示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本申请保护的范围。

首先需要说明的是,本申请实施例提供的跨境供应链系统在关务环节面向的用户主要可以为报关行等具有报关资质的实体。在实际应用中,具体的出口企业(或者通过货代公司等)委托报关行生成报关单,在委托信息中通常可以包括报关材料文件。报关材料文件中的信息内容主要可以包括关联的交易订单的信息(包括商品对象的名称,数量,重量,收货地信息,等等),或者,还可以包括关联的提运单信息(主要是指运输服务提供者向海关申报的载货清单信息,例如,可以包括出口口岸、运输工具名称、集装箱信息、运抵国信息等项目),等等。报关行在收到具体的报关委托信息后,就可以获取到这种报关材料文件,后续可以根据报关材料文件生成具体的报关单。其中,报关材料文件可以由报关委托的发起方提供,或者,关于提运单信息,委托方也可以仅提供提运单号以及出境关别等信息,然后,具体的供应链系统可以通过与对应的地方电子口岸系统进行对接,获取具体的提运单号关联的详情信息,等等。

在传统的实现方案中,可以由报关行的输单员以具体的报关材料文件为依据,将具体的信息内容手动输入到报关单中各个对应的字段中。其中,所谓报关单,是报关行按照海关规定的格式对进出口货物的实际情况做出书面申明,以此要求海关对其货物按适用的海关制度办理通关手续的法律文书。因此,出口货物报关单的字段通常非常多,例如,其中主要的字段可以包括出口货物名称、件数、重量、单位、总价、出口口岸、运输工具名称、集装箱信息、经营单位、收货单位、合同协议、贸易性质、消费国等项目。其中,报关单与提运单是一一对应的,填制报关单的原则:单单相符,并且做完后的报关单据上的内容,需要与提运单的各项数据内容能够一一对应。

在本申请实施例中,为了进一步提升报关单生成过程中的工作效率,同时提升报关单与提运单等其他单据中具体字段在内容上的一致性,提供了相应的解决方案。在该方案中,可以对具体的报关材料文件中的文本信息内容进行识别,确定出其中包括的多个命名实体(具体可以是文本信息内容中的连续字符片段),然后,在用户具体对报关单中的字段进行信息录入的过程中,可以根据这种识别结果,提供关于所述目标字段中待输入信息的推荐信息。例如,报关单中某个字段为“商品编号”,报关材料文件中识别出的命名实体包括“6404199000”等,则在用户针对该字段进行信息录入时,便可以将“6404199000”等推荐给用户,用户可以从中选择具体的编号,而不需要再逐个字符的进行输入操作,因此,可以提升效率,并且,也降低输入错误等情况的发生概率,有利于保持与报关材料文件中具体信息的一致性。

另外,在可选的实施方式中,在对报关材料文件中的文本信息内容进行识别时,还可以识别出具体命名实体之间的位置关系信息,以此确定出报关材料文件中包括的字段名称与具体字段内容之间的对应关系,这样,可以根据这种对应关系,将具体的命名实体匹配到报关单中对应的字段中,对于这类字段,不再需要用户执行手动的输入操作。当然,对于报关材料文件中不存在的内容,或者,未能准确从报关材料文件中准确识别出上述对应关系的内容,仍然可以由报关行的用户手动输入。在手动输入的过程中,则同样可以继续利用命名实体识别结果提供相应的推荐信息。

再者,在具体实现时,除了可以利用从报关材料文件中识别出的命名实体提供具体的推荐信息之外,还可以与历史数据相结合,进行综合的信息推荐。

具体从系统架构角度而言,参见图1,本申请实施例主要涉及跨境供应链系统,该系统中可以提供关务相关的服务模块,该服务模块面向的用户主要为报关行等具有报关资质的实体。出口企业等用户可以通过一些方式向报关行发送报关委托,例如,一种方式下,跨境供应链系统也可以针对出口企业用户提供对应的服务模块,出口企业用户可以通过该服务模块向关务服务模块发送报关委托,等等。报关行接收到报关委托后,可以获取到报关材料文件,之后,可以通过跨境供应链系统进行报关单的生成。在生成报关单的过程中,则可以利用本申请实施例提供的方案,对报关材料文件进行命名实体识别,并为输单员等用户提供相关的推荐信息,以提升报关单的生成效率,降低出错、信息不一致等情况的概率。

其中,上述跨境供应链系统具体可以通过saas(software-as-a-service,软件即服务)的模式为用户提供服务。saas是一种基于互联网提供软件服务的应用模式,saas平台供应商将应用软件统一部署在自己的服务器上,客户可以根据工作实际需求,通过互联网向供应商定购所需的应用软件服务,并通过互联网获得saas平台供应商提供的服务。也就是说,报关行等用户可以通过浏览器等访问具体跨境供应链系统提供的相关网页,并获得相关的服务。当然,在实际应用中,考虑到有些场景下可能需要涉及到对本地文件的操作,例如,批量上传单证材料等,因此,也可以为用户提供以独立应用程序等形式存在的客户端,用户可以在其终端设备中安装这种应用程序,通过该应用程序实现与服务端的交互,并获取到相关的服务。通过这种独立应用程序的形式存在的客户端,可以更方便地进行本地文件的操作。

首先,本申请实施例从上述跨境供应链系统的角度,提供了一种报关单信息处理方法,参见图2,该方法具体可以包括:

s201:确定待生成的报关单关联的报关材料文件。

如前文所述,具体的报关材料文件可以由出口企业等委托方用户进行提供,或者,还可以在报关行接收到具体的委托信息后,根据委托信息中包含的提运单号、出境关别等信息,到关联的地方电子口岸系统查询获取到关于提运单的更多详细信息,等等。

为了便于理解,这里首先对提运单及其与报关单的关系进行简单介绍。关于提运单,具体的出口企业用户在对订单进行发货之前,首先可以向船公司相关的网站系统等进行运输资源(包括船号,航次等)的申请,并向离境口岸对应的电子口岸系统进行舱单申报(或者也可以委托货代公司完成舱单申报的过程中)。其中,舱单申报主要是将船名,航次,离境口岸,出境关别,柜子规格,集装箱信息,货物信息等提交到具体离境口岸对应的电子口岸系统。相应的,电子口岸系统会生成对应的提运单号,并将舱单申报相关的详情信息与提运单号之间的对应关系在电子口岸系统中进行保存。

完成舱单申报后,可以委托报关行进行报关处理。其中,具体的委托信息中至少可以包括提运单号信息,出境关别信息等。另外,也可以提供更多详细的相关信息给报关行,包括具体提运单号关联的船名,航次,离境口岸,出境关别,柜子规格,集装箱信息,货物信息,等等。当然,除了提运单相关的信息之外,具体的委托信息中还可以包括关联的交易订单的信息,具体可以包括商品对象在系统中的编号、名称、数量、收货信息,等等。

报关行接收到具体的报关委托后,便可以根据具体的委托请求获取到报关材料文件,之后,可以以报关材料文件为依据,进行报关单的生成。

其中,在本申请实施例中,在获取到具体的报关材料文件之后,在具体进行报关单录入等操作时,便可以首先创建新的报关单,并将报关材料文件录入到跨境供应链系统中。这样,跨境供应链系统便可以确定出报关单与报关材料文件之间的对应关系。

s202:对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

在确定出报关材料文件之后,可以对其中的文本信息内容进行识别,确定其中包括的多个命名实体。其中,所谓的命名实体具体可以是文本信息内容中的连续字符片段,例如,具体可以包括人名、机构名、地名以及其他所有以名称为标识的实体,另外,更广泛的实体还可以包括数字、日期、货币、地址等等。具体实现时,在一种实现方式下,可以利用自然语言处理(naturallanguageprocessing,nlp)中的命名实体识别(namedentityrecognition,ner)技术实现具体的识别过程。

需要说明的是,在实际应用中,具体的报关材料文件的文件格式可能有多种,例如,具体可以电子表格(例如,excel等)、可编辑格式的文档(例如,word等)、不可编辑格式的文档(例如,pdf、jpg等)等。其中,对于不可编辑格式的文档而言,首先可以通过ocr(opticalcharacterrecognition,光学字符识别)技术从文档中识别出具体的字符,然后,再利用ner技术进行命名实体识别。而对于电子表格或者其他的可编辑格式的文档,则可以直接对其中的文本信息内容进行ner识别。

另外需要说明的是,在具体实现时,报关单的字段很多,可以全部由输单员一一进行录入,或者,本申请实施例还可以提供由供应链系统对一些字段的内容进行自动匹配的实现方案。也就是说,由于具体报关材料文件中,具体的信息通常也是以<字段名称,字段内容>对的形式出现,而报关材料文件中的字段与报关单中的字段通常具有对应关系,或者通过具体的字段转化处理等,转化出对应关系,等等。例如,报关材料文件中可以包括商品对象类目、数量、类型等字段,报关单中也可以包括上述字段。其中,对于商品对象的数量、类型等,可以直接将报关材料文件中具体商品对象的数量、类型等字段上的值,填入报关单中商品对象的数量、类型字段。或者,对于商品对象类目信息,还可以通过预先建立的类目映射引擎,将报关材料文件中的商品对象类目,映射成符合海关归类规则的类目描述信息,等等。因此,如果能够识别出报关材料文件中的命名实体,以及两个命名实体在同一字段的名称与字段之间的对应关系,则可以将具体的字段内容自动匹配到报关单中对应的字段中。当然,在进行自动匹配的过程中,由于报关材料文件可能不够规范等原因,可能会导致某些命名实体虽然代表字段名称以及字段内容,但是,无法准确识别出具体的对应关系,以至于并不是报关单中的全部字段都能够实现自动匹配。对于无法进行自动匹配的字段,仍然可以通过人工输入的方式进行补充录入。而在人工补充录入的过程中,则又可以用到本申请实施例中关于具体字段中待输入内容的推荐信息,对此,后文中会有详细介绍。

其中,为了达到上述自动匹配目的,在对报关材料进行识别时,除了识别具体的命名实体,还可以识别出命名实体之间的位置关系信息,以此确定出多个命名实体对,这种命名实体对中的两个命名实体对应同一字段的名称与内容信息。例如,某字段的名称为“运抵国”,该字段的内容为“美国”,其中,“运抵国”以及“美国”会被识别为两个不同的命名实体。但是,仅通过命名实体识别,无法确定这两个命名实体之间是否存在某种关系。而通常情况下,具有对应关系的字段名称与内容,在位置上通常存在明显的特征,例如,字段的名称在左,内容在右,等等。因此,就可以结合对位置信息的识别,确定出命名实体之间的对应关系。进而还可以根据这种对应关系信息,实现对报关单中对应字段的自动匹配。也就是说,在前述例子中,假设报关材料文件中包括“运抵国”这一字段,对应识别出的该字段的内容包括“美国”,则在生成报关单时,对于报关单中的“运抵国”这一字段,跨境供应链系统可以自动将“美国”填入对应的输入框中,而不再需要由输单员进行手动的输入操作,因此,可以进一步提升效率,降低出错概率。

为了实现对命名实体的位置信息的识别,针对各种不同格式的报关材料文件,也可以有不同的处理方式。例如,对于如果所述报关材料文件为电子表格类文件,由于电子表格文件中天然包括有坐标等位置信息,例如,包括行号、列号,等等。因此,可以直接对所述电子表格类文件中的文本信息内容进行命名实体识别,然后,根据所识别出的命名实体识别在所述电子表格文件中的位置信息,确定所述命名实体之间的位置关系信息。

而如果所述报关材料文件为不可编辑格式,则具体在对报关材料文件的文本信息内容进行识别时,首先可以对报关材料文件进行ocr识别,确定其中包含的字符以及对应的位置信息;之后,对ocr识别结果中包含的字符信息进行命名实体识别,确定所述报关材料文件中包含的命名实体;再根据所述ocr识别结果中包含的位置信息,确定所述命名实体之间的位置关系信息。也就是说,ocr技术不仅能够识别出具体的字符,还能够识别出具体字符的位置信息,因此,可以利用这一特点,首先对命名实体位置信息的识别。

另外,如果报关材料文件为可编辑格式,例如,word等,这种文档中的文本信息内容是可读且可编辑的,如果仅需要进行命名实体识别,则直接按照ner算法进行识别即可。但是,由于ner算法通常无法识别出位置信息,因此,具体实现时,对于word等可编辑格式的报关材料文件,可以首先将所述报关材料文件转换为不可编辑格式,例如,pdf格式等,然后,再按照前述针对不可编辑格式的报关材料文件对应的方式进行命名实体及其位置信息的识别。

s203:在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

在对报关材料文件进行了命名实体识别之后,在对报关单中的具体字段进行信息录入的过程中,则可以根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

其中,由于具体从该报关材料文件中识别出的命名实体的数量通常会比较多,因此,在具体提供推荐信息时,还可以根据一定的策略来进行推荐。例如,对于报关单中的部分字段,对应的待输入内容可能符合某种文本规则,具体如,对于“商品编号”字段,对应的内容通常是一定位数的数字,等等。因此,具体实现时,可以预先对具体字段对应的文本规则等信息进行保存,这样,在针对该字段进行内容输入时,可以首先可以根据预先保存的信息确定出当前字段是否关联某种文本规则,如果是,则可以根据符合所述文本规则的命名实体,确定具体的推荐信息。例如,对于前述“商品编号”字段,对应的文本规则是:11位纯数字,则可以从具体识别出的命名实体中,选择符合上述规则的命名实体,为用户提供对应的推荐信息。

或者,对于报关单中更多的字段而言,可能并不存在具体的文本规则,此时,则可以根据与输单员之间进行交互反馈的方式,来提供具体的推荐信息。也就是说,在这种情况下,可以是在输单员为具体的字段输入了一部分信息之后,基于已输入的部分信息,确定出与其具有相关行的命名实体,然后作为推荐信息提供给用户,供其进行选择,等等。

其中,对于中文用户而言,具体用户已输入的部分信息可以包括中文,也可以包括中文的简拼字母(汉语拼音的声母或者声母首字母)等信息。另外,可以将具体匹配的命名实体包含的全部字符或者部分字符确定为所述推荐信息。例如,假设从报关材料文件中识别出的命名实体包括:垫圈,是机器用,10kg,5元/斤,100元,照章征税,美国,黑龙江等。此时,可以根据用户针对某字段已输入的部分信息进行匹配,其中,具体可以从左开始匹配,或者,还可以从中间开始匹配,等等。例如,用户输入“是”,则可以提示“是机器用”;用户输入“是机”,同样可以提示“是机器用”;如果用户输入的是“机”或者“机器”,则可以提示“机器用”,等等。

对于输入具体待输入内容的简拼字母等情况,例如,某字段中待输入内容是“是机器用”,则输单员可以在输入框中输入“sjqy”,此时,也可以根据命名实体中的各汉字的拼音首字母与该输入信息的匹配结果,提供对应的推荐信息。或者,如果用户输入的是“s”或者“sj”,也可以提示“是机器用”。如果用户输入的是“jq”,则可以提示“机器用”,等等。

另外,如前文所述,具体实现时,还可以确定出命名实体之间的位置关系信息,并根据所述位置关系信息,确定所述报关材料文件中包含的字段名称与字段内容之间的对应关系;然后,可以根据所述对应关系信息,将所述字段内容自动匹配到所述报关单中对应的字段中。

当然,由于具体的报关材料文件可能是由出口企业等委托方提供的,而不同的委托方通常是按照各自的工作习惯等来提供具体的报关材料文件,因此,不仅文件的格式可能不统一,文件内的文本排版方式等通常也具有很强的随意性,也即,导致实际收到的报关材料文件的规范性不高。进而在本申请实施例中,由于上述情况的存在,在对报关材料文件中的命名实体及其之间的关系进行识别时,可能存在以下情况:报关材料文件中存在某命名实体关系对,但是,由于排版过于混乱等原因,使得具体的算法虽然能够识别出其中包括的命名实体,但是,无法准确将不同命名实体在字段的名称与内容之间的对应关系对识别出来,因此,也就无法自动匹配到报关单中对应的字段中。对于这种情况,就会存在报关单中的某些字段无法完成内容的自动匹配,因此,通常仍然需要输单员进行手动输入。而针对需要进行手动输入的字段,同样可以利用本申请实施例提供的方案,为用户提供对应的推荐信息,以提升效率,降低出错概率。

具体实现时,可以优先利用识别出的命名实体以及在字段名称、字段内容之间的对应关系,对报关单中对应字段进行内容的自动匹配。之后,可以根据未能匹配到所述报关单中对应的字段中的命名实体,提供关于所述目标字段中待输入信息的推荐信息。也就是说,假设从报关材料文件中识别出20个命名实体,其中12个已经自动匹配到报关单中对应的字段中,则在输单员对其他字段进行手动输入的过程中,可以根据剩余的8个尚未匹配到报关单中的命名实体,提供对应的推荐信息。

另外,在具体实现时,除了可以利用从报关材料文件中识别出的命名实体提供具体的推荐信息之外,还可以与历史数据相结合,进行综合的信息推荐。例如,对于商品编号、商品名称等字段的具体内容,由于具体的商品编号、商品名称等通常是系统中定义的,并且,对于同一出口企业而言,由于经营的商品对象类目等通常是相对固定的,因此,可能在针对历史交易订单生成报关单的过程中,曾经填写过相关的数据,例如,用户曾经输入过某商品编号、名称等,因此,可以在系统中进行保存。这样,可以利用这种历史数据,为用户提供具体的推荐信息。

当然,由于报关材料文件中的命名实体识别结果对于当前报关单填写而言具有更高的参考价值,因此,具体实现时,可以优先利用从报关材料文件中识别出的命名实体进行推荐,如果命名实体识别结果中不存在匹配的推荐结果,再利用历史数据进行推荐。

例如,假设用户在某报关单的“商品名称”字段中输入了“钢”,此时,如果从报关资料中识别出的命名实体中存在与“钢”字相关的命名实体,则可以利用该命名实体为用户提供推荐信息。例如,报关材料文件中识别出的命名实体中包括“钢丝绳”,则可以将该命名实体推荐给用户。否则,如果报关材料文件中识别出的命名实体均与“钢”无关,则可以根据历史数据,提供更多与“钢”有关的推荐信息。例如,如图3所示,可以包括“钢丝绳”、“钢丝封条”、“不锈钢灶台”、“不锈钢货架”,等等,用户可以从中进行选择。

总之,通过本申请实施例,能够确定出待生成的报关单关联的报关材料文件,并对所述报关材料文件的文本信息内容进行识别,确定其中包括的多个命名实体,这样,在接收针对所述报关单中的目标字段的信息录入操作的过程中,可以根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。通过这种方式,由于报关材料文件作为报关单的填写依据,其中包含的信息与当前报关单是息息相关的,因此,根据具体对报关材料文件的命名实体识别结果,对报关单填写过程中具体字段待输入内容进行推荐,可以获得较高的推荐准确度,使得输单员直接从推荐信息中选择具体需要录入的内容即可,因此可以提升效率,同时降低由于手动输入过程造成的输入操作等情况的发生概率。

实施例二

在该实施例二中,提供了另一种报关信息处理方法,参见图4,该方法可以包括:

s401:确定待生成的报关单关联的报关材料文件;

s402:对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体对,其中,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息,所述命名实体为所述文本信息内容中的连续字符片段;

s403:根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中;

s404:在针对所述报关单中未自动匹配成功的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

实施例三

在该实施例三中,还提供了一种生成报关单的方法,参见图5,该方法具体可以包括:

s501:确定待生成的报关单关联的报关材料文件;

s502:对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

s503:在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息;

s504:根据所述目标字段中的已输入信息,生成所述报关单。

实施例四

在前述实施例中,主要是针对报关单的生成过程,提供了相关的推荐信息。而在实际应用中,具体与跨境交易相关的履约环节中,除了报关单,还可能涉及到对订单数据的申报,或者,对税务相关的数据的申报,等等。这些数据作为一种待申报信息,也可以是根据具体的申报材料文件生成的。在根据申报材料文件生成这种待申报信息的过程中,也可以对申报材料文件进行命名实体识别,并为具体待申报信息中的具体字段的信息录入提供对应的推荐信息。

具体的,参见图6,该实施例四提供了一种待申报信息处理方法,该方法具体可以包括:

s601:确定待生成的待申报信息关联的申报材料文件;

s602:对所述申报材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

s603:在针对所述待申报信息中的目标字段进行信息录入操作的过程中,根据从所述申报材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

关于该实施例二至四中的未详述部分,可以参见实施例一中的记载,这里不再赘述。

需要说明的是,本申请实施例中可能会涉及到对用户数据的使用,在实际应用中,可以在符合所在国的适用法律法规要求的情况下(例如,用户明确同意,对用户切实通知,等),在适用法律法规允许的范围内在本文描述的方案中使用用户特定的个人数据。

与实施例一相对应,本申请实施例还提供了一种报关信息处理装置,参见图7,该装置可以包括:

报关材料文件确定单元701,用于确定待生成的报关单关联的报关材料文件;

命名实体识别单元702,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元703,用于在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

其中,所述推荐信息提供单元具体可以用于:

确定所述目标字段的待输入信息关联的文本规则;

根据符合所述文本规则的命名实体,确定所述推荐信息。

或者,所述推荐信息提供单元具体可以用于:

根据所述命名实体与所述目标字段中已输入的部分信息的相关性,确定所述推荐信息。

其中,所述目标字段的待输入信息包括中文信息,所述已输入的部分信息包括:所述中文信息中的部分中文字符,或者所述中文信息对应的简拼字母信息。

其中,具体推荐信息提供单元具体可以用于:

根据所述命名实体与所述目标字段中已输入的部分信息的相关性,将所述命名实体包含的全部字符或者部分字符确定为所述推荐信息。

另外,该装置还可以包括:

位置关系信息确定单元,用于在对所述报关材料文件的文本信息内容进行识别时,确定所述命名实体之间的位置关系信息;

命名实体对确定单元,用于根据所述位置关系信息,确定多个命名实体对,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息;

匹配单元,用于根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中。

此时,所述推荐信息提供单元具体可以用于:

根据未能匹配到所述报关单中对应的字段中的命名实体,提供关于所述目标字段中待输入信息的推荐信息。

其中,如果所述报关材料文件为电子表格类文件,则所述位置关系信息确定单元具体可以用于:

对所述电子表格类文件中的文本信息内容进行命名实体识别;

根据所识别出的命名实体识别在所述电子表格文件中的位置信息,确定所述命名实体之间的位置关系信息。

其中,如果所述报关材料文件为不可编辑格式,则所述位置关系信息确定单元具体可以包括:

ocr识别子单元,用于对所述报关材料文件进行光学字符识别ocr,确定其中包含的字符以及对应的位置信息;

命名实体识别子单元,用于对ocr识别结果中包含的字符信息进行命名实体识别,确定所述报关材料文件中包含的命名实体;

位置关系确定子单元,用于根据所述ocr识别结果中包含的位置信息,确定所述命名实体之间的位置关系信息。

另外,该装置还可以包括:

文件格式转换单元,用于如果所述报关材料文件为可编辑格式,则将所述报关材料文件转换为不可编辑格式,并按照所述不可编辑格式的报关材料文件对应的方式进行识别。

再者,该装置还可以包括:

历史记录数据确定单元,用于确定所述报关材料文件关联的历史记录数据;

历史记录推荐单元,用于如果不存在与所述目标字段匹配的命名实体,则根据历史记录数据提供关于所述目标字段中待输入信息的推荐信息。

与实施例二相对应,本申请实施例还提供了一种报关信息处理装置,参见图8,该装置可以包括:

报关材料文件确定单元801,用于确定待生成的报关单关联的报关材料文件;

命名实体对识别单元802,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体对,其中,所述命名实体对中的两个命名实体对应同一字段的名称与内容信息,所述命名实体包括:所述文本信息内容中的连续字符片段;

匹配单元803,用于根据所述同一字段的名称与内容信息之间的对应关系信息,将代表字段内容的命名实体自动匹配到所述报关单中对应的字段中;

推荐信息提供单元804,用于在针对所述报关单中未自动匹配成功的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

与实施例三相对应,本申请实施例还提供了一种生成报关单的装置,参见图9,该装置可以包括:

报关材料文件确定单元901,用于确定待生成的报关单关联的报关材料文件;

命名实体识别单元902,用于对所述报关材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元903,用于在针对所述报关单中的目标字段进行信息录入操作的过程中,根据从所述报关材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息;

报关单生成单元904,用于根据所述目标字段中的已输入信息,生成所述报关单。

与实施例四相对应,本申请实施例还提供了一种待申报信息处理装置,参见图10,该装置可以包括:

申报材料文件确定单元1001,用于确定待生成的待申报信息关联的申报材料文件;

命名实体识别单元1002,用于对所述申报材料文件的文本信息内容进行识别,确定其中包括的至少一个命名实体,所述命名实体包括:所述文本信息内容中的连续字符片段;

推荐信息提供单元1003,用于在针对所述待申报信息中的目标字段进行信息录入操作的过程中,根据从所述申报材料文件中识别出的所述命名实体,提供关于所述目标字段中待输入信息的推荐信息。

另外,本申请实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前述方法实施例中任一项所述的方法的步骤。

以及一种电子设备,包括:

一个或多个处理器;以及

与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行前述方法实施例中任一项所述的方法的步骤。

其中,图11示例性的展示出了电子设备的架构,具体可以包括处理器1110,视频显示适配器1111,磁盘驱动器1112,输入/输出接口1113,网络接口1114,以及存储器1120。上述处理器1110、视频显示适配器1111、磁盘驱动器1112、输入/输出接口1113、网络接口1114,与存储器1120之间可以通过通信总线1130进行通信连接。

其中,处理器1110可以采用通用的cpu(centralprocessingunit,中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。

存储器1120可以采用rom(readonlymemory,只读存储器)、ram(randomaccessmemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器1120可以存储用于控制电子设备1100运行的操作系统1121,用于控制电子设备1100的低级别操作的基本输入输出系统(bios)。另外,还可以存储网页浏览器1123,数据存储管理系统1124,以及报关信息处理系统1125等等。上述报关信息处理系统1125就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器1120中,并由处理器1110来调用执行。

输入/输出接口1113用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。

网络接口1114用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信。

总线1130包括一通路,在设备的各个组件(例如处理器1110、视频显示适配器1111、磁盘驱动器1112、输入/输出接口1113、网络接口1114,与存储器1120)之间传输信息。

需要说明的是,尽管上述设备仅示出了处理器1110、视频显示适配器1111、磁盘驱动器1112、输入/输出接口1113、网络接口1114,存储器1120,总线1130等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。

通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分所述的方法。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

以上对本申请所提供的报关信息处理方法、装置及电子设备,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1