基于校验规则的信息录入方法、装置、设备及介质与流程

文档序号:33115284发布日期:2023-02-01 02:46阅读:21来源:国知局
基于校验规则的信息录入方法、装置、设备及介质与流程

1.本发明涉及计算机技术领域,尤其涉及一种基于校验规则的信息录入方法、装置、设备及介质。


背景技术:

2.企业在进行文件信息录入过程中,需要从文件中提取相应文本信息,并将文本信息录入填充至对应位置,然而现有技术方法中的文本信息录入过程中,仅对识别得到的文本信息统一进行格式校验后即录入,然而实际应用过程中仅对录入的文本信息进行统一校验,无法对不同类型文本信息中存在的错误进行针对性校验,导致对录入的信息进行校验的准确性不高、校验效果较差。因此,现有的技术方法在对录入信息进行校验过程中存在校验准确性不高的问题。


技术实现要素:

3.本发明实施例提供了一种基于校验规则的信息录入方法、装置、设备及介质,旨在解决现有技术方法在对录入信息进行校验过程中所存在的校验准确性不高的问题。
4.第一方面,本发明实施例提供了一种基于校验规则的信息录入方法,所述方法包括:
5.若接收到输入的录入需求信息,从预置的规则库获取与所述录入需求信息对应的校验规则;
6.根据所述录入需求信息及对应的校验规则生成录入任务;
7.若接收到与任一所述录入任务对应的录入文件,根据预置的识别模板库对所述录入文件进行识别以得到文件识别信息;
8.根据所述录入任务对所述文件识别信息进行填充并根据所述录入任务的校验规则对填充的所述文件识别信息同步进行校验,得到对应的校验结果;
9.判断所述校验结果中是否包含校验失败的填充信息;
10.若所述校验结果不包含校验失败的填充信息,根据所述录入任务提交填充的所述文件识别信息。
11.第二方面,本发明实施例提供了一种基于校验规则的信息录入装置,其包括:
12.校验规则获取单元,用于若接收到输入的录入需求信息,从预置的规则库获取与所述录入需求信息对应的校验规则;
13.录入任务生成单元,用于根据所述录入需求信息及对应的校验规则生成录入任务;
14.文件识别信息获取单元,用于若接收到与任一所述录入任务对应的录入文件,根据预置的识别模板库对所述录入文件进行识别以得到文件识别信息;
15.填充校验单元,用于根据所述录入任务对所述文件识别信息进行填充并根据所述录入任务的校验规则对填充的所述文件识别信息同步进行校验,得到对应的校验结果;
16.校验结果判断单元,用于判断所述校验结果中是否包含校验失败的填充信息;
17.提交单元,用于若所述校验结果不包含校验失败的填充信息,根据所述录入任务提交填充的所述文件识别信息。
18.第三方面,本发明实施例又提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如上述第一方面所述的基于校验规则的信息录入方法。
19.第四方面,本发明实施例还提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时实现如上述第一方面所述的基于校验规则的信息录入方法。
20.本发明实施例提供了一种基于校验规则的信息录入方法、装置、设备及介质。获取与输入的录入需求信息对应的校验规则并生成录入任务,根据识别模板库对与录入任务对应的录入文件进行识别得到文件识别信息,根据录入任务对文件识别信息进行填充并根据相应校验规则对填充的文件识别信息同步进行校验,得到校验结果,若校验结果不包含校验识别的填充信息,则根据录入任务提交填充的文件识别信息。通过上述方法,根据录入需求确定对应的校验规则并生成录入任务,在对录入任务对应的文件识别信息进行录入并同步进行针对性校验,针对不同录入需求对不同录入文本分别进行针对性校验,提高了对录入的信息进行校验的准确性。
附图说明
21.为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
22.图1为本发明实施例提供的基于校验规则的信息录入方法的流程示意图;
23.图2为本发明实施例提供的基于校验规则的信息录入方法的子流程示意图;
24.图3为本发明实施例提供的基于校验规则的信息录入方法的另一子流程示意图;
25.图4为本发明实施例提供的基于校验规则的信息录入方法的又一子流程示意图;
26.图5为本发明实施例提供的基于校验规则的信息录入方法的再一子流程示意图;
27.图6为本发明实施例提供的基于校验规则的信息录入方法的另一流程示意图;
28.图7为本发明实施例提供的基于校验规则的信息录入装置的示意性框图;
29.图8为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
30.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
31.应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
32.还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
33.还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
34.请参阅图1,图1为本发明实施例提供的基于校验规则的信息录入方法的流程示意图;该基于校验规则的信息录入方法应用于用户终端或管理服务器中,该基于校验规则的信息录入方法通过安装于用户终端或管理服务器中的应用软件进行执行,用户终端可接收输入的录入需求信息及录入文件,并对录入文件对应的文件识别信息进行录入及校验,其中,用户终端可以是台式电脑、笔记本电脑、平板电脑或手机等终端设备;管理服务器为可接收来自用户终端的录入需求信息及录入文件,对录入文件对应的文件识别信息进行录入及校验并反馈录入的文件识别信息至用户终端的服务器端,如企业或政府部门内部所构建的服务器端。如图1所示,该方法包括步骤s110~s160。
35.s110、若接收到输入的录入需求信息,从预置的规则库获取与所述录入需求信息对应的校验规则。
36.若接收到输入的录入需求信息,从预置的规则库获取与所述录入需求信息对应的校验规则。可接收所输入的录入需求信息,录入需求信息中可包括一个或多个需求项,每一需求项可对应包含包括录入条目、必要录入文件等信息,可从规则库中获取与各需求项对应的校验规则。录入条目也即是需要从录入文件中获取文本信息并录入的具体条目;必要录入文件也即是需要录入的文件信息。
37.在一具体的实施例中,如图2所示,步骤s110包括子步骤s111及s112。
38.s111、获取与所述录入需求信息中每一需求项对应的需求特征信息。
39.s112、获取所述规则库中与各所述需求项的需求特征信息相匹配的规则作为对应的校验规则。
40.具体的,可从录入需求信息的每一需求项中获取对应的需求特征信息,需求特征信息包括需求项中录入条目的类型,以及必要录入文件的文件数量、文件样式等信息。
41.规则库中包含多条规则,每一条规则对应不同的需求信息,可将规则库中各规则的需求信息与需求特征信息进行匹配,从而获取需求信息与需求特征信息相匹配的规则作为与该需求项相匹配的校验规则,通过这一匹配过程即可获取到与各需求项相匹配的校验规则,获取各需求项的校验规则作为与录入需求信息对应的校验规则。
42.s120、根据所述录入需求信息及对应的校验规则生成录入任务。
43.根据所述录入需求信息及对应的校验规则生成录入任务。根据录入需求信息及对应的校验规则,可进一步生成对应的录入任务,具体的,可将录入需求信息中的各需求项进行拆分,将各需求项与对应的校验规则进行组合,从而生成与每一需求项分别对应的录入任务。则录入任务的数量与录入需求信息中所包含的需求项的数量相等。
44.s130、若接收到与任一所述录入任务对应的录入文件,根据预置的识别模板库对所述录入文件进行识别以得到文件识别信息。
45.若接收到与任一所述录入任务对应的录入文件,根据预置的识别模板库对所述录入文件进行识别以得到文件识别信息。可对所生成的录入任务进行提示,用户可根据不同
录入任务对应输入录入文件。如生成与录入任务对应的录入窗口。当接收到用户根据录入任务输入的录入文件后,即可根据识别模板库对录入文件进行识别,从而得到对应的文件识别信息。识别模板库中包括多个识别模板,不同识别模板可对应对不同类型的录入文件进行识别,即可从识别模板库中获取与录入文件相匹配的识别模块,并通过相匹配的识别模板对录入文件进行识别。
46.在一具体的实施例中,如图3所示,步骤s130包括子步骤s131、s132及s133。
47.s131、从各所述录入文件中获取对应的文件特征信息。
48.具体的,可从录入文件中获取对应的文件特征信息,文件特征信息包括文件显示样式、文件标题等信息,显示样式包括横向显示、竖直显示等样式类型,文件标题也即是录入文件中用于概况文件大体含义的标题信息,如可从文件的页眉处识别获取文件的文件标题。将显示样式与文件标题组合即可得到该录入文件的文件特征信息。
49.s132、从所述识别模板库中获取与所述文件特征信息对应的识别模板。
50.识别模板库中包含多个识别模板,每一识别模板对应一组文件特征,可将识别模板的文件特征与文件特征信息进行匹配,从而获取与文件特征信息相匹配的识别模板。
51.s133、通过所述识别模板对与所述识别模板对应的录入文件进行识别,得到对应的文件识别信息。
52.可通过识别模板对与该识别模板对应的录入文件进行识别,识别模板可以是基于ocr(optical character recognition,光符识别)技术所构建的文本识别模板,通过识别模板可对录入文件中所包含的具体文本内容进行解析,得到文件识别信息。不同的识别模板对应的识别区域、识别字符库等存在差异,如对合同类型的录入文件进行识别及对电子发票类型的录入文件进行识别,所使用的识别模板的识别区域、识别字符库均存在区别。所识别得到的,文件识别信息可包含文字、字母、数字、符号等具体的文本内容。
53.s140、根据所述录入任务对所述文件识别信息进行填充并根据所述录入任务的校验规则对填充的所述文件识别信息同步进行校验,得到对应的校验结果。
54.根据所述录入任务对所述文件识别信息进行填充并根据所述录入任务的校验规则对填充的所述文件识别信息同步进行校验,得到对应的校验结果。可根据录入任务对文件识别信息进行填充,在进行填充的同时对所填充的文件识别信息同步进行校验,得到对应的校验结果,校验结果即包含所填充的文件识别信息是否存在校验失败填充信息的结果。
55.在一具体的实施例中,如图4所示,步骤s140包括子步骤s141、s142、s143、s144及s145。
56.s141、判断所述录入任务的录入条目中是否包含填充信息。
57.可首先判断录入任务的录入条目中是否包含填充信息,若录入任务的录入条目中未包含填充信息,则表明录入任务此时并未填充任何一条填充信息;若录入任务的录入条目包含填充信息,则表明录入任务此时已填充至少一条填充信息。
58.s142、若所述录入任务的录入条目中包含填充信息,根据所述校验规则对所述文件识别信息的当前填充信息进行信息校验,得到是否校验成功的第一校验结果。
59.若录入任务的录入条目中包含填充信息,则首先根据校验规则对文件识别信息的当前填充信息进行信息校验,文件识别信息的当前填充信息也即是当前需要填充至录入任
务的一条填充信息,此时仅通过校验规则对当前填充信息单独进行校验,单独校验可通过校验规则中与当前填充信息的录入条目对应的文本格式校验规则、文本长度校验规则,对当前填充信息进行校验,从而得到该当前填充信息是否校验成功的第一校验结果。
60.s143、根据所述校验规则对所述录入条目中的填充信息及所述当前填充信息进行信息交叉校验,得到是否校验成功的第二校验结果。
61.之后,在通过校验规则对录入条目中的填充信息以及当前填充信息进行信息交叉校验,录入条目中的填充信息也即已填充至录入任务中对应录入条目中的信息,可获取已填充的填充信息与当前需要进行填充的当前填充信息进行信息交叉校验,也即此时可校验当前填充信息与已填充的填充信息之间是否存在信息冲突,若不存在信息冲突则得到校验成功的第二校验结果;若存在信息冲突则得到校验不成功的第二校验结果。
62.具体的,信息交叉校验可通过校验规则中与当前填充信息的录入条目及已填充的填充信息的录入条目之间的逻辑校验规则进行校验;如逻辑校验规则可以是第一录入条目对应的文本信息与第二录入条目对应的文本信息相同,逻辑校验规则还可以是第一录入条目对应的数值信息,小于、大于、不小于或不大于第二录入条目对应的数值信息。
63.s144、将所述当前填充信息填充至所述录入任务对应的录入条目中。
64.返回执行所述根据所述校验规则对所述文件识别信息的当前填充信息进行信息校验的步骤,直至所述文件识别信息中的填充信息全部被填充。将进行上述校验过程后的当前填充信息填充至录入任务中与当前填充信息对应的录入条目中,再获取文件识别信息中的下一条待填充信息作为当前填充信息,并返回执行步骤s142,直至文件识别信息中的每一条填充信息均被填充至录入任务中。
65.s145、获取所述第一校验结果及所述第二校验结果作为与所述录入任务对应的校验结果。
66.可获取各文件识别信息中各条填充信息的第一校验结果及第二校验结果,作为与当前录入任务对应的校验结果。
67.在一具体的实施例中,如图5所示,步骤s141之后还包括步骤s1401及s1402。
68.s1401、若所述录入任务的录入条目中不包含填充信息,根据所述校验规则对所述文件识别信息的当前填充信息进行信息校验,得到是否校验成功的第一校验结果。
69.若录入任务的录入条目中不包含填充信息,则仅需要根据校验规则对当前填充信息单独进行信息校验,得到是否校验成功的第一校验结果。由于此时录入任务中仅包含当前填充信息,则无需对当前填充信息与其他已填充的信息进行信息交叉校验。
70.s1402、将所述当前填充信息填充至所述录入任务对应的录入条目中。
71.返回执行所述判断所述录入任务的录入条目中是否包含填充信息的步骤。将当前填充信息填充至录入任务对应的录入条目中,即可返回执行步骤s141,由于录入任务中已填充一条填充信息,则此时步骤s141对应的判断结果一定是录入任务的录入条目中包含填充信息。
72.s150、判断所述校验结果中是否包含校验失败的填充信息。
73.判断所述校验结果中是否包含校验失败的填充信息。可对校验结果进行整体判断,也即对校验结果中是否包含校验失败的填充信息进行判断。
74.在一具体的实施例中,如图6所示,步骤s150之后还包括步骤s1501。
75.s1501、若所述校验结果包含校验失败的填充信息,生成与所述校验结果对应的失败提示信息。
76.若校验结果中包含校验失败的填充信息,则可生成校验结果中与该校验失败信息对应的失败提示信息,也即是通过失败提示信息对信息录入失败的原因进行提示,用户可根据失败提示信息对当前录入任务中存在错误的填充信息进行相应处理。
77.s160、若所述校验结果不包含校验失败的填充信息,根据所述录入任务提交填充的所述文件识别信息。
78.若所述校验结果不包含校验失败的填充信息,根据所述录入任务提交填充的所述文件识别信息。若校验结果中不包含校验失败的填充信息,则可根据录入任务中包含的提交地址,将录入任务中所填充的文件识别信息提交至与录入地址对应服务器,从而完成录入任务的处理。
79.在本发明实施例所提供的基于校验规则的信息录入方法中,方法包括:获取与输入的录入需求信息对应的校验规则并生成录入任务,根据识别模板库对与录入任务对应的录入文件进行识别得到文件识别信息,根据录入任务对文件识别信息进行填充并根据相应校验规则对填充的文件识别信息同步进行校验,得到校验结果,若校验结果不包含校验识别的填充信息,则根据录入任务提交填充的文件识别信息。通过上述方法,根据录入需求确定对应的校验规则并生成录入任务,在对录入任务对应的文件识别信息进行录入并同步进行针对性校验,针对不同录入需求对不同录入文本分别进行针对性校验,提高了对录入的信息进行校验的准确性。
80.本发明实施例还提供一种基于校验规则的信息录入装置,该基于校验规则的信息录入装置配置于用户终端或管理服务器中,该基于校验规则的信息录入装置用于执行前述的基于校验规则的信息录入方法的任一实施例。具体地,请参阅图7,图7为本发明实施例提供的基于校验规则的信息录入装置的示意性框图。
81.如图7所示,基于校验规则的信息录入装置100包括校验规则获取单元110、录入任务生成单元120、文件识别信息获取单元130、填充校验单元140、校验结果判断单元150及提交单元160。
82.校验规则获取单元110,用于若接收到输入的录入需求信息,从预置的规则库获取与所述录入需求信息对应的校验规则。
83.录入任务生成单元120,用于根据所述录入需求信息及对应的校验规则生成录入任务。
84.文件识别信息获取单元130,用于若接收到与任一所述录入任务对应的录入文件,根据预置的识别模板库对所述录入文件进行识别以得到文件识别信息。
85.填充校验单元140,用于根据所述录入任务对所述文件识别信息进行填充并根据所述录入任务的校验规则对填充的所述文件识别信息同步进行校验,得到对应的校验结果。
86.校验结果判断单元150,用于判断所述校验结果中是否包含校验失败的填充信息。
87.提交单元160,用于若所述校验结果不包含校验失败的填充信息,根据所述录入任务提交填充的所述文件识别信息。
88.在本发明实施例所提供的基于校验规则的信息录入装置应用上述基于校验规则
的信息录入方法,获取与输入的录入需求信息对应的校验规则并生成录入任务,根据识别模板库对与录入任务对应的录入文件进行识别得到文件识别信息,根据录入任务对文件识别信息进行填充并根据相应校验规则对填充的文件识别信息同步进行校验,得到校验结果,若校验结果不包含校验识别的填充信息,则根据录入任务提交填充的文件识别信息。通过上述方法,根据录入需求确定对应的校验规则并生成录入任务,在对录入任务对应的文件识别信息进行录入并同步进行针对性校验,针对不同录入需求对不同录入文本分别进行针对性校验,提高了对录入的信息进行校验的准确性。
89.上述基于校验规则的信息录入装置所执行的步骤可以实现为计算机程序的形式,基于校验规则的信息录入装置均可实现为计算机设备的形式,该计算机程序可以在如图8所示的计算机设备上运行。
90.请参阅图8,图8是本发明实施例提供的计算机设备的示意性框图。该计算机设备可以是用于执行基于校验规则的信息录入方法以对录入文件对应的文件识别信息进行录入及校验的用户终端或管理服务器。
91.参阅图8,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括存储介质503和内存储器504。
92.该存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于校验规则的信息录入方法,其中,存储介质503可以为易失性的存储介质或非易失性的存储介质。
93.该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
94.该内存储器504为存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于校验规则的信息录入方法。
95.该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图8中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
96.其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现上述的基于校验规则的信息录入方法中对应的功能。
97.本领域技术人员可以理解,图8中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图8所示实施例一致,在此不再赘述。
98.应当理解,在本发明实施例中,处理器502可以是中央处理单元(central processing unit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
99.在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以
为易失性或非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现上述的基于校验规则的信息录入方法中所包含的步骤。
100.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
101.在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
102.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
103.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
104.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、磁碟或者光盘等各种可以存储程序代码的介质。
105.以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1