一种单据录入的方法、装置及设备与流程

文档序号:17990046发布日期:2019-06-22 00:43阅读:639来源:国知局
一种单据录入的方法、装置及设备与流程

本申请涉及数据处理领域,具体涉及一种单据录入的方法、装置及设备。



背景技术:

目前,各行各业的单据录入一般均采用人工对照扫描件逐一录入的方式。以保险服务中的理赔环节为例,尤其是采用补偿给付方式的理赔,从报案、立案、核赔到复核,每个环节都涉及大量的资料审核、单据录入等事务性工作。其中,以医疗单据录入作为核心理赔依据,需要录入大量的医疗单据,涉及的项目繁多、类目庞杂,同时要确保录入信息的准确性和完整性,这对于理赔人员来说是一项困难重重的艰巨任务。如果仍旧采用人工录入的方式完成这个任务,不仅是对人力资源的浪费,也影响了单据录入的效率提升。



技术实现要素:

为此,本申请提供了一种单据录入的方法、装置及设备,能够更智能化的完成单据的录入,提升单据录入的效率,节省人力成本。

第一方面,本申请提供了一种单据录入的方法,所述方法包括:

将待录入单据识别为携带位置坐标的电子化数据;

通过将所述电子化数据与预设数据集中的元素进行匹配,对所述电子化数据进行修正;其中,所述预设数据集中的元素为预先收集的单据基础数据;

响应于用户对任意一项所述电子化数据的选定操作,获取所述电子化数据携带的位置坐标;

将所述待录入单据上所述位置坐标对应的区域放大显示;

接收所述用户依据所述区域内的显示内容对所述电子化数据的修正,完成所述待录入单据的录入。

一种可选的实施方式中,所述响应于用户在所述待录入单据上触发的选定操作,获取所述选定操作对应的坐标信息之前,还包括:

将所述电子化数据中的费用类数据的格式转换成数字类型的格式;

根据费用平衡关系,对所述费用类数据进行修正。

一种可选的实施方式中,所述通过将所述电子化数据与预设数据集中的元素进行匹配,对所述电子化数据进行修正,包括:

将所述电子化数据与预设数据集中的元素进行全匹配和/或部分关键字模糊匹配;

利用匹配成功的元素修正所述电子化数据。

一种可选的实施方式中,所述将所述待录入单据上所述位置坐标对应的区域放大显示,包括:

通过所述位置坐标确定所述待录入单据上对应的区域;

基于二阶矩阵变换,确定对所述区域进行放大后的坐标信息;

基于所述放大后的坐标信息,对所述区域放大显示。

第二方面,本申请还提供了一种单据录入的装置,所述装置包括:

识别模块,用于将待录入单据识别为携带位置坐标的电子化数据;

第一修正模块,用于通过将所述电子化数据与预设数据集中的元素进行匹配,对所述电子化数据进行修正;其中,所述预设数据集中的元素为预先收集的单据基础数据;

获取模块,用于响应于用户在所述待录入单据上触发的选定操作,获取所述选定操作对应的坐标信息;

放大模块,用于将所述待录入单据上包含所述坐标信息的所述位置坐标对应的区域放大显示;

第二修正模块,用于接收所述用户对携带所述位置坐标的电子化数据的修正,完成所述待录入单据的录入。

一种可选的实施方式中,所述装置还包括:

格式转换模块,用于将所述电子化数据中的费用类数据的格式转换成数字类型的格式;

第三修正模块,用于根据费用平衡关系,对所述费用类数据进行修正。

一种可选的实施方式中,所述第一修正模块,包括:

匹配子模块,用于将所述电子化数据与预设数据集中的元素进行全匹配和/或部分关键字匹配;

修正子模块,用于利用匹配成功的元素修正所述电子化数据。

一种可选的实施方式中,所述放大模块,包括:

第一确定子模块,用于通过包含所述坐标信息的所述位置坐标,确定所述待录入单据上对应的区域;

第二确定子模块,用于基于二阶矩阵变换,确定对所述区域进行放大后的坐标信息;

放大子模块,用于基于所述放大后的坐标信息,对所述区域放大显示。

第三方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述任一项所述的单据录入的方法。

第四方面,本申请还提供了一种单据录入的设备,包括:存储器,处理器,及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现上述任一项所述的单据录入的方法。

本申请提供了一种单据录入的方法,首先对待录入单据进行识别,其次,将识别到的电子化数据与预设数据集中的元素进行匹配,实现对电子化数据的修正,再次,放大显示待录入单据上用户选定的电子化数据对应的区域,实现用户对电子化数据的再次修正。本申请能够智能化的对待录入单据进行识别,并对识别到的电子化数据进行二次甚至多次的修正,最终完成单据的录入,提升了单据录入的效率,节省了人力成本。

附图说明

为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种单据录入的方法的流程图;

图2为本申请实施例提供的一种单据录入的装置的结构示意图;

图3为本申请实施例提供的一种单据录入的设备的结构示意图。

具体实施方式

为了解决采用人工录入单据导致的效率低和人力成本高的问题,本申请实施例提供了一种单据录入的方法,智能化的对待录入单据进行识别,并对识别到的电子化数据进行二次甚至多次的修正,最终完成单据的录入。本申请实施例能够更智能化的完成单据的录入,提升了单据录入的效率,节省了人力成本。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

方法实施例

参见图1,为本申请实施例提供的一种单据录入的方法的流程图,该方法包括:

s101:将待录入单据识别为携带位置坐标的电子化数据。

单据,是在经济业务发生时所取得或填制的、载明交易、事项实际情况的书面证明,它是进行会计核算的原始资料和重要依据。在对单据进行录入之前,需要对其进行扫描,得到电子版的单据,即本申请实施例中的待录入单据,其本质是一张图片。

本申请实施例中,在确定待录入单据之后,首先基于通用光学字符识别(opticalcharacterrecognition,ocr)技术,将待录入单据上的内容识别为电子化数据。其中,电子化数据的格式可以为txt文档中的文字格式等。例如,电子化数据可以为待识别单据上的医院名称“第一医院”,消费金额“一万元”等。

实际应用中,在将待录入单据识别为电子化数据的过程中,将电子化数据在待录入单据上所在的位置坐标也进行提取,并将提取到的位置坐标与对应的电子化数据进行存储。其中,位置坐标可以为电子化数据所在的矩形框的左上角坐标和右下角坐标,也可以为其他能够表示电子化数据所在位置的信息。

s102:通过将所述电子化数据与预设数据集中的元素进行匹配,对所述电子化数据进行修正;其中,所述预设数据集中的元素为预先收集的单据基础数据。

实际应用中,预先收集待录入单据所处领域的单据基础数据,例如,医疗单据的单据基础数据可以包括各个医院的医院名称,医疗项目名称等,并将预先收集的单据基础数据组成预设数据集。

原始单据的不清晰、串行、印章等诸多问题导致对待录入单据的识别可能不准确,所以,本申请实施例需要对识别到的电子化数据进行修正。具体的,在识别到待录入单据上的电子化数据后,将电子化数据与预设数据集中的各个元素进行匹配,实现对电子化数据的修正。

实际应用中,可以将电子化数据与预设数据集中的各个元素进行全匹配和/或部分关键字模糊匹配,并利用匹配成功的元素修正对应的电子化数据。例如,电子化数据为“一医院”,“一医院”与预设数据集中的“第一医院”能够实现全匹配,则利用“第一医院”修正原有的电子化数据“一医院”。

s103:响应于用户对任意一项所述电子化数据的选定操作,获取所述电子化数据携带的位置坐标。

为了进一步保证录入单据的准确性,本申请实施例需要对电子化数据进行进一步的修正,具体的,用户可以在系统中对电子化数据进行校对复核。为了便于用户对电子化数据的校对复核,本申请实施例可以在用户校对复核任意一项电子化数据时,对原始的待录入单据上对应的区域进行放大显示,以便于用户对相应的电子化数据校对复核。

一种可选的实施方式中,识别出的电子化数据可以以输入框等形式显示,用户可以对识别出的各个电子化数据进行选定,即用户针对电子化数据所在的输入框触发选定操作,响应于该选定操作,系统获取对应的电子化数据携带的位置坐标。

s104:将所述待录入单据上所述位置坐标对应的区域放大显示。

本申请实施例中,在用户对任意一项电子化数据进行选定后,基于选定的电子化数据携带的位置坐标,将待录入单据上对应的区域进行放大显示,以便于用户参照放大显示的区域内的内容对相应的电子化数据进行校对复核。

一种可选的实施方式中,首先,通过所述位置坐标确定所述待录入单据上对应的区域。其次,基于二阶矩阵变换,确定对所述区域进行放大后的坐标信息。最后,基于所述放大后的坐标信息,对所述区域放大显示。

实际应用中,由于各个电子化数据携带位置坐标,所以,在确定选定操作对应的电子化数据后,获取该电子化数据携带的位置坐标,并在待录入单据上确定该位置坐标对应的区域。其中,位置坐标对应的区域可以用坐标矩阵a表示;

其中,[xleft,yleft]为该区域的左上角坐标,[xright,yright]为该区域的右下角坐标。

然后,根据该区域的宽高、画布展现宽高,得到矩阵变换参数,如下:

其中,cwidth、cheight分别是画布的宽高,imgwidth、imgwidth分别为该区域的原始宽高。

一种可选的实施方式中,可以对该区域等比例放大4倍,即宽高分别放大2倍,因此重新确定矩阵变换参数为β=2α,利用该矩阵变换参数得到的目标矩阵b,具体的:

最终,基于目标矩阵b确定放大后的该区域。

实际应用中,对待录入单据上位置坐标对应的区域放大显示的方法不做限定,可以将区域放大后显示于界面的正中间,也可以显示于其他位置,还可以使用画矩形框的方式让用户锁定校对的电子化数据。

s105:接收所述用户依据所述区域内的显示内容对所述电子化数据进行修正,完成所述待录入单据的录入。

本申请实施例中,用户参照待录入单据上放大显示的区域上的显示内容,对选定的电子化数据进行修正,通过放大显示使得用户对电子化数据的进一步修正更加准确与便捷。

另外,本申请实施例中,用户对电子化数据进行校对复核后得到的电子化数据还可以作为单据基础数据,用于对预设数据集中的元素进行更新。

为了进一步的保证单据录入的准确性,本申请实施例在用户触发选定操作之前还可以包括以下处理,具体的,首先,将所述电子化数据中的费用类数据的格式转换成数字类型的格式;其次,根据费用平衡关系,对所述费用类数据进行修正。

由于单据上的费用类数据容易发生录入错误,本申请实施例可以将电子化数据中的费用类数据进行单独修正。具体的,将费用类数据的格式转换成数字类型的格式,如去掉逗号处理等,将其转换为数字类型的数据。另外,单据上的费用类数据一般遵循费用平衡关系,本申请实施例可以基于费用平衡关系,对费用类数据进行计算,实现对费用类数据的修正。

本申请实施例提供的单据录入的方法中,首先对待录入单据进行识别,其次,将识别到的电子化数据与预设数据集中的元素进行匹配,实现对电子化数据的修正,再次,放大显示待录入单据上用户选定的电子化数据对应的区域,实现用户对电子化数据的再次修正。本申请实施例能够智能化的对待录入单据进行识别,并对识别到的电子化数据进行二次甚至多次的修正,最终完成单据的录入,提升了单据录入的效率,节省了人力成本。

装置实施例

参见图2,为本实施例提供的一种单据录入的装置的结构示意图,该装置包括:

识别模块201,用于将待录入单据识别为携带位置坐标的电子化数据;

第一修正模块202,用于通过将所述电子化数据与预设数据集中的元素进行匹配,对所述电子化数据进行修正;其中,所述预设数据集中的元素为预先收集的单据基础数据;

获取模块203,用于响应于用户在所述待录入单据上触发的选定操作,获取所述选定操作对应的坐标信息;

放大模块204,用于将所述待录入单据上包含所述坐标信息的所述位置坐标对应的区域放大显示;

第二修正模块205,用于接收所述用户对携带所述位置坐标的电子化数据的修正,完成所述待录入单据的录入。

为了进一步对电子化数据进行修正,所述装置还包括:

格式转换模块,用于将所述电子化数据中的费用类数据的格式转换成数字类型的格式;

第三修正模块,用于根据费用平衡关系,对所述费用类数据进行修正。

具体的,所述第一修正模块,包括:

匹配子模块,用于将所述电子化数据与预设数据集中的元素进行全匹配和/或部分关键字匹配;

修正子模块,用于利用匹配成功的元素修正所述电子化数据。

其中,所述放大模块,包括:

第一确定子模块,用于通过包含所述坐标信息的所述位置坐标,确定所述待录入单据上对应的区域;

第二确定子模块,用于基于二阶矩阵变换,确定对所述区域进行放大后的坐标信息;

放大子模块,用于基于所述放大后的坐标信息,对所述区域放大显示。

本申请实施例提供的单据录入的装置,能够智能化的对待录入单据进行识别,并对识别到的电子化数据进行二次甚至多次的修正,最终完成单据的录入,提升了单据录入的效率,节省了人力成本。

相应的,本发明实施例还提供一种单据录入的设备,参见图3所示,可以包括:

处理器301、存储器302、输入装置303和输出装置304。单据录入的设备中的处理器301的数量可以一个或多个,图3中以一个处理器为例。在本发明的一些实施例中,处理器301、存储器302、输入装置303和输出装置304可通过总线或其它方式连接,其中,图3中以通过总线连接为例。

存储器302可用于存储软件程序以及模块,处理器301通过运行存储在存储器302的软件程序以及模块,从而执行单据录入的设备的各种功能应用以及数据处理。存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等。此外,存储器302可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入装置303可用于接收输入的数字或字符信息,以及产生与单据录入的设备的用户设置以及功能控制有关的信号输入。

具体在本实施例中,处理器301会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器302中,并由处理器301来运行存储在存储器302中的应用程序,从而实现上述单据录入的方法中的各种功能。

另外,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述任一项所述的单据录入的方法。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请实施例所提供的一种单据录入的方法、装置及设备进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1