图像处理方法、装置、计算机设备和存储介质与流程

文档序号:25483394发布日期:2021-06-15 21:43阅读:110来源:国知局
图像处理方法、装置、计算机设备和存储介质与流程

本申请涉及人工智能领域,尤其涉及一种图像处理方法、装置、计算机设备和存储介质。



背景技术:

在保险业务的理赔过程中,需要对客户提供的大量的各种医疗类票据进行信息录入与保存。在传统的保险理赔系统中,由于需要根据用户上传的理赔医疗单证图像,逐一手工识别、提取以及录入有用的数据,因此面对大量、复杂、冗长、繁琐数据,存在录入体验较差、录入效率低下以及录入错误率高等问题。

在现有技术中,为了提高效率,通常采用ocr(opticalcharacterrecognition,光学字符识别)技术识别票据图像中的文本信息。但是ocr技术并无法识别一些特殊字符、繁体字等数据,通常会出现识别错误的情况,从而降低了文本信息的识别准确度。

因此如何提高识别文本信息的准确度与效率成为亟需解决的问题。



技术实现要素:

本申请提供了一种图像处理方法、装置、计算机设备和存储介质,通过对光学字符识别模型文字识别错误的待检测图像进行文本检测、切分以及敏感信息屏蔽,将得到的多个目标图像分配至终端进行人工识别,提高了识别文本信息的准确度与效率。

第一方面,本申请提供了一种图像处理方法,所述方法包括:

获取待检测图像,所述待检测图像为光学字符识别模型文字识别错误的票据图像;

调用文本检测模型,将所述待检测图像输入所述文本检测模型进行文本检测,获得所述待检测图像对应的文本位置信息;

根据所述文本位置信息对所述待检测图像进行切分,得到所述待检测图像对应的至少一个分片图像;

对每个所述分片图像进行敏感信息屏蔽处理,得到至少一个目标图像;

将每个所述目标图像分配至对应的目标终端,以使所述目标终端对分配的所述目标图像进行识别,获得文本识别结果。

第二方面,本申请还提供了一种图像处理装置,所述装置包括:

图像获取模块,用于获取待检测图像,所述待检测图像为光学字符识别模型文字识别错误的票据图像;

文本检测模块,用于调用文本检测模型,将所述待检测图像输入所述文本检测模型进行文本检测,获得所述待检测图像对应的文本位置信息;

图像切分模块,用于根据所述文本位置信息对所述待检测图像进行切分,得到所述待检测图像对应的至少一个分片图像;

信息屏蔽模块,用于对每个所述分片图像进行敏感信息屏蔽处理,得到至少一个目标图像;

图像分配模块,用于将每个所述目标图像分配至对应的目标终端,以使所述目标终端对分配的所述目标图像进行识别,获得文本识别结果。

第三方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器;

所述存储器,用于存储计算机程序;

所述处理器,用于执行所述计算机程序并在执行所述计算机程序时实现如上述的图像处理方法。

第四方面,本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上述的图像处理方法。

本申请公开了一种图像处理方法、装置、计算机设备和存储介质,通过获取待检测图像,可以得到光学字符识别模型文字识别错误的票据图像;通过调用文本检测模型,将待检测图像输入文本检测模型进行文本检测,可以准确地获得待检测图像对应的文本位置信息;通过根据文本位置信息对待检测图像进行切分,可以得到待检测图像对应的分片图像;通过对每个分片图像进行敏感信息屏蔽处理,可以避免隐私信息的泄露;通过将每个目标图像分配至对应的目标终端,以使目标终端对分配的目标图像进行识别,实现人工对目标图像进行文本识别,提高了识别文本信息的准确度与效率。

附图说明

为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的一种图像处理方法的示意性流程图;

图2是本申请实施例提供的一种获取待检测图像的子步骤的示意性流程图;

图3是本申请实施例提供的一种将待检测图像输入文本检测模型进行文本检测的子步骤的示意性流程图;

图4是本申请实施例提供的一种将待检测图像输入文本检测模型进行文本检测的示意图;

图5是本申请实施例提供的一种对每个分片图像进行敏感信息屏蔽处理的子步骤的示意性流程图;

图6是本申请实施例提供的一种将每个目标图像分配至对应的目标终端的示意图;

图7是本申请实施例提供的一种图像处理装置的示意性框图;

图8是本申请实施例提供的一种计算机设备的结构示意性框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。

应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

本申请的实施例提供了一种图像处理方法、装置、计算机设备和存储介质。其中,该图像处理方法可以应用于服务器或终端,通过对光学字符识别模型文字识别错误的待检测图像进行文本检测、切分以及敏感信息屏蔽,将得到的多个目标图像分配至终端进行人工识别,提高了识别文本信息的准确度与效率。

其中,服务器可以为独立的服务器,也可以为服务器集群。终端可以是智能手机、平板电脑、笔记本电脑和台式电脑等电子设备。

下面结合附图,对本申请的一些实施方式作详细说明。在不冲突的情况下,下述的实施例及实施例中的特征可以相互组合。如图1所示,图像处理方法包括步骤s10至步骤s50。

步骤s10、获取待检测图像,所述待检测图像为光学字符识别模型文字识别错误的票据图像。

需要说明的是,待检测图像是指经光学字符识别模型进行文字识别出现错误的票据图像。在本申请实施例中,为获取票据图像中的有用信息,用户可以将票据图像输入光学字符识别模型中进行文字识别,以提取票据图像中的文字信息。

示例性的,票据图像可以是医疗票据图像,当然也可以是其它行业的票据图像。其中,医疗票据图像可以包括但不限于费用清单、化验单、发票、门急诊病历、诊断证明、影像检查报告、处方单以及出入院记录等文件对应的图像。

请参阅图2,图2是步骤s10中获取待检测图像的子步骤的示意性流程图,具体步骤s10可以包括以下步骤s101至步骤s103。

步骤s101、当检测到对票据图像的选中操作时,确定所述选中操作对应的至少一个票据图像。

需要说明的是,票据图像可以是预先存储在数据库或本地磁盘的,也可以是用户上传的。

示例性的,当检测到用户对预先存储在数据库或本地磁盘中的票据图像的选中操作时,确定选中操作对应的至少一个票据图像。

示例性的,当检测到用户对上传后的票据图像的选中操作时,确定选中操作对应的至少一个票据图像。

步骤s102、调用所述光学字符识别模型,将每个所述票据图像输入所述光学字符识别模型进行文字识别。

示例性的,光学字符识别模型可以采用ocr(opticalcharacterrecognition,光学字符识别)技术来实现。需要说明的是,ocr技术用于对图片、表格等文件进行分析与识别处理,以获取文字及版面信息。

其中,光学字符识别模型可以包括文本检测模型与文本识别模型。其中,文本检测模型用于检测文字的所在位置、范围以及布局;文本识别模型用于在文字检测的基础上,对文字内容进行识别,将图像中的文字信息转化为文本信息。

示例性的,文本检测模型可以包括但不限于ctpn(detectingtextinnaturalimagewithconnectionisttextproposalnetwork,基于连接预选框网络的文本检测)网络模型、fasterr-cnn网络模型以及rrpn(rotationregionproposalnetworks,旋转区域提取网络)网络模型等等。文本识别模型可以包括但不限于卷积神经网络、循环神经网络、多层感知机以及受限玻尔兹曼机等等。

在本申请实施例中的,可以预先对初始的光学字符识别模型进行训练,调用训练好的光学字符识别模型对票据图像进行文字识别,得到文字识别结果。具体的训练过程,在此不作限定。

通过调用光学字符识别模型,将每个票据图像输入光学字符识别模型进行文字识别,提高了识别文本信息的效率。

步骤s103、将存在文字识别错误的票据图像,确定为所述待检测图像。

在一些实施例中,将每个票据图像输入光学字符识别模型进行文字识别之后,还可以包括:对得到的文字识别结果进行校验,以确定存在文字识别错误的票据图像。

示例性的,可以对文字识别结果进行正则表达式校验,以确定存在文字识别错误的票据图像。例如,校验字符串长度、日期以及姓名等等。

示例性的,将存在文字识别错误的票据图像,确定为待检测图像。还可以将无法识别的票据图像,确定为待检测图像。

通过对得到的文字识别结果进行校验,可以确定存在文字识别错误的票据图像,实现将存在文字识别错误的票据图像确定为待检测图像,后续可以对待检测图像进行人工识别。

步骤s20、调用文本检测模型,将所述待检测图像输入所述文本检测模型进行文本检测,获得所述待检测图像对应的文本位置信息。

在本申请实施例中,文本检测模型可以是ctpn网络模型。需要说明的是,ctpn网络模型主要对图像中的文本行进行准确定位,其基本做法是直接在卷积获得的特征图像上生成的一系列适当尺寸的文本预选框进行文本行的检测。在ctpn模型中,可以利用了cnn(convolutionalneuralnetwork,卷积神经网络)和rnn(recurrentneuralnetwork,循环神经网络)的无缝结合来提高检测精度。其中,cnn用来提取深度特征,rnn用于序列的特征识别,提供了识别的准确度。

示例性的,文本检测模型包括文本特征提取模型与文本位置检测模型两个子模型。其中,文本特征提取模型用于提取图像中的文本特征;文本位置检测模型用于预测文本位置。示例性的,特征提取模型可以是卷积神经网络,文本位置检测模型可以是循环神经网络。

需要强调的是,为进一步保证上述文本检测模型的私密和安全性,上述文本检测模型可以存储于一区块链的节点中。当需要使用文本检测模型时,可以从区块链的节点中调用。

请参阅图3,图3是步骤s20中将待检测图像输入文本检测模型进行文本检测的子步骤的示意性流程图,具体步骤s20可以包括以下步骤s201至步骤s203。

步骤s201、将所述待检测图像输入所述文本特征提取模型进行文本特征提取,获得所述待检测图像对应的深度特征图像。

在本申请实施例中,对于文本特征提取模型,可以采用vgg16网络结构做基础模型,通过多个卷积层将待检测图像卷积得到不同尺度的深度特征图像。

请参阅图4,图4是本申请实施例提供的一种将待检测图像输入文本检测模型进行文本检测的示意图。如图4所示,先将待检测图像输入文本特征提取模型进行文本特征提取,获得待检测图像对应的深度特征图像。

步骤s202、对所述深度特征图像添加文本候选框,根据同一行的所述文本候选框对应的深度特征信息,确定对应的深度特征序列。

示例性的,如图4所示,可以对深度特征图像添加多个预设大小的文本候选框。其中,文本候选框的高与宽可以根据实际情况设定,具体数值在此不作限定。

示例性的,可以依次将每一行的所有文本候选框对应的深度特征信息,确定为该行对应的深度特征序列。

步骤s203、将所述深度特征序列输入所述文本位置检测模型进行文本位置预测,获得所述待检测图像对应预测的文本位置信息。

如图4所示,将深度特征序列输入文本位置检测模型进行文本位置预测,输出待检测图像对应预测的文本位置信息。

在本申请实施例中,文本位置检测模型可以是循环神经网络中的bi_lstm-crf神经网络。需要说明的是,bi_lstm-crf神经网络结合bi_lstm(bidirectionallongshorttermmemorynetwork,双向长短期记忆网络)和crf(conditionalrandomfield)层。bi_lstm-crf神经网络模型不仅可以使用过去输入的特征和语句标签信息,还可以使用将来的输入特征,考虑到长距离上下文信息对中文分词的影响,可以确保中文分词更高的准确性。

在一些实施例中,通过双向lstm层,对深度特征序列进行提取文本特征,得到待检测图像对应预测的文本位置信息。其中,双向lstm层包括forwardlstm层和backwardlstm层。

示例性的,将深度特征序列作为双向lstm层的各个时间步的输入,将forwardlstm层输出的隐状态序列与backwardlstm层在各个位置输出的隐状态进行按位置拼接,得到完整的隐状态序列;将隐状态序列接入线性层,得到待检测图像对应预测的文本位置信息。

通过将待检测图像输入文本特征提取模型进行文本特征提取,并将获得的深度特征图像添加文本候选框,将深度特征序列输入bi_lstm-crf神经网络模型进行文本位置预测,由于bi_lstm-crf神经网络模型的分词具有更高准确性,因此有效提高了预测文本位置信息的准确性。

在一些实施例中,可以基于gpu集群,将待检测图像输入文本检测模型进行文本检测,得到待检测图像对应的文本位置信息。

需要说明的是,gpu(graphicsprocessingunit,图形处理单元)集群是一个计算机集群,其中每个节点配备有图形处理单元。由于通用计算的gpu具有很高的数据并行架构,可以并行处理大量的数据点,从而可以使gpu集群执行非常快速的计算,提高计算吞吐量。

通过基于gpu集群,将待检测图像输入文本检测模型中进行文本检测,可以提高检测文本位置信息的准确度与效率。

步骤s30、根据所述文本位置信息对所述待检测图像进行切分,得到所述待检测图像对应的至少一个分片图像。

示例性的,可以根据文本位置信息确定待切分的图像区域,然后截取图像区域对应的图像作为分片图像。当然还可以是其它切分方式,具体的切分方式在此不作限定。

其中,根据每一文本位置信息,对应切分得到一个分片图像。

通过根据文本位置信息对待检测图像进行切分,得到多个不连续、不完整的分片图像,后续可以将分片图像分配至多个目标终端进行识别处理,不仅提高了图像的处理效率,而且还可以防止隐私信息的泄露。

步骤s40、对每个所述分片图像进行敏感信息屏蔽处理,得到至少一个目标图像。

请参阅图5,图5是步骤s40中对每个分片图像进行敏感信息屏蔽处理的子步骤的示意性流程图,具体步骤s40可以包括以下步骤s401至步骤s403。

步骤s401、对多个所述分片图像进行敏感信息检验,以确定每个所述分片图像是否存在敏感信息。

示例性的,敏感信息可以包括但不限于姓名、身份证号码以及联系方式等等。

在一些实施例中,对多个分片图像进行敏感信息检验,以确定每个分片图像是否存在敏感信息之前,还可以包括:确定待检测图像对应的票据类型;根据票据类型与敏感位置区域之间预设的对应关系,根据待检测图像对应的票据类型,确定待检测图像中的敏感信息区域。

示例性的,票据类型可以包括但不限于费用清单、化验单、发票、门急诊病历、诊断证明以及影像检查报告等票据类型。

可以理解的是,不同票据类型的待检测图像,对应的敏感信息所在的位置区域不同。在本申请实施例中,可以预先将票据类型与敏感位置区域进行关联。

其中,敏感位置区域可以是左上角、右上角、左下角以及右下角,还可以是其它位置,在此不作限定。

在一些实施例中,对多个分片图像进行敏感信息检验,以确定每个分片图像是否存在敏感信息,可以包括:确定每个分片图像是否存在敏感信息区域;若分片图像存在敏感信息区域,则确定分片图像存在敏感信息。

需要说明的是,若分片图像在待检测图像中的相对位置处于敏感信息区域中,则可以确定分片图像存在敏感信息区域,进而可以确定分片图像存在敏感信息。

在另一些实施例中,对多个分片图像进行敏感信息检验,以确定每个分片图像是否存在敏感信息,还可以包括:确定每个分片图像的敏感信息区域是否存在关键词组;若分片图像存在关键词组,则确定分片图像存在敏感信息。

示例性的,关键词组可以包括但不限于“姓名”、“号码”、“证件”以及“联系方式”等等。

示例性的,可以基于预设的词组数据库,确定敏感信息区域是否存在关键词组。在本申请实施例中,可以预先将敏感信息对应的关键词组收集并保存至预设的词组数据库中。

示例性的,在确定每个分片图像的敏感信息区域是否存在关键词组时,可以将敏感信息区域中的词组与词组数据库中的词组进行匹配,以确定敏感信息区域是否存在关键词组。

步骤s402、对存在敏感信息的所述分片图像进行屏蔽处理,得到屏蔽处理后的所述分片图像。

在一些实施例中,对存在敏感信息的分片图像进行屏蔽处理,可以包括:确定分片图像中的敏感信息区域对应的关键词组,将关键词组替换成预设的字符标识。

示例性的,预设的字符标识可以是“*”,也可以是其它字符,在此不作限定。

步骤s403、根据屏蔽处理后的所述分片图像以及不存在敏感信息的分片图像,确定多个所述目标图像。

示例性的,可以将敏感信息屏蔽处理后的分片图像以及不存在敏感信息的分片图像,确定为目标图像。

通过对分片图像进行敏感信息检验,并对存在敏感信息的分片图像进行屏蔽处理,可以避免敏感信息的泄露,提高了信息的安全性。

步骤s50、将每个所述目标图像分配至对应的目标终端,以使所述目标终端对分配的所述目标图像进行识别,获得文本识别结果。

请参阅图6,图6是本申请实施例提供的一种将每个目标图像分配至对应的目标终端的示意图。如图6所示,可以接收用户对多个目标图像的分配操作,根据分配操作确定每个目标图像对应的目标终端;然后将每个目标图像分配至对应的目标终端,以使目标终端对分配的目标图像进行识别。

需要说明的是,将每个目标图像分配至对应的目标终端,由目标终端对应的作业人员对目标图像进行人工识别,从而得到文本识别结果。例如,作业人员可以对目标图像标注文字识别标签。目标终端可以根据作业人员标注的文字识别标签生成文字识别结果。

在一些实施例中,将每个目标图像分配至对应的目标终端之后,还可以包括:接收目标终端发送的文本识别结果,其中文本识别结果包括目标图像对应的文字识别标签;根据目标图像与文字识别标签对光学字符识别模型进行迭代训练,直至光学字符识别模型收敛。

在本申请实施例中,由于光学字符识别模型包括文本检测模型与文本识别模型,因此,可以根据目标图像与文字识别标签对文本检测模型与文本识别模型进行训练。

可以理解的是,通过根据目标图像与文字识别标签对光学字符识别模型进行迭代训练,可以使得光学字符识别模型学习识别错误的图像,从而提高了光学字符识别模型的文字识别的准确性。

在一些实施例中,根据目标图像与文字识别标签对文本检测模型与文本识别模型进行训练,可以包括:根据目标图像与文字识别标签,确定每一轮训练的训练样本数据;将训练样本数据输入文字检测模型中,获得文字检测结果;将文字检测结果输入文字识别模型中,获得文字识别结果;基于预设的损失函数值,根据文字识别标签与文字识别结果,确定当前轮对应的损失函数值;若损失函数值大于预设的损失值阈值,则调整文字检测模型与文字识别模型的参数,并进行下一轮训练,直至得到的损失函数值小于或等于损失值阈值,结束训练,得到训练后的文字检测模型与文字识别模型。

示例性的,预设的损失值阈值可以根据实际情况进行设定,具体数值在此不作限定。

在申请实施例中,可以采用0-1损失函数、绝对值损失函数、对数损失函数、交叉熵损失函数、平方损失函数或指数损失函数等损失函数来计算损失函数值。可以采用梯度下降算法、牛顿算法、共轭梯度法或柯西-牛顿法等收敛算法来调整文字检测模型与文字识别模型的参数。

可以理解的是,当文字识别模型收敛时,表示光学字符识别模型也收敛,可以得到训练后的光学字符识别模型。

为进一步保证上述训练后的光学字符识别模型的私密和安全性,上述训练后的光学字符识别模型还可以存储于一区块链的节点中。当需要使用训练后的光学字符识别模型时,可以从区块链的节点中获取。

通过根据预设的损失函数和收敛算法对文字检测模型与文字识别模型进行参数更新,可以使得文字检测模型与文字识别模型快速收敛,进而提高了光学字符识别模型的训练效率和准确度。

上述实施例提供的图像处理方法,通过调用光学字符识别模型,将每个票据图像输入光学字符识别模型进行文字识别,提高了识别文本信息的效率;通过对得到的文字识别结果进行校验,可以确定存在文字识别错误的票据图像,实现将存在文字识别错误的票据图像确定为待检测图像,后续可以对待检测图像进行人工识别;通过将待检测图像输入文本特征提取模型进行文本特征提取,并将获得的深度特征图像添加文本候选框,将深度特征序列输入bi_lstm-crf神经网络模型进行文本位置预测,由于bi_lstm-crf神经网络模型的分词具有更高准确性,因此有效提高了预测文本位置信息的准确性;通过基于gpu集群,将待检测图像输入文本检测模型中进行文本检测,可以提高检测文本位置信息的准确度与效率;通过根据文本位置信息对待检测图像进行切分,得到多个不连续、不完整的分片图像,后续可以将分片图像分配至多个目标终端进行识别处理,不仅提高了图像的处理效率,而且还可以防止隐私信息的泄露;通过对分片图像进行敏感信息检验,并对存在敏感信息的分片图像进行屏蔽处理,可以避免敏感信息的泄露,提高了信息的安全性;通过根据目标图像与文字识别标签对光学字符识别模型进行迭代训练,可以使得光学字符识别模型学习识别错误的图像,从而提高了光学字符识别模型的文字识别的准确性;通过根据预设的损失函数和收敛算法对文字检测模型与文字识别模型进行参数更新,可以使得文字检测模型与文字识别模型快速收敛,进而提高了光学字符识别模型的训练效率和准确度。

请参阅图7,图7是本申请的实施例还提供一种图像处理装置1000的示意性框图,该图像处理装置用于执行前述的图像处理方法。其中,该图像处理装置可以配置于服务器或终端中。

如图7所示,该图像处理装置1000,包括:图像获取模块1001、文本检测模块1002、图像切分模块1003、信息屏蔽模块1004以及图像分配模块1005。

图像获取模块1001,用于获取待检测图像,所述待检测图像为光学字符识别模型文字识别错误的票据图像。

文本检测模块1002,用于调用文本检测模型,将所述待检测图像输入所述文本检测模型进行文本检测,获得所述待检测图像对应的文本位置信息。

图像切分模块1003,用于根据所述文本位置信息对所述待检测图像进行切分,得到所述待检测图像对应的至少一个分片图像。

信息屏蔽模块1004,用于对每个所述分片图像进行敏感信息屏蔽处理,得到至少一个目标图像。

图像分配模块1005,用于将每个所述目标图像分配至对应的目标终端,以使所述目标终端对分配的所述目标图像进行识别,获得文本识别结果。

需要说明的是,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的装置和各模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

上述的装置可以实现为一种计算机程序的形式,该计算机程序可以在如图8所示的计算机设备上运行。

请参阅图8,图8是本申请实施例提供的一种计算机设备的结构示意性框图。该计算机设备可以是服务器或终端。

请参阅图8,该计算机设备包括通过系统总线连接的处理器和存储器,其中,存储器可以包括非易失性存储介质和内存储器。

处理器用于提供计算和控制能力,支撑整个计算机设备的运行。

内存储器为非易失性存储介质中的计算机程序的运行提供环境,该计算机程序被处理器执行时,可使得处理器执行任意一种图像处理方法。

应当理解的是,处理器可以是中央处理单元(centralprocessingunit,cpu),该处理器还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

其中,在一个实施例中,所述处理器用于运行存储在存储器中的计算机程序,以实现如下步骤:

获取待检测图像,所述待检测图像为光学字符识别模型文字识别错误的票据图像;调用文本检测模型,将所述待检测图像输入所述文本检测模型进行文本检测,获得所述待检测图像对应的文本位置信息;根据所述文本位置信息对所述待检测图像进行切分,得到所述待检测图像对应的至少一个分片图像;对每个所述分片图像进行敏感信息屏蔽处理,得到至少一个目标图像;将每个所述目标图像分配至对应的目标终端,以使所述目标终端对分配的所述目标图像进行识别,获得文本识别结果。

在一个实施例中,所述处理器在实现获取待检测图像时,用于实现:

当检测到对票据图像的选中操作时,确定所述选中操作对应的至少一个票据图像;调用所述光学字符识别模型,将每个所述票据图像输入所述光学字符识别模型进行文字识别;将存在文字识别错误的票据图像,确定为所述待检测图像。

在一个实施例中,所述文本检测模型包括文本特征提取模型与文本位置检测模型;所述处理器在实现调用文本检测模型,将所述待检测图像输入所述文本检测模型进行文本检测,获得所述待检测图像对应的文本位置信息时,用于实现:

将所述待检测图像输入所述文本特征提取模型进行文本特征提取,获得所述待检测图像对应的深度特征图像;对所述深度特征图像添加文本候选框,根据同一行的所述文本候选框对应的深度特征信息,确定对应的深度特征序列;将所述深度特征序列输入所述文本位置检测模型进行文本位置预测,获得所述待检测图像对应预测的文本位置信息。

在一个实施例中,所述处理器在实现对每个所述分片图像进行敏感信息屏蔽处理,得到至少一个目标图像时,用于实现:

对多个所述分片图像进行敏感信息检验,以确定每个所述分片图像是否存在敏感信息;对存在敏感信息的所述分片图像进行屏蔽处理,得到屏蔽处理后的所述分片图像;根据屏蔽处理后的所述分片图像以及不存在敏感信息的分片图像,确定多个所述目标图像。

在一个实施例中,所述处理器在实现对多个所述分片图像进行敏感信息检验,以确定每个所述分片图像是否存在敏感信息之前,还用于实现:

确定所述待检测图像对应的票据类型;根据票据类型与敏感位置区域之间预设的对应关系,根据所述待检测图像对应的票据类型,确定所述待检测图像中的敏感信息区域。

在一个实施例中,所述处理器在实现对多个所述分片图像进行敏感信息检验,以确定每个所述分片图像是否存在敏感信息时,用于实现:

确定每个所述分片图像是否存在所述敏感信息区域;若所述分片图像存在所述敏感信息区域,则确定所述分片图像存在敏感信息。

在一个实施例中,所述处理器在实现对存在敏感信息的所述分片图像进行屏蔽处理时,用于实现:

确定所述分片图像中的所述敏感信息区域对应的关键词组,将所述关键词组替换成预设的字符标识。

在一个实施例中,所述处理器在实现将每个所述目标图像分配至对应的目标终端之后,还用于实现:

接收所述目标终端发送的所述文本识别结果,其中所述文本识别结果包括所述目标图像对应的文字识别标签;根据所述目标图像与所述文字识别标签对所述光学字符识别模型进行迭代训练,直至所述光学字符识别模型收敛。

本申请的实施例中还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序中包括程序指令,所述处理器执行所述程序指令,实现本申请实施例提供的任一项图像处理方法。

其中,所述计算机可读存储介质可以是前述实施例所述的计算机设备的内部存储单元,例如所述计算机设备的硬盘或内存。所述计算机可读存储介质也可以是所述计算机设备的外部存储设备,例如所述计算机设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字卡(securedigitalcard,sdcard),闪存卡(flashcard)等。

进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。

本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1