本发明涉及计算机技术领域,尤其涉及一种基于图片识别的信息获取方法、装置、计算机设备。
背景技术:
企业在对订单进行出单等处理过程中,需先获取用户所输入的个人信息,根据个人信息生成与该个人信息相匹配的出单信息并完成订单的出单。然而,通过用户输入个人信息并上传至服务器,需要耗费用户的时间,且用户的个人信息包括身份证号、驾驶证号等包含较多字符的复杂信息,因此用户在输入个人信息过程中易出现信息输入错误的情况,导致企业获取用户信息的效率受到较大影响。因而,现有的信息获取方法存在获取效率不高的问题。
技术实现要素:
本发明实施例提供了一种基于图片识别的信息获取方法、装置、计算机设备及存储介质,旨在解决现有技术方法中的信息获取方法存在信息获取效率不高的问题。
第一方面,本发明实施例提供了一种基于图片识别的信息获取方法,其包括:
若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型;
若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别;
从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息,其中,所述证件内容信息包括图像信息及文字信息;
根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果;
若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认;
若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。
第二方面,本发明实施例提供了一种基于图片识别的信息获取装置,其包括:
证件上传提示单元,用于若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型;
目标分类类别获取单元,用于若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别;
证件内容信息识别单元,用于从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息,其中,所述证件内容信息包括图像信息及文字信息;
证件内容信息验证单元,用于根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果;
证件内容信息发送单元,用于若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认;
提示信息发送单元,用于若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。
第三方面,本发明实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于图片识别的信息获取方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于图片识别的信息获取方法。
本发明实施例提供了一种基于图片识别的信息获取方法、装置、计算机设备及存储介质。根据所输入的出单请求发送对应证件上传提示信息至用户终端,接收用户终端所反馈的证件图片并根据预置的图片分类模型及预置的信息识别模板识别得到证件内容信息,若根据预置校验规则对证件内容信息进行验证的验证结果为符合,将证件内容信息发送至用户终端进行确认,若用户终端反馈确认信息,根据预置出单信息生成规则生成对应的出单信息。通过上述方法,基于图片信息识别模型对证件图片中的信息进行识别,可大幅提高从证件图片中获取相应信息的效率。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的基于图片识别的信息获取方法的流程示意图;
图2为本发明实施例提供的基于图片识别的信息获取方法的应用场景示意图;
图3为本发明实施例提供的基于图片识别的信息获取方法的子流程示意图;
图4为本发明实施例提供的基于图片识别的信息获取方法的另一流程示意图;
图5为本发明实施例提供的基于图片识别的信息获取方法的另一子流程示意图;
图6为本发明实施例提供的基于图片识别的信息获取方法的另一子流程示意图;
图7为本发明实施例提供的基于图片识别的信息获取装置的示意性框图;
图8为本发明实施例提供的基于图片识别的信息获取装置的子单元示意性框图;
图9为本发明实施例提供的基于图片识别的信息获取装置的另一示意性框图;
图10为本发明实施例提供的基于图片识别的信息获取装置的另一子单元示意性框图;
图11为本发明实施例提供的基于图片识别的信息获取装置的另一子单元示意性框图;
图12为本发明实施例提供的计算机设备的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
还应当理解,在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
还应当进一步理解,在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
请参阅图1,图1是本发明实施例提供的基于图片识别的信息获取方法的流程示意图;图2为本发明实施例提供的基于图片识别的信息获取方法的应用场景示意图。该基于图片识别的信息获取方法应用于管理服务器10中,该方法通过安装于管理服务器10中的应用软件进行执行,用户终端20通过与管理服务器10建立网络连接实现数据信息的传输。管理服务器10即是用于执行基于图片识别的信息获取方法以完成订单出单的企业终端,用户终端20即是用于向管理服务器10发送数据信息的终端设备,例如台式电脑、笔记本电脑、平板电脑或手机等。图2中仅仅示意出一台用户终端20与管理服务器10进行信息传输,在实际应用中,该管理服务器10也可与多台用户终端20同时进行信息传输。
如图1所示,该方法包括步骤s110~s160。
s110、若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型。
若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型。用户在购买某一企业的产品时,由于不同类型的产品之间价格存在差异,需获取与用户需求相对应的产品价格以发送至用户。用户通过用户终端输入出单请求,也即是该用户所需购买的产品的需求信息,出单请求中仅包含用户所需购买的一种产品;管理服务器获取出单请求后还需进一步获取该用户的证件信息以完成出单,出单请求对应的产品不相同所需提供的证件也不相同,证件需求信息中包含每一产品对应所需提供的证件信息,因此可根据证件需求信息生成与出单请求相匹配的证件上传提示信息并发送至用户终端,其中,证件上传提示信息中包含一个或多个证件类型。
s120、若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别。
若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别。用户接收到证件上传提示信息后,即可根据证件上传提示信息中的证件类型将相应证件图片反馈至管理服务器,用户可通过用户终端上预设的摄像装置(例如手机的相机、电脑的摄像头)拍摄得到相应的证件图片并反馈至管理服务器,或直接选择用户终端中所存储的证件图片并反馈至管理服务器。证件图片中可包含一个证件的图片或多个证件的图片,管理服务器接收到用户所反馈的证件图片后,即可对证件图片中的信息进行识别,以得到包含文字信息及图像信息的证件内容信息。图片分类模型即是用于对证件图片进行分类的模型,证件图片可根据其对应的证件类型进行分类,以确定证件图片的目标分类类别。
证件内容信息中包含文字信息及图像信息,文字信息可以是姓名、身份证号、籍贯、车牌号等信息,图像信息可以是免冠照片、车辆外形照片等信息。
在一实施例中,如图3所示,步骤s120包括子步骤s121和s122。
s121、根据所述图片分类模型计算所述证件图片与所述图片分类模型中每一分类类别的目标特征向量之间的匹配率。
根据所述图片分类模型计算所述证件图片与所述图片分类模型中每一分类类别的目标特征向量之间的匹配率。图片分类模型中包含多个分类类别,每一分类类别对应一个目标特征向量,具体的计算过程包括,基于图片分类模型中的卷积神经网络将证件图片转换为对应的特征向量,计算特征向量与每一分类类别对应目标特征向量之间的匹配率,即可得到证件图片与每一分类类别的匹配率。其中,目标特征向量即是通过图片分类模型对相应分类类别的证件图片进行计算所得到的计算结果,可通过图片分类模型计算一个分类类别所包含多个证件图片对应的多个特征向量,计算所得到的多个特征向量的平均值即可得到与该分类类别对应的目标特征向量。
例如,证件图片的分辨率为600×600,根据卷积神经网络的第一卷积核中的计算公式,以分辨率16*16作为窗口,步长为1,进行卷积操作,以得到大小为585×585的向量矩阵,也即是图片的浅层特征;根据池化计算公式,以分辨率13×13作为窗口,步长为13,进行降采样,以得到大小为45×45的向量矩阵,也即是图片的深层次特征;根据5个第二卷积核中的计算公式,以分辨率5×5作为窗口,步长为5的进行卷积操作,以得到大小为9×9的5个向量矩阵。通过第一全连接计算公式,对所得到的5个9×9的向量矩阵进行计算,第一全连接公式中共包含五个节点,每一个节点均与1个9×9的向量矩阵相关联,也即是分别通过五个计算公式计算得到与5个9×9的向量矩阵相关联的五个节点的值,第一个计算公式可表示为c1=w1×x1+b1,其中,c1为第一个节点的计算值,x1为该图片对应的第一个向量矩阵中的数值,w1和b1为第一节点与第一个向量矩阵相关联的第一计算公式中所预设的参数值,通过五个计算公式即可计算与对应向量矩阵向关联的五个节点的值;通过第二全连接计算公式对五个节点的值进行计算以得到最终该证件图片的特征向量,计算公式为f1=a1×c1+a2×c2+a3×c3+a4×c4+a5×c5;其中c1、c2、c3、c4、c5为与该图片的向量矩阵相关联的五个节点的值,a1、a2、a3、a4、a5为五个节点至最后输出节点的预设参数值,由于9×9的向量矩阵共包含81个数值,最后得到该图片的特征向量为一个1×81维的向量矩阵,可以采用fx=(f1,f2……f81)来表示。目标特征向量亦是通过上述方法所计算得到的一个1×81维的向量矩阵,通过计算公式即可计算特征向量与目标特征向量之间的匹配率。具体的,匹配率可通过p=1-((f1-g1)2+(f2-g2)2+…+(f81-g81)2)/(g12+g22+…+g812),其中,证件图片的特征向量为fx=(f1,f2……f81),目标特征向量为g=(g1,g2……g81)。
s122、根据证件图片与每一所述分类类别对应的匹配率确定匹配率最高的一个分类类别为所述证件图片的目标分类类别。
根据证件图片与每一所述分类类别对应的匹配率确定匹配率最高的一个分类类别为所述证件图片的目标分类类别。计算得到证件图片与每一分类类别对应的匹配概率后,即可确定匹配概率最高的一个分类类别作为证件图片的目标分类类别,通过确定证件图片的目标分类类别即可通过与该类别对应的图片识别方法对该证件图片进行处理。
在一实施例中,如图4所示,步骤s120之前还包括步骤s210。
s210、根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型。
根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型。其中,所述模型训练规则包括数据拆分信息及参数值调整规则,预置数据集中包含每一分类类型对应证件的多张图片,一张照片对应一条数据,预置数据集中还包含每一张照片对应的目标类别,目标类别即是通过人为识别得到的与该照片对应的证件类别。在使用图片分类模型对证件图片进行识别之前,还需预置数据集及预置模型训练规则对图片分类模型中的图片分类模型进行训练,以提高图片分类模型对证件图片的进行分类及识别的精确度。
在一实施例中,如图5所示,步骤s210包括子步骤s211、s212、s213和s214。
s211、根据所述数据拆分信息对所述数据集进行拆分以得到训练数据集及测试数据集。
根据所述数据拆分信息对所述数据集进行拆分以得到训练数据集及测试数据集。拆分信息中包括将数据集中所包含的数据进行拆分的拆分比例,根据比拆分比例即可将数据集中的数据拆分为与拆分比例对应的训练数据集及测试数据集,训练数据集及测试数据集中均包含每一分类类型对应证件的多张图片。
s212、根据所述初始图片分类模型中的卷积神经网络计算所述测试数据集对应的测试特征向量。
根据图片分类模型中的卷积神经网络计算测试数据集对应的测试特征向量,根据卷积神经网络计算一个或多个测试数据集中每一条数据对应的特征向量,获取测试数据集中每一种证件对应的多个特征向量,每一种证件即对应一个分类类别,计算每一种证件对应的多个特征向量的平均值即可得到测试特征向量,具体计算方法同上述步骤中的方法。
s213、根据所述参数值调整规则、所述测试特征向量集及所述训练数据集对所述卷积神经网络进行迭代训练,以对所述卷积神经网络中的参数值进行调整。
根据所述参数值调整规则、所述测试特征向量集及所述训练数据集对所述卷积神经网络进行迭代训练,以对所述卷积神经网络中的参数值进行调整。具体的,获取一个训练数据集中的一条数据,根据卷积神经网络计算该条数据的训练特征向量,并计算该训练特征向量与该条数据目标类别在测试特征向量中对应特征向量之间的匹配率,根据匹配率及参数调整规则对卷积神经网络中公式的参数值进行调整,即完成对卷积神经网络的一次训练。依次获取一个训练数据集中所包含的所有数据对卷积神经网络进行迭代训练,即可得到与该训练数据集对应的初步卷积神经网络,根据上述方法获取每一训练数据集对应的初步卷积神经网络。
其中,参数调整规则中包括调整幅度映射信息,调整幅度映射信息即是用于获取本次训练所需对卷积神经网络中公式参数值进行调整的调整值,根据本次训练所计算得到的某一条数据与该条数据目标类别在测试特征向量中对应特征向量之间的匹配率,获取调整幅度映射信息中与该匹配率对应的调整值,根据该调整值即可对公式中的参数值进行调整,调整值为正数,则对公式中的参数值进行正向调整;调整值为负数,则对公式中的参数值进行负向调整。
根据每一训练数据集计算与该训练数据集对应初步卷积神经网络的准确率,具体的,根据初步卷积神经网络对对应训练数据集中每一条数据进行计算以获取该训练数据集中每一条数据对应的训练类别,将每一条数据的训练类别与该条数据的目标类别是否相同进行对比,计算类别相同的数据的数量占总数据的百分比,即可得到该训练数据集对应初步卷积神经网络的准确率,将准确率最高的初步卷积神经网络作为进行参数值调整后的卷积神经网络。
s214、根据进行参数值调整后的所述卷积神经网络对所述测试数据集进行计算,以获取所述初始图片分类模型中每一分类类别对应的目标特征向量,从而得到训练后的所述初始图片分类模型作为所述图片分类模型。
根据进行参数值调整后的所述卷积神经网络对所述测试数据集进行计算,以获取所述初始图片分类模型中每一分类类别对应的目标特征向量,从而得到训练后的所述初始图片分类模型作为所述图片分类模型。根据进行参数值调整后的卷积神经网络计算一个或多个测试数据集中每一条数据对应的特征向量,获取测试数据集中每一种证件对应的多个特征向量,每一种证件即对应一个分类类别,计算每一种证件对应的多个特征向量的平均值即可获取得到每一分类类别对应的目标特征向量,也即完成对图片分类模型的训练。
s130、从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息。
从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息。证件内容信息即是从证件图片中提取得到的证件中所包含的信息,其中,所述证件内容信息包括图像信息及文字信息。信息识别模板中包含每一种证件类型对应的识别模板,将证件图片分类至相应证件类别后即可根据与该证件类型对应识别模板对该证件图片进行识别,具体的,一个分类类别对应的识别模板即可对与该分类类别对应的证件图片进行识别处理,每一识别模板中均包含与该识别模板对应证件相匹配的文字识别区域及图像识别区域。确定目标分类类型后,即可根据信息识别模板中与目标分类类别相匹配的识别模板,具体的,识别模板先对证件图片中待识别证件的边缘进行定位,获取待识别证件的边缘后通过该识别模板中的文字识别区域获取证件图片中的文字区域并识别得到文字信息,通过该识别模板中的图像识别区域获取证件图片中的图像信息。
例如,证件内容信息中可以是用户免冠照片或车辆外形照片等图像信息,以及用户姓名、年龄、身份证号、驾驶证号或车牌号等文字信息。
对文字区域中所包含的文字信息进行识别的具体过程为,获取到某一证件图片的文字区域后,对该文字区域中的黑色像素与预置字符信息库中字符的像素进行对比以获取与黑色像素对应的字符,即可对该文字区域中所包含的文字信息进行识别。
s140、根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果。
根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果。在用户上传的证件图片中可能存在多个证件图片对应的所有人不一致,或用户上传的证件图片与证件上传提示信息中的证件类型无法一一对应的情况,因此需对根据证件图片所识别得到的证件内容信息进行验证,可通过预置校验规则对证件内容信息进行验证以得到验证结果。具体的,证件校验规则即是用于对证件内容信息是否与证件上传提示信息中的证件类型一一对应进行验证,及对与证件内容信息对应所有证件图片的所有人是否一致进行验证的规则信息。
在一实施例中,如图6所示,步骤s140包括子步骤s141、s142和s143。
s141、根据所述校验规则对所述证件内容信息是否与所述证件类型一一对应进行验证以得到第一验证结果。
根据所述校验规则对所述证件内容信息是否与所述证件类型一一对应进行验证以得到第一验证结果。具体的,获取证件内容信息中每一条信息对应证件种类,根据校验规则先判断证件内容信息对应证件种类的数量与证件类型的数量是否相同,若不相同则第一验证结果为不通过;若相同则对证件内容信息中每一条信息对应证件种类与上述证件类型是否一一对应进行判断,若不是一一对应则第一验证结果为不通过,若是一一对应则验证结果为通过。
s142、对所有所述证件内容信息的所有人是否一致进行验证以得到第二验证结果。
对所有所述证件内容信息的所有人是否一致进行验证以得到第二验证结果。获取证件内容信息中每一条信息的所有人,每一条信息有且仅由一个所有人,对每一条信息的所有人是否一致进行验证即可得到第二验证结果,若所有人一致则第二验证结果为通过,否则第二验证结果为不通过。
s143、根据所述第一验证结果及所述第二验证结果获取所述证件内容信息是否符合所述校验规则的验证结果。
根据所述第一验证结果及所述第二验证结果获取所述证件内容信息是否符合所述校验规则的验证结果。若第一验证结果及第二验证结果均为通过,则得到证件内容信息符合校验规则的验证结果;若第一验证结果或第二验证结果为不通过,则得到证件内容信息不符合校验规则的验证结果。
s150、若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认。
若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认。若验证结果为符合还需将证件内容信息发送至用户终端,用户通过用户终端接收对其所上传的证件图片进行识别后所得到的证件内容信息,并对该证件内容信息进行确认,若用户未在证件内容信息中发现错误,则可向管理服务器反馈确认信息,若用户在证件内容信息中发现错误,则可向管理服务器反馈修改请求信息以对证件内容信息中的错误进行修改。
s160、若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。
若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。可通过提示信息提示用户信息输入成功,管理服务器获取到对应的有限信息后,可根据出单信息生成规则生成与证件内容信息对应的出单信息,其中,出单信息生成规则中包含多种产品对应的出单规则,每一出单规则包含各种证件信息对应的产品报价,出单请求中包含用户所需购买的一种产品,获取出单信息生成规则中与出单请求对应的出单规则,将证件内容信息与该出单规则中的证件信息进行匹配,以获取与该证件内容信息相匹配的产品报价,根据产品报价及证件内容信息生成出单信息。
在本发明实施例所提供的基于图片识别的信息获取方法中,根据所输入的出单请求发送对应证件上传提示信息至用户终端,接收用户终端所反馈的证件图片并根据预置的图片分类模型及预置的信息识别模板识别得到证件内容信息,若根据预置校验规则对证件内容信息进行验证的验证结果为符合,将证件内容信息发送至用户终端进行确认,若用户终端反馈确认信息,根据预置出单信息生成规则生成对应的出单信息。通过上述方法,基于图片信息识别模型对证件图片中的信息进行识别,避免因用户手动输入个人信息导致信息输入速度较慢,可大幅提高从证件图片中获取相应信息的效率。
本发明实施例还提供一种基于图片识别的信息获取装置,该基于图片识别的信息获取装置用于执行前述基于图片识别的信息获取方法的任一实施例。具体地,请参阅图7,图7是本发明实施例提供的基于图片识别的信息获取装置的示意性框图。该基于图片识别的信息获取装置可以配置于管理服务器10中。
如图7所示,基于图片识别的信息获取装置100包括证件上传提示单元110、目标分类类别获取单元120、证件内容信息识别单元130、证件内容信息验证单元140、证件内容信息发送单元150和提示信息发送单元160。
证件上传提示单元110,用于若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型。
若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型。用户在购买某一企业的产品时,由于不同类型的产品之间价格存在差异,需获取与用户需求相对应的产品价格以发送至用户。用户通过用户终端输入出单请求,也即是该用户所需购买的产品的需求信息,出单请求中仅包含用户所需购买的一种产品;管理服务器获取出单请求后还需进一步获取该用户的证件信息以完成出单,出单请求对应的产品不相同所需提供的证件也不相同,证件需求信息中包含每一产品对应所需提供的证件信息,因此可根据证件需求信息生成与出单请求相匹配的证件上传提示信息并发送至用户终端,其中,证件上传提示信息中包含一个或多个证件类型。
目标分类类别获取单元120,用于若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别。
若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别。用户接收到证件上传提示信息后,即可根据证件上传提示信息中的证件类型将相应证件图片反馈至管理服务器,用户可通过用户终端上预设的摄像装置(例如手机的相机、电脑的摄像头)拍摄得到相应的证件图片并反馈至管理服务器,或直接选择用户终端中所存储的证件图片并反馈至管理服务器。证件图片中可包含一个证件的图片或多个证件的图片,管理服务器接收到用户所反馈的证件图片后,即可对证件图片中的信息进行识别,以得到包含文字信息及图像信息的证件内容信息。图片分类模型即是用于对证件图片进行分类的模型,证件图片可根据其对应的证件类型进行分类,以确定证件图片的目标分类类别。
证件内容信息中包含文字信息及图像信息,文字信息可以是姓名、身份证号、籍贯、车牌号等信息,图像信息可以是免冠照片、车辆外形照片等信息。
其他发明实施例中,如图8所示,所述目标分类类别获取单元120包括子单元:类别匹配率计算单元121和目标分类类别确定单元122。
类别匹配率计算单元121,用于根据所述图片分类模型计算所述证件图片与所述图片分类模型中每一分类类别的目标特征向量之间的匹配率。
根据所述图片分类模型计算所述证件图片与所述图片分类模型中每一分类类别的目标特征向量之间的匹配率。图片分类模型中包含多个分类类别,每一分类类别对应一个目标特征向量,具体的计算过程包括,基于图片分类模型中的卷积神经网络将证件图片转换为对应的特征向量,计算特征向量与每一分类类别对应目标特征向量之间的匹配率,即可得到证件图片与每一分类类别的匹配率。其中,目标特征向量即是通过图片分类模型对相应分类类别的证件图片进行计算所得到的计算结果,可通过图片分类模型计算一个分类类别所包含多个证件图片对应的多个特征向量,计算所得到的多个特征向量的平均值即可得到与该分类类别对应的目标特征向量。
目标分类类别确定单元122,用于根据证件图片与每一所述分类类别对应的匹配率确定匹配率最高的一个分类类别为所述证件图片的目标分类类别。
根据证件图片与每一所述分类类别对应的匹配率确定匹配率最高的一个分类类别为所述证件图片的目标分类类别。计算得到证件图片与每一分类类别对应的匹配概率后,即可确定匹配概率最高的一个分类类别作为证件图片的目标分类类别,通过确定证件图片的目标分类类别即可通过与该类别对应的图片识别方法对该证件图片进行处理。
其他发明实施例中,如图9所示,所述基于图片识别的信息获取装置100还包括子单元:图片分类模型训练单元210。
图片分类模型训练单元210,用于根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型。
根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型。其中,所述模型训练规则包括数据拆分信息及参数值调整规则,预置数据集中包含每一分类类型对应证件的多张图片,一张照片对应一条数据,预置数据集中还包含每一张照片对应的目标类别,目标类别即是通过人为识别得到的与该照片对应的证件类别。在使用图片分类模型对证件图片进行识别之前,还需预置数据集及预置模型训练规则对图片分类模型中的图片分类模型进行训练,以提高图片分类模型对证件图片的进行分类及识别的精确度。
其他发明实施例中,如图10所示,所述图片分类模型训练单元210包括子单元:数据集拆分单元211、测试特征向量获取单元212、模型迭代训练单元213和目标特征向量获取单元214。
数据集拆分单元211,用于根据所述数据拆分信息对所述数据集进行拆分以得到训练数据集及测试数据集。
根据所述数据拆分信息对所述数据集进行拆分以得到训练数据集及测试数据集。拆分信息中包括将数据集中所包含的数据进行拆分的拆分比例,根据比拆分比例即可将数据集中的数据拆分为与拆分比例对应的训练数据集及测试数据集,训练数据集及测试数据集中均包含每一分类类型对应证件的多张图片。
测试特征向量获取单元212,用于根据所述初始图片分类模型中的卷积神经网络计算所述测试数据集对应的测试特征向量。
根据图片分类模型中的卷积神经网络计算测试数据集对应的测试特征向量,根据卷积神经网络计算一个或多个测试数据集中每一条数据对应的特征向量,获取测试数据集中每一种证件对应的多个特征向量,每一种证件即对应一个分类类别,计算每一种证件对应的多个特征向量的平均值即可得到测试特征向量,具体计算方法同上述步骤中的方法。
模型迭代训练单元213,用于根据所述参数值调整规则、所述测试特征向量集及所述训练数据集对所述卷积神经网络进行迭代训练,以对所述卷积神经网络中的参数值进行调整。
根据所述参数值调整规则、所述测试特征向量集及所述训练数据集对所述卷积神经网络进行迭代训练,以对所述卷积神经网络中的参数值进行调整。具体的,获取一个训练数据集中的一条数据,根据卷积神经网络计算该条数据的训练特征向量,并计算该训练特征向量与该条数据目标类别在测试特征向量中对应特征向量之间的匹配率,根据匹配率及参数调整规则对卷积神经网络中公式的参数值进行调整,即完成对卷积神经网络的一次训练。依次获取一个训练数据集中所包含的所有数据对卷积神经网络进行迭代训练,即可得到与该训练数据集对应的初步卷积神经网络,根据上述方法获取每一训练数据集对应的初步卷积神经网络。
其中,参数调整规则中包括调整幅度映射信息,调整幅度映射信息即是用于获取本次训练所需对卷积神经网络中公式参数值进行调整的调整值,根据本次训练所计算得到的某一条数据与该条数据目标类别在测试特征向量中对应特征向量之间的匹配率,获取调整幅度映射信息中与该匹配率对应的调整值,根据该调整值即可对公式中的参数值进行调整,调整值为正数,则对公式中的参数值进行正向调整;调整值为负数,则对公式中的参数值进行负向调整。
根据每一训练数据集计算与该训练数据集对应初步卷积神经网络的准确率,具体的,根据初步卷积神经网络对对应训练数据集中每一条数据进行计算以获取该训练数据集中每一条数据对应的训练类别,将每一条数据的训练类别与该条数据的目标类别是否相同进行对比,计算类别相同的数据的数量占总数据的百分比,即可得到该训练数据集对应初步卷积神经网络的准确率,将准确率最高的初步卷积神经网络作为进行参数值调整后的卷积神经网络。
目标特征向量获取单元214,用于根据进行参数值调整后的所述卷积神经网络对所述测试数据集进行计算,以获取所述初始图片分类模型中每一分类类别对应的目标特征向量,从而得到训练后的所述初始图片分类模型作为所述图片分类模型。
根据进行参数值调整后的所述卷积神经网络对所述测试数据集进行计算,以获取所述初始图片分类模型中每一分类类别对应的目标特征向量,从而得到训练后的所述初始图片分类模型作为所述图片分类模型。根据进行参数值调整后的卷积神经网络计算一个或多个测试数据集中每一条数据对应的特征向量,获取测试数据集中每一种证件对应的多个特征向量,每一种证件即对应一个分类类别,计算每一种证件对应的多个特征向量的平均值即可获取得到每一分类类别对应的目标特征向量,也即完成对图片分类模型的训练。
证件内容信息识别单元130,用于从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息。
从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息。证件内容信息即是从证件图片中提取得到的证件中所包含的信息,其中,所述证件内容信息包括图像信息及文字信息。信息识别模板中包含每一种证件类型对应的识别模板,将证件图片分类至相应证件类别后即可根据与该证件类型对应识别模板对该证件图片进行识别,具体的,一个分类类别对应的识别模板即可对与该分类类别对应的证件图片进行识别处理,每一识别模板中均包含与该识别模板对应证件相匹配的文字识别区域及图像识别区域。确定目标分类类型后,即可根据信息识别模板中与目标分类类别相匹配的识别模板,具体的,识别模板先对证件图片中待识别证件的边缘进行定位,获取待识别证件的边缘后通过该识别模板中的文字识别区域获取证件图片中的文字区域并识别得到文字信息,通过该识别模板中的图像识别区域获取证件图片中的图像信息。
对文字区域中所包含的文字信息进行识别的具体过程为,获取到某一证件图片的文字区域后,对该文字区域中的黑色像素与预置字符信息库中字符的像素进行对比以获取与黑色像素对应的字符,即可对该文字区域中所包含的文字信息进行识别。
证件内容信息验证单元140,用于根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果。
根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果。在用户上传的证件图片中可能存在多个证件图片对应的所有人不一致,或用户上传的证件图片与证件上传提示信息中的证件类型无法一一对应的情况,因此需对根据证件图片所识别得到的证件内容信息进行验证,可通过预置校验规则对证件内容信息进行验证以得到验证结果。具体的,证件校验规则即是用于对证件内容信息是否与证件上传提示信息中的证件类型一一对应进行验证,及对与证件内容信息对应所有证件图片的所有人是否一致进行验证的规则信息。
其他发明实施例中,如图11所示,所述证件内容信息验证单元140包括子单元:第一验证单元141、第二验证单元142和验证结果获取单元143。
第一验证单元141,用于根据所述校验规则对所述证件内容信息是否与所述证件类型一一对应进行验证以得到第一验证结果。
根据所述校验规则对所述证件内容信息是否与所述证件类型一一对应进行验证以得到第一验证结果。具体的,获取证件内容信息中每一条信息对应证件种类,根据校验规则先判断证件内容信息对应证件种类的数量与证件类型的数量是否相同,若不相同则第一验证结果为不通过;若相同则对证件内容信息中每一条信息对应证件种类与上述证件类型是否一一对应进行判断,若不是一一对应则第一验证结果为不通过,若是一一对应则验证结果为通过。
第二验证单元142,用于对所有所述证件内容信息的所有人是否一致进行验证以得到第二验证结果。
对所有所述证件内容信息的所有人是否一致进行验证以得到第二验证结果。获取证件内容信息中每一条信息的所有人,每一条信息有且仅由一个所有人,对每一条信息的所有人是否一致进行验证即可得到第二验证结果,若所有人一致则第二验证结果为通过,否则第二验证结果为不通过。
验证结果获取单元143,用于根据所述第一验证结果及所述第二验证结果获取所述证件内容信息是否符合所述校验规则的验证结果。
根据所述第一验证结果及所述第二验证结果获取所述证件内容信息是否符合所述校验规则的验证结果。若第一验证结果及第二验证结果均为通过,则得到证件内容信息符合校验规则的验证结果;若第一验证结果或第二验证结果为不通过,则得到证件内容信息不符合校验规则的验证结果。
证件内容信息发送单元150,用于若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认。
若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认。若验证结果为符合还需将证件内容信息发送至用户终端,用户通过用户终端接收对其所上传的证件图片进行识别后所得到的证件内容信息,并对该证件内容信息进行确认,若用户未在证件内容信息中发现错误,则可向管理服务器反馈确认信息,若用户在证件内容信息中发现错误,则可向管理服务器反馈修改请求信息以对证件内容信息中的错误进行修改。
提示信息发送单元160,用于若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。
若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。可通过提示信息提示用户信息输入成功,管理服务器获取到对应的有限信息后,可根据出单信息生成规则生成与证件内容信息对应的出单信息,其中,出单信息生成规则中包含多种产品对应的出单规则,每一出单规则包含各种证件信息对应的产品报价,出单请求中包含用户所需购买的一种产品,获取出单信息生成规则中与出单请求对应的出单规则,将证件内容信息与该出单规则中的证件信息进行匹配,以获取与该证件内容信息相匹配的产品报价,根据产品报价及证件内容信息生成出单信息。
在本发明实施例所提供的基于图片识别的信息获取装置用于执行上述基于图片识别的信息获取方法,根据所输入的出单请求发送对应证件上传提示信息至用户终端,接收用户终端所反馈的证件图片并根据预置的图片分类模型及预置的信息识别模板识别得到证件内容信息,若根据预置校验规则对证件内容信息进行验证的验证结果为符合,将证件内容信息发送至用户终端进行确认,若用户终端反馈确认信息,根据预置出单信息生成规则生成对应的出单信息。通过上述方法,基于图片信息识别模型对证件图片中的信息进行识别,避免因用户手动输入个人信息导致信息输入速度较慢,可大幅提高从证件图片中获取相应信息的效率。
上述基于图片识别的信息获取装置可以实现为计算机程序的形式,该计算机程序可以在如图12所示的计算机设备上运行。
请参阅图12,图12是本发明实施例提供的计算机设备的示意性框图。
参阅图12,该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505,其中,存储器可以包括非易失性存储介质503和内存储器504。
该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时,可使得处理器502执行基于图片识别的信息获取方法。
该处理器502用于提供计算和控制能力,支撑整个计算机设备500的运行。
该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境,该计算机程序5032被处理器502执行时,可使得处理器502执行基于图片识别的信息获取方法。
该网络接口505用于进行网络通信,如提供数据信息的传输等。本领域技术人员可以理解,图12中示出的结构,仅仅是与本发明方案相关的部分结构的框图,并不构成对本发明方案所应用于其上的计算机设备500的限定,具体的计算机设备500可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
其中,所述处理器502用于运行存储在存储器中的计算机程序5032,以实现如下功能:若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型;若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别;从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息;根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果;若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认;若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。
在一实施例中,处理器502在执行若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别的步骤时,执行如下操作:根据所述图片分类模型计算所述证件图片与所述图片分类模型中每一分类类别的目标特征向量之间的匹配率;根据证件图片与每一所述分类类别对应的匹配率确定匹配率最高的一个分类类别为所述证件图片的目标分类类别。
在一实施例中,处理器502在执行若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别的步骤之前,还执行如下操作:根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型。
在一实施例中,处理器502在执行根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型的步骤时,执行如下操作:根据所述数据拆分信息对所述数据集进行拆分以得到训练数据集及测试数据集;根据所述初始图片分类模型中的卷积神经网络计算所述测试数据集对应的测试特征向量;根据所述参数值调整规则、所述测试特征向量集及所述训练数据集对所述卷积神经网络进行迭代训练,以对所述卷积神经网络中的参数值进行调整;根据进行参数值调整后的所述卷积神经网络对所述测试数据集进行计算,以获取所述初始图片分类模型中每一分类类别对应的目标特征向量,从而得到训练后的所述初始图片分类模型作为所述图片分类模型。
在一实施例中,处理器502在执行根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果的步骤时,执行如下操作:根据所述校验规则对所述证件内容信息是否与所述证件类型一一对应进行验证以得到第一验证结果;对所有所述证件内容信息的所有人是否一致进行验证以得到第二验证结果;根据所述第一验证结果及所述第二验证结果获取所述证件内容信息是否符合所述校验规则的验证结果。
本领域技术人员可以理解,图12中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定,在其他实施例中,计算机设备可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。例如,在一些实施例中,计算机设备可以仅包括存储器及处理器,在这样的实施例中,存储器及处理器的结构及功能与图12所示实施例一致,在此不再赘述。
应当理解,在本发明实施例中,处理器502可以是中央处理单元(centralprocessingunit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序,其中计算机程序被处理器执行时实现以下步骤:若接收到用户终端所输入的出单请求,根据预设的证件需求信息生成与所述出单请求相匹配的证件上传提示信息并发送至所述用户终端以提示用户所需上传的证件类型;若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别;从预设的信息识别模板库中获取与所述目标分类类别相匹配的信息识别模板对所述证件图片进行识别,以从所述证件图片中识别得到证件内容信息;根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果;若所述验证结果为符合,将所述证件内容信息发送至所述用户终端以供用户进行确认;若接收到所述用户终端根据所述证件内容信息所反馈的确认信息,向所述用户终端反馈信息输入成功的提示信息。
在一实施例中,所述若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别的步骤,包括:根据所述图片分类模型计算所述证件图片与所述图片分类模型中每一分类类别的目标特征向量之间的匹配率;根据证件图片与每一所述分类类别对应的匹配率确定匹配率最高的一个分类类别为所述证件图片的目标分类类别。
在一实施例中,所述若接收到所述用户终端根据所述证件上传提示信息所反馈的证件图片,根据预置的图片分类模型确定所述证件图片的分类类别作为目标分类类别的步骤之前,还包括:根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型。
在一实施例中,所述根据预置的数据集及预置的模型训练规则对初始图片分类模型进行训练,以将训练后的所述初始图片分类模型作为所述图片分类模型的步骤,包括:根据所述数据拆分信息对所述数据集进行拆分以得到训练数据集及测试数据集;根据所述数据拆分信息对所述数据集进行拆分以得到训练数据集及测试数据集;根据所述初始图片分类模型中的卷积神经网络计算所述测试数据集对应的测试特征向量;根据所述参数值调整规则、所述测试特征向量集及所述训练数据集对所述卷积神经网络进行迭代训练,以对所述卷积神经网络中的参数值进行调整;根据进行参数值调整后的所述卷积神经网络对所述测试数据集进行计算,以获取所述初始图片分类模型中每一分类类别对应的目标特征向量,从而得到训练后的所述初始图片分类模型作为所述图片分类模型。
在一实施例中,所述根据所述证件类型对所述证件内容信息是否符合预置校验规则进行验证以得到验证结果的步骤,包括:根据所述校验规则对所述证件内容信息是否与所述证件类型一一对应进行验证以得到第一验证结果;对所有所述证件内容信息的所有人是否一致进行验证以得到第二验证结果;根据所述第一验证结果及所述第二验证结果获取所述证件内容信息是否符合所述校验规则的验证结果。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的设备、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为逻辑功能划分,实际实现时可以有另外的划分方式,也可以将具有相同功能的单元集合成一个单元,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的,机械的或其它的形式连接。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。所述计算机可读存储介质为实体的、非瞬时性的存储介质,所述计算机可读存储介质为非易失性存储介质,所述计算机可读存储介质可以是前述设备的内部存储单元,例如设备的硬盘或内存等实体存储介质。所述存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等实体存储介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。