一种图像处理方法及装置、一种计算设备及存储介质与流程

文档序号:18198642发布日期:2019-07-17 06:01阅读:150来源:国知局
一种图像处理方法及装置、一种计算设备及存储介质与流程

本申请涉及计算机图像处理技术领域,特别涉及一种图像处理方法及装置、一种计算设备及计算机可读存储介质。



背景技术:

证件文字ocr(opticalcharacterrecognition,光学字符识别)在互联网金融等身份认证场景得到了普遍应用。证件文字ocr是指使用ocr技术对用户提供的证件照片进行处理,从而提取并识别证件上的用户信息(如提取身份证照片上的用户姓名、生日、证件有效期等信息)。在现实场景中,由于用户拍摄证件照片的环境复杂多样(如不同的光照角度与强度等),经常需要在拍摄证件时进行适当的补光,保证拍摄到的证件照片具有较好的清晰度与对比度,从而保障后续采用ocr技术对证件照片上的文字等进行正常识别。



技术实现要素:

有鉴于此,本说明书实施例提供了一种图像处理方法及装置、一种计算设备及计算机可读存储介质,以解决现有技术中存在的技术缺陷。

第一方面,本说明书实施例公开了一种图像处理方法,包括:

采集含有目标物体的图像;

基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的底图区域;

将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值;

在所述当前亮度值小于预设目标亮度值的情况下,基于所述预设目标亮度值和当前亮度值确定所述目标物体的底图区域的目标补光亮度值;

基于所述目标补光亮度值调整所述目标物体的底图区域的亮度。

可选地,所述图像分割模型的训练方法包括:

获取训练样本集,其中,所述训练样本集包含多组含有待识别样本物体的图像,每组所述待识别样本物体的图像包括待识别样本物体的图像以及所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域;

通过所述训练样本集对图像分割模型进行训练,得到所述图像分割模型,所述图像分割模型使得所述待识别样本物体的图像与所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域相关联。

可选地,所述图像分割模型包括卷积神经网络模型。

可选地,所述第一颜色空间包括rgb颜色空间,所述第二颜色空间包括lab颜色空间,

将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值,包括:

将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定所述目标物体的底图区域在所述lab颜色空间的当前亮度值。

可选地,将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间,包括:

获取目标物体的底图区域的r、g、b值;

基于所述r、g、b值将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间。

可选地,所述预设目标亮度值的获取包括:

获取至少两个含有待识别样本物体的图像;

基于预先训练的图像分割模型分割出所述至少两个含有待识别样本物体的图像中至少两个待识别样本物体的底图区域;

将每个待识别样本物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定每个待识别样本物体的底图区域在所述lab颜色空间的当前亮度值;

基于所述当前亮度值确定所述至少两个含有待识别样本物体的图像的预设目标亮度值。

可选地,基于所述预设目标亮度值和当前亮度值确定所述目标物体的底图区域的目标补光亮度值之后,还包括:

在所述目标物体的底图区域的颜色不是白色的情况下,确定所述目标物体的底图区域在所述第二颜色空间的当前色彩值;

基于所述当前色彩值确定所述目标物体的底图区域的目标补光色彩值。

可选地,基于所述当前色彩值确定所述目标物体的底图区域的目标补光色彩值之后,还包括:

基于所述目标补光亮度值和所述目标补光色彩值确定最终补光亮度值。

可选地,基于所述目标补光亮度值调整所述目标物体的底图区域的亮度,包括:

基于所述最终补光亮度值调整所述目标物体的底图区域的亮度。

可选地,所述方法还包括:

若所述当前亮度值大于所述预设目标亮度值,则发出提示信息。

可选地,所述方法还包括:

基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的文字区域,并识别所述文字区域中的文字内容。

第二方面,本说明书实施例公开了一种图像处理装置,包括:

采集模块,被配置为采集含有目标物体的图像;

分割模块,被配置为基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的底图区域;

当前亮度值确定模块,被配置为将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值;

目标补光亮度值确定模块,被配置为在所述当前亮度值小于预设目标亮度值的情况下,基于所述预设目标亮度值和当前亮度值确定所述目标物体的底图区域的目标补光亮度值;

调整模块,被配置为基于所述目标补光亮度值调整所述目标物体的底图区域的亮度。

可选地,所述分割模块,进一步被配置为:

获取训练样本集,其中,所述训练样本集包含多组含有待识别样本物体的图像,每组所述待识别样本物体的图像包括待识别样本物体的图像以及所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域;

通过所述训练样本集对图像分割模型进行训练,得到所述图像分割模型,所述图像分割模型使得所述待识别样本物体的图像与所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域相关联。

可选地,所述图像分割模型包括卷积神经网络模型。

可选地,所述第一颜色空间包括rgb颜色空间,所述第二颜色空间包括lab颜色空间,

所述当前亮度值确定模块,进一步被配置为:

将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定所述目标物体的底图区域在所述lab颜色空间的当前亮度值。

可选地,所述当前亮度值确定模块,进一步被配置为:

获取目标物体的底图区域的r、g、b值;

基于所述r、g、b值将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间。

可选地,所述目标补光亮度值确定模块,进一步被配置为:

获取至少两个含有待识别样本物体的图像;

基于预先训练的图像分割模型分割出所述至少两个含有待识别样本物体的图像中至少两个待识别样本物体的底图区域;

将每个待识别样本物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定每个待识别样本物体的底图区域在所述lab颜色空间的当前亮度值;

基于所述当前亮度值确定所述至少两个含有待识别样本物体的图像的预设目标亮度值。

可选地,所述装置还包括:

当前色彩值确定模块,被配置为在所述目标物体的底图区域的颜色不是白色的情况下,确定所述目标物体的底图区域在所述第二颜色空间的当前色彩值;

目标补光色彩值确定模块,被配置为基于所述当前色彩值确定所述目标物体的底图区域的目标补光色彩值。

可选地,所述装置还包括:

最终补光亮度值确定模块,被配置为基于所述目标补光亮度值和所述目标补光色彩值确定最终补光亮度值。

可选地,所述调整模块,进一步被配置为:

基于所述最终补光亮度值调整所述目标物体的底图区域的亮度。

可选地,所述装置还包括:

提示模块,被配置为若所述当前亮度值大于所述预设目标亮度值,则发出提示信息。

可选地,所述装置还包括:

识别模块,被配置为基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的文字区域,并识别所述文字区域中的文字内容。

第三方面,本说明书实施例公开了一种计算设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机指令,所述处理器执行所述指令时实现如上所述图像处理方法的步骤。

第四方面,本说明书实施例公开了一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如上所述图像处理方法的步骤。

本说明书提供的一种图像处理方法及装置、一种计算设备及计算机可读存储介质,其中,所述方法包括采集含有目标物体的图像;基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的底图区域;将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值;在所述当前亮度值小于预设目标亮度值的情况下,基于所述预设目标亮度值和当前亮度值确定所述目标物体的底图区域的目标补光亮度值;基于所述目标补光亮度值调整所述目标物体的底图区域的亮度。实现在含有目标物体的图像拍摄光线不佳,亮度不够的情况下,通过图像分割、色彩模式转换以及当前亮度值等自动计算出目标补光亮度值,保证目标物体的图像清晰且文字与背景对比度大,方便后续采用ocr技术对目标物体的图像上的文字的准确识别,提升用户体验。

附图说明

图1是本说明书一个或多个实施例提供的一种计算设备的结构框图;

图2是本说明书一个或多个实施例提供的一种图像处理方法的流程图;

图3是本说明书一个或多个实施例提供的一种图像处理方法的流程图;

图4是本说明书一个或多个实施例提供的一种图像处理方法的流程图;

图5是本说明书一个或多个实施例提供的一种图像处理方法的流程图;

图6是本说明书一个或多个实施例提供的一种图像处理装置的结构示意图。

具体实施方式

在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。

在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

首先,对本发明一个或多个实施例涉及的名词术语进行解释。

ocr:英文全称:opticalcharacterrecognition,中文全称:光学字符识别,是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

在本申请中,提供了一种图像处理方法及装置、一种计算设备及计算机可读存储介质,在下面的实施例中逐一进行详细说明。

图1是示出了根据本说明书一实施例的计算设备100的结构框图。该计算设备100的部件包括但不限于存储器110和处理器120。处理器120与存储器110通过总线130相连接,数据库150用于保存数据。

计算设备100还包括接入设备140,接入设备140使得计算设备100能够经由一个或多个网络160通信。这些网络的示例包括公用交换电话网(pstn)、局域网(lan)、广域网(wan)、个域网(pan)或诸如因特网的通信网络的组合。接入设备140可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(nic))中的一个或多个,诸如ieee802.11无线局域网(wlan)无线接口、全球微波互联接入(wi-max)接口、以太网接口、通用串行总线(usb)接口、蜂窝网络接口、蓝牙接口、近场通信(nfc)接口,等等。

在本说明书的一个实施例中,计算设备100的上述部件以及图1中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图1所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。

计算设备100可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或pc的静止计算设备。计算设备100还可以是移动式或静止式的服务器。

其中,处理器120可以执行图2所示方法中的步骤。图2示出了根据本说明书一实施例的一种图像处理方法的示意性流程图,包括步骤202至步骤210。

步骤202:采集含有目标物体的图像。

其中,所述目标物体包括但不限于待核身的证件,例如身份证、结婚证或社保卡等。为了便于描述,本说明书一个或多个实施例中均以所述目标物体为身份证为例进行说明。

实际应用中,可以通过手机摄像头等采集含有目标物体的图像。

以所述目标物体为身份证为例,通过手机摄像头采集含有身份证的图像,即所述图像包括身份证图像、以桌面或者纸张等为身份证拍摄背景的背景图像。

步骤204:基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的底图区域。

本说明书一个或多个实施例中,所述图像分割模型的训练方法包括:

获取训练样本集,其中,所述训练样本集包含多组含有待识别样本物体的图像,每组所述待识别样本物体的图像包括待识别样本物体的图像以及所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域;

通过所述训练样本集对图像分割模型进行训练,得到所述图像分割模型,所述图像分割模型使得所述待识别样本物体的图像与所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域相关联。

其中,所述图像分割模型包括卷积神经网络模型,所述卷积神经网络模型即cnn,英文全称为:convolutionalneuralnetworks。

若所述待识别样本物体为身份证,则所述待识别样本物体的底图区域、文字区域、背景区域,即所述待识别样本物体的图像为含有身份证的图像,所述底图区域为不含文字的身份证区域、所述文字区域为身份证图像上的文字区域、所述背景区域为排除身份证区域以及身份证上的文字区域的背景区域。

实际应用中,若所述目标物体为身份证,则所述目标物体的图像中目标物体的底图区域为身份证排除掉文字的区域。

采用预先训练的图像分割模型可以快速准确的将所述目标物体的图像中的目标物体的底图区域识别出来。

步骤206:将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值。

本说明书一个或多个实施例中,所述第一颜色空间包括rgb颜色空间,所述第二颜色空间包括lab颜色空间,

将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值,包括:

将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定所述目标物体的底图区域在所述lab颜色空间的当前亮度值。

其中,将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间,包括:

获取目标物体的底图区域的r、g、b值;

基于所述r、g、b值将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间。

实际使用中,rgb是由红色通道(r)、绿色通道(g)、蓝色通道(b)组成的,最亮的红色+最亮的绿色+最亮的蓝色=白色;最暗的红色+最暗的绿色+最暗的蓝色=黑色;而在最亮和最暗之间,相同明暗度的红色+相同明暗度的绿色+相同明暗度的蓝色=灰色。在rgb的任意一个通道内,白和黑表示这个颜色的明暗度。

而lab中的明度通道(l)专门负责整张图的明暗度,简单的说就是整幅图的黑白版。a通道和b通道只负责颜色的多少。a通道表示从洋红色(通道里的白色)至深绿色(通道里的黑色)的范围;b表示从焦黄色(通道里的白色)至袅蓝色(通道里的黑色)的范围;a、b通道里的50%中性灰色表示没有颜色,所以越接近灰色说明颜色越少,而且a通道和b通道的颜色没有亮度。

rgb颜色空间不能直接转换为lab颜色空间,需要借助xyz颜色空间,把rgb颜色空间转换到xyz颜色空间,之后再把xyz颜色空间转换到lab颜色空间,在lab颜色空间中可以确定所述目标物体的底图区域的当前亮度值。具体的转换过程可以参见现有技术,在此不再赘述。

步骤208:在所述当前亮度值小于预设目标亮度值的情况下,基于所述预设目标亮度值和当前亮度值确定所述目标物体的底图区域的目标补光亮度值。

参见图3,所述预设目标亮度值的获取包括步骤302至步骤308。

步骤302:获取至少两个含有待识别样本物体的图像。

步骤304:基于预先训练的图像分割模型分割出所述至少两个含有待识别样本物体的图像中至少两个待识别样本物体的底图区域。

步骤306:将每个待识别样本物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定每个待识别样本物体的底图区域在所述lab颜色空间的当前亮度值。

步骤308:基于所述当前亮度值确定所述至少两个含有待识别样本物体的预设图像的目标亮度值。

以所述待识别样本物体的图像为多个离线选取的ocr识别率高的、在自然采光条件拍摄的身份证的图像为例,对所述预设目标亮度值的获取进行详细说明。

首先获取多个ocr识别率高的、在自然采光条件拍摄的身份证的图像,然后基于预先训练的图像分割模型分割出每个身份证图像中的身份证的底图区域,再将每个身份证的底图区域由rgb颜色空间转换到lab颜色空间,并确定每个身份证的底图区域在所述lab颜色空间的当前亮度值,然后根据所有的身份证的底图区域的当前亮度值计算出身份证的底图区域的均值即预设目标亮度值。

然后某身份证的底图区域的当前亮度值小于所述目标亮度值的情况下,基于所述预设目标亮度值和当前亮度值计算出该身份证的底图区域的目标补光亮度值。

所述目标补光亮度值可以通过公式(1)计算:

l_目标补光亮度值=(l_alpha–l_current)*delta(1);

其中,l_alpha为目标亮度值,l_current为当前输入图像的底图区域的当前亮度值,delta是补光衰减率,实际应用中可以根据经验来定一个值,在此不作限定。

实际使用中,若所述当前亮度值大于所述预设目标亮度值,则发出提示信息,例如通过语音或文字提示用户将目标物体例如身份证移动到其他光照亮度下。

步骤210:基于所述目标补光亮度值调整所述目标物体的底图区域的亮度。

仍以所述目标物体为身份证为例,在计算出目标补光亮度值后,可以根据所述目标补光亮度值调整身份证的底图区域的亮度。

实际应用中,基于所述目标补光亮度值调整所述目标物体的底图区域的亮度之后,还包括:

基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的文字区域,并识别所述文字区域中的文字内容。

其中,可以通过ocr技术识别所述文字区域中的文字内容。

若所述目标物体为身份证,基于预先训练的图像分割模型分割出身份证图像中身份证上的文字区域,并识别所述文字区域中的文字内容,实现身份证上信息的提取。

本说明书一个或多个实施例中,所述图像处理方法通过采用预先训练的图像分割模型分割出目标物体的底图区域,将该底图区域从rgb颜色空间转换到lab颜色空间,确定出该底图区域的当前亮度值,然后基于预设目标亮度值和当前亮度值计算出目标补光亮度值,最后基于所述目标补光亮度值对该底图区域进行补光,保证目标物体的图像清晰,方便后续采用ocr技术对目标物体的图像上的文字的准确识别,提升用户体验。

其中,处理器120可以执行图4所示方法中的步骤。图4示出了根据本说明书一实施例的一种图像处理方法的示意性流程图,包括步骤402至步骤418。

步骤402:采集含有目标物体的图像。

步骤404:基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的底图区域。

步骤406:将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值。

步骤408:在所述当前亮度值小于预设目标亮度值的情况下,基于所述预设目标亮度值和当前亮度值确定所述目标物体的底图区域的目标补光亮度值。

步骤410:在所述目标物体的底图区域的颜色不是白色的情况下,确定所述目标物体的底图区域在所述第二颜色空间的当前色彩值。

步骤412:基于所述当前色彩值确定所述目标物体的底图区域的目标补光色彩值。

本说明书一个或多个实施例中,在lab颜色空间中可以确定所述目标物体的底图区域的当前色彩值,然后基于所述当前色彩值计算出所述目标物体的底图区域的目标补光色彩值。

其中,所述目标补光色彩值可以通过以下公式(2)和公式(3)计算得到:

a_目标补光色彩值=-1*a_current(2)

b_目标补光色彩值=-1*b_current(3)

其中,a和b标识的是lab颜色空间的色彩,a表示从洋红色至绿色的范围,b表示从黄色至蓝色的范围;a_current表示的是a的当前色彩值,b_current表示的是b的当前色彩值。

实际应用中,所述目标补光色彩值与当前色彩值相加的和为0,即中灰色。

步骤414:基于所述目标补光亮度值和所述目标补光色彩值确定最终补光亮度值。

步骤416:基于所述最终补光亮度值调整所述目标物体的底图区域的亮度。

步骤418:基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的文字区域,并识别所述文字区域中的文字内容。

实际应用中,将目标物体的底图区域从rgb颜色空间转换至lab空间,可以实现亮度l与颜色空间a、b之间相互独立,方便分别操作互不影响,在lab颜色空间中通过主管颜色的2个纬度a、b,非常方便计算补色,即a、b的值为0就表示中灰色,计算目标补光色彩值其实就是将其a、b值取负数即可得到。

本说明书一个或多个实施例中,所述图像处理方法通过采用预先训练的图像分割模型分割出目标物体的底图区域,将该底图区域从rgb颜色空间转换到lab颜色空间,确定出该底图区域的当前亮度值,然后基于预设目标亮度值和当前亮度值计算出目标补光亮度值,再基于当前色彩值计算出目标补光色彩值,最后基于所述目标补光亮度值和目标补光色彩值确定最终补光亮度值,基于最终补光亮度值对该底图区域进行补光。通过调节补光亮度以及补光色彩等方式拍摄出高质量的目标物体的图像,保证目标物体的图像清晰度以及对比度,方便后续采用ocr技术对目标物体的图像上的文字的准确识别,提升用户体验。

参见图5,以所述目标物体为身份证为例,对本说明书一个或多个实施例提供的一种图像处理方法进行详细说明,包括步骤502至步骤528。

步骤502:通过手机摄像头采集含有身份证的图像。

步骤504:基于预先训练的图像分割模型分割出所述身份证的图像中身份证的底图区域。

步骤506:将所述身份证的底图区域由rgb颜色空间转换到lab颜色空间,并确定所述身份证的底图区域在所述lab颜色空间的当前亮度值。

步骤508:判断所述当前亮度值是小于还是大于预设目标亮度值,若小于,则执行步骤510,若等于,则执行步骤512,若大于,则执行步骤514。

步骤510:基于所述预设目标亮度值和当前亮度值确定所述身份证的底图区域的目标补光亮度值。

步骤512:结束。

具体地,所述当前亮度值等于预设目标亮度值的情况下,则所述身份证图像的亮度合适无需调整。

步骤514:发出提示信息,提示用户将身份证移动到其他亮度条件下。

步骤516:判断所述身份证的底图区域的颜色是否为白色,若是,则执行步骤518,若否,则执行步骤520。

步骤518:结束。

步骤520:确定所述身份证的底图区域在所述lab颜色空间的当前色彩值。

实际应用中,对身份证的底图区域的颜色进行分析,以白色为目标色,补上与身份证的底图区域的颜色互补的颜色,因为身份证的文字区域为黑色,而黑色具有吸收一切光的特性,不会受补光颜色的影响,最后得到的证件区域图是白底黑字,有利于采用ocr技术对文字识别。

步骤522:基于所述当前色彩值确定所述身份证的底图区域的目标补光色彩值。

步骤524:基于所述目标补光亮度值和所述目标补光色彩值确定最终补光亮度值。

步骤526:基于所述最终补光亮度值调整所述身份证的底图区域的亮度。

步骤528:基于预先训练的图像分割模型分割出所述身份证的图像中身份证的文字区域,并识别所述文字区域中的文字内容。

本说明书一个或多个实施例中,所述图像处理方法通过采用预先训练的图像分割模型分割出身份证的底图区域,将该底图区域从rgb颜色空间转换到lab颜色空间,确定出该底图区域的当前亮度值,然后基于预设目标亮度值和当前亮度值计算出目标补光亮度值,再基于当前色彩值计算出目标补光色彩值,最后基于所述目标补光亮度值和目标补光色彩值确定最终补光亮度值,基于最终补光亮度值对该底图区域进行补光。通过调节补光亮度以及补光色彩等方式拍摄出高质量的身份证的图像,保证身份证的图像清晰度以及对比度,方便后续采用ocr技术对身份证的图像上的文字的准确识别,提升用户体验。

参见图6,本说明书一个或多个实施例提供了一种图像处理装置,包括:

采集模块602,被配置为采集含有目标物体的图像;

分割模块604,被配置为基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的底图区域;

当前亮度值确定模块606,被配置为将所述目标物体的底图区域由第一颜色空间转换到第二颜色空间,并确定所述目标物体的底图区域在所述第二颜色空间的当前亮度值;

目标补光亮度值确定模块608,被配置为在所述当前亮度值小于预设目标亮度值的情况下,基于所述预设目标亮度值和当前亮度值确定所述目标物体的底图区域的目标补光亮度值;

调整模块610,被配置为基于所述目标补光亮度值调整所述目标物体的底图区域的亮度。

可选地,所述分割模块604,进一步被配置为:

获取训练样本集,其中,所述训练样本集包含多组含有待识别样本物体的图像,每组所述待识别样本物体的图像包括待识别样本物体的图像以及所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域;

通过所述训练样本集对图像分割模型进行训练,得到所述图像分割模型,所述图像分割模型使得所述待识别样本物体的图像与所述待识别样本物体的图像中待识别样本物体的底图区域、文字区域、背景区域相关联。

可选地,所述图像分割模型包括卷积神经网络模型。

可选地,所述第一颜色空间包括rgb颜色空间,所述第二颜色空间包括lab颜色空间,

所述当前亮度值确定模块606,进一步被配置为:

将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定所述目标物体的底图区域在所述lab颜色空间的当前亮度值。

可选地,所述当前亮度值确定模块606,进一步被配置为:

获取目标物体的底图区域的r、g、b值;

基于所述r、g、b值将所述目标物体的底图区域由rgb颜色空间转换到lab颜色空间。

可选地,所述目标补光亮度值确定模块608,进一步被配置为:

获取至少两个含有待识别样本物体的图像;

基于预先训练的图像分割模型分割出所述至少两个含有待识别样本物体的图像中至少两个待识别样本物体的底图区域;

将每个待识别样本物体的底图区域由rgb颜色空间转换到lab颜色空间,并确定每个待识别样本物体的底图区域在所述lab颜色空间的当前亮度值;

基于所述当前亮度值确定所述至少两个含有待识别样本物体的图像的预设目标亮度值。

可选地,所述装置还包括:

当前色彩值确定模块,被配置为在所述目标物体的底图区域的颜色不是白色的情况下,确定所述目标物体的底图区域在所述第二颜色空间的当前色彩值;

目标补光色彩值确定模块,被配置为基于所述当前色彩值确定所述目标物体的底图区域的目标补光色彩值。

可选地,所述装置还包括:

最终补光亮度值确定模块,被配置为基于所述目标补光亮度值和所述目标补光色彩值确定最终补光亮度值。

可选地,所述调整模块610,进一步被配置为:

基于所述最终补光亮度值调整所述目标物体的底图区域的亮度。

可选地,所述装置还包括:

提示模块,被配置为若所述当前亮度值大于所述预设目标亮度值,则发出提示信息。

可选地,所述装置还包括:

识别模块,被配置为基于预先训练的图像分割模型分割出所述目标物体的图像中目标物体的文字区域,并识别所述文字区域中的文字内容。

本说明书一个或多个实施例中,所述图像处理装置通过采用预先训练的图像分割模型分割出目标物体的底图区域,将该底图区域从rgb颜色空间转换到lab颜色空间,确定出该底图区域的当前亮度值,然后基于预设目标亮度值和当前亮度值计算出目标补光亮度值,最后基于所述目标补光亮度值对该底图区域进行补光,保证目标物体的图像清晰,方便后续采用ocr技术对目标物体的图像上的文字的准确识别,提升用户体验。

上述为本实施例的一种图像处理装置的示意性方案。需要说明的是,该图像处理装置的技术方案与上述的图像处理方法的技术方案属于同一构思,图像处理装置的技术方案未详细描述的细节内容,均可以参见上述图像处理方法的技术方案的描述。

本申请一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现如前所述图像处理方法的步骤。

上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的图像处理方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述图像处理方法的技术方案的描述。

上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本申请所必须的。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。

以上公开的本申请优选实施例只是用于帮助阐述本申请。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本申请的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本申请。本申请仅受权利要求书及其全部范围和等效物的限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1