档案扫描图像修复方法、装置及电子设备与流程

文档序号:17591825发布日期:2019-05-03 21:55阅读:666来源:国知局
档案扫描图像修复方法、装置及电子设备与流程

本发明涉及图像处理领域,具体而言,涉及一种档案扫描图像修复方法、装置及电子设备。



背景技术:

档案数字化加工过程中经常会由于人为的、扫描输入设备原因或者档案原件本身的原因,导致档案扫描图像产生重影、内容局部受损、失焦模糊等情况。

现有技术中,修复模糊图像的方法主要是基于对图像进行滤波,通过构建模糊图像的核来修复模糊图像,或者基于对抗网络的监督学习方法修复模糊图像。档案扫描图像常常存在的图像中的线条宽度不一、图像模糊、图像纹理特征少等情况,当前模糊图像修复方法不能同时保持对这些情况的模糊图像都具有高精度的修复效果,因而当前的模糊图像修复方法对档案扫描图像的修复精度低。



技术实现要素:

本发明的目的在于提供一种档案扫描图像修复方法、装置及电子设备,其旨在提高模糊图像修复的修复精度。

第一方面,本发明实施例提供了一种档案扫描图像修复方法,包括:获得档案扫描图像;基于所述档案扫描图像的灰度值,判断所述档案扫描图像是否是模糊图像;若是,基于训练后的机器学习模型,根据所述档案扫描图像的灰度值对所述档案扫描图像进行修复,获得清晰的档案图像。

可选的,在所述基于所述档案扫描图像的灰度,判断所述档案扫描图像是否是模糊图像之前,所述方法还包括:

对所述档案扫描图像进行预处理。

可选的,所述对所述档案扫描图像进行预处理具体为:将所述档案扫描图像转化成灰度图像。

可选的,所述基于所述档案扫描图像的灰度,判断所述档案扫描图像是否是模糊图像,包括:

基于所述灰度图像,提取所述档案扫描图像的特征,获得特征图像;

基于所述特征图像,判断所述档案扫描图像是否是模糊图像。

可选的,所述基于所述特征图像判断所述档案扫描图像是否是模糊图像,包括:

获得所述特征图像的每个像素点的灰度值;

基于所述每个像素点的灰度值,获得所述档案扫描图像的灰度值的方差;

若所述灰度值的方差小于或者等于设定阈值,则判定所述档案扫描图像为模糊图像。

可选的,用于修复图像的机器学习模型的训练方法,包括:

将多张原始模糊图像和多张原始清晰图像输入机器学习模型中,所述机器学习模型针对所述多张原始模糊图像和所述多张原始清晰图像,分别输出多张第一生成清晰图像和多张第一生成模糊图像;

将所述多张第一生成清晰图像和所述多张第一生成模糊图像输入所述机器学习模型中,所述机器学习模型针对所述多张第一生成清晰图像和所述多张第一生成模糊图像,分别输出多张第二生成模糊图像和多张第二生成清晰图像;

基于所述多张第一生成清晰图像和所述多张原始清晰图像,获得第一损失值;

基于所述多张第一生成模糊图像和所述多张原始模糊图像,获得第二损失值;

基于所述多张第二生成清晰图像、所述多张原始清晰图像、所述多张第二生成模糊图像和所述多张原始模糊图像,获得第三损失值;

若所述第一损失值、所述第二损失值和所述第三损失值满足设定条件,停止训练所述机器学习模型,获得训练后的机器学习模型,所述训练后的机器学习模型用于将模糊图像恢复成清晰图像。

可选的,所述训练后的机器学习模型的训练方法还包括:

若所述第一损失值、所述第二损失值和所述第三损失值不满足设定条件,调整所述机器学习模型的训练权重,以使所述机器学习模型的第一编码器和第二编码器的权重相同,以及所述机器学习模型的第一生成器和第二生成器的权重相同,训练经过调整训练权重后的所述机器学习模型。

第二方面,本发明实施例提供了一种档案扫描图像修复装置,包括:

获得模块,用于获得档案扫描图像;

处理模块,用于基于所述档案扫描图像的灰度值,判断所述档案扫描图像是否是模糊图像;若是,基于训练后的机器学习模型,根据所述档案扫描图像的灰度值对所述档案扫描图像进行修复,获得清晰的档案图像。

第三方面,本发明实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。

第四方面,本发明实施例提供了一种电子设备,其特征在于,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述方法的步骤。

相对现有技术,本发明具有以下有益效果:

本发明实施例提供了一种档案扫描图像修复方法、装置及电子设备,所述方法包括:获得档案扫描图像;基于档案扫描图像的灰度值,判断档案扫描图像是否是模糊图像;若是,基于训练后的机器学习模型,根据档案扫描图像的灰度值对档案扫描图像进行修复,获得清晰的档案图像。通过基于档案扫描图像的灰度判断档案扫描图像是否是模糊图像,对于可能具有线条宽度不一、图像模糊、图像纹理的特性的档案扫描图像是否是模糊图像的判定准确;图像的灰度可以表征图像的特性,根据档案扫描图像的灰度值,对档案扫描图像进行修复,可以提高档案扫描图像的灰度的修复效果;通过机器学习模型基于档案扫描图像的灰度对档案扫描图像进行修复,提高了档案扫描图像的灰度的修复精度。解决了现有技术中档案扫描图像的修复精度低的技术问题,达到了提高了档案扫描图像的灰度的修复精度的技术效果。

本发明实施例的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本发明实施例提供的一种档案扫描图像修复方法的流程图。

图2示出了本发明实施例提供的另一种档案扫描图像修复方法的流程图。

图3示出了本发明实施例提供的一种档案扫描图像修复装置200的方框结构示意图。

图4示出了本发明实施例提供的一种电子设备的方框结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了本发明实施例提供了一种档案扫描图像修复方法、装置及电子设备,用以解决现有技术中档案扫描图像的修复精度低的技术问题。

实施例

本发明实施例提供的一种档案扫描图像修复方法,包括如图1所示的s100~s400,以下结合图1对s100~s400进行阐述。

s100:获得档案扫描图像。

s200:基于档案扫描图像的灰度值,判断档案扫描图像是否是模糊图像。

s300:若档案扫描图像是模糊图像,基于训练后的机器学习模型,根据档案扫描图像的灰度值对档案扫描图像进行修复,获得清晰的档案图像。

在本发明实施例中,档案扫描图像是指对纸质档案进行扫描获得的图像。在扫描档案以获得档案扫描图像的过程中,经常会由于人为操作时纸张放置倾斜、扫描输入设备的扫描精度低或者档案原件本身的退化等原因,导致档案扫描图像出现重影、内容局部受损、失焦模糊等情况,造成档案扫描图像模糊,降低了档案扫描图像的质量。然而,对于通过提高人为操作的精度、提高扫描输入设备的扫描精度或者防止档案原件本身退化等方法来提高档案扫描图像的质量,其成本是昂贵的,实现起来也非常困难。因此,可以通过采用基于电子设备的图像修复方法,对出现模糊的档案扫描图像进行修复,获得清晰的档案图像。现有技术中,主要通过基于监督的深度学习方法对模糊的图像进行修复,这种方法主要依赖于模糊的图像具有明显的、类型单一的特征,例如,基于深度学习的方法像素点到像素点(pix2pix)是监督学习场景下的修复算法,该算法依赖大量内容一一配对,然而,对于多张档案扫描图像来说,并非所有档案扫描图像的特征都清晰,因此基于深度学习的方法中从像素点到像素点(pix2pix)的图像修复方式不能对特征不清晰的档案扫描图像的修复精度低。

在本发明实施例中在对档案扫描图像进行修复之前,先判断档案扫描图像是否是模糊图像。具体的,通过s200判断档案扫描图像是否是模糊图像。

作为一种可选的实时方式,在执行s200之前,先对档案扫描图像进行预处理。具体的,预处理具体的可以是将档案扫描图像转换成灰度图像、将档案扫描图像进行滤波处理等。

作为一种可选的实施方式,s200包括图2中所示的s200-1和s200-2,s200-1:基于灰度图像,提取档案扫描图像的特征,获得特征图像。s200-2:基于特征图像,判断档案扫描图像是否是模糊图像。

其中,对于s200-1,具体为:通过拉普拉斯算子(laplacian)在灰度图像中获取档案扫描图像的特征,具体为通过拉普拉斯算子对灰度图像进行滤波处理,获得档案扫描图像的特征图像。如此,基于灰度图像获得的特征特向进包括档案扫描图像的灰度特征。通过拉普拉斯算子对灰度图像进行滤波处理,其检测速度快、准确度高、可控性好,提高了档案扫描图像的特征图像的准确性。需要解释的是,s200-1中提取档案扫描图像的特征并不限定于通过拉普拉斯算子(laplacian)在灰度图像中获取档案扫描图像的特征,还可以通过罗伯茨算子(roberts)、canny算子获取档案扫描图像的特征。

作为一种可选的实施方式,s200-2具体为:获得特征图像的每个像素点的灰度值,基于每个像素点的灰度值,获得档案扫描图像的灰度值的方差,若灰度值的方差小于或者等于设定阈值,则判定档案扫描图像为模糊图像。基于每个像素点的灰度值,获得档案扫描图像的灰度的方差具体为:计算特征图像中的像素点的灰度值的方差,以该方差作为档案扫描图像的灰度的方差。例如,特征图像包括多个像素点,例如,设定阈值为1000,档案扫描图像的特征图像包括4个像素点,4个像素点的灰度值分别是150、130、0和255,均值k=[(150+130+0+255)/4],k=134,其中,[(150+130+0+255)/4]表示对(150+130+0+255)/4进行向上取整,则特征图像中的像素点的灰度值的方差s大于1000,则将档案扫描图像判定为清晰图像。若档案扫描图像的特征图像中的像素点的灰度值的方差s=100,100小于1000,则将档案扫描图像判定为模糊图像。若档案扫描图像的特征图像中的像素点的灰度值的方差s=1000,1000等于1000,则将档案扫描图像判定为模糊图像。

通过采用以上方案,不依赖于档案扫描图像中的线条、彩色像素值、图像纹理等特征,基于图像的像素点的灰度值,判断档案扫描图像是否是模糊图像,可靠性高,适用性强。

若档案扫描图像是模糊图像,需要对档案扫描图像进行恢复,以获得清晰的档案图像。在本发明实施例中,通过s300对模糊的档案扫描图像进行恢复。

针对s300,将模糊的档案扫描图像以及档案扫描图像的灰度值输入训练后的机器学习模型中,机器学习模型对档案扫描图像进行修复,输出清晰的档案图像。在本发明实施例中,在将模糊的档案扫描图像输入训练后的机器学习模型中之前,需要训练机器学习模型。

作为一种可选的实施方式,用于修复图像的机器学习模型的训练方法具体为:将多张原始模糊图像和多张原始清晰图像输入机器学习模型中,机器学习模型针对多张原始模糊图像和多张原始清晰图像,分别输出多张第一生成清晰图像和多张第一生成模糊图像;将多张第一生成清晰图像和多张第一生成模糊图像输入所述机器学习模型中,所述机器学习模型针对多张第一生成清晰图像和多张第一生成模糊图像,分别输出多张第二生成模糊图像和多张第二生成清晰图像;基于多张第一生成清晰图像和多张原始清晰图像,获得第一损失值;基于多张第一生成模糊图像和多张原始模糊图像,获得第二损失值;基于多张第二生成清晰图像、多张原始清晰图像、多张第二生成模糊图像和多张原始模糊图像,获得第三损失值;若第一损失值、第二损失值和第三损失值满足设定条件,停止训练所述机器学习模型,获得训练后的机器学习模型,训练后的机器学习模型用于将模糊图像恢复成清晰图像。

作为一种可选的实施方式,机器学习模型是循环生成对抗网络模型(cyclegenerativeadversarialnetwork,cyclegan)。

作为一种可选的实施方式,第一损失值的具体计算方式如公式(1)所示:

lgy(gy,dy,x,y)=ey~y[logdy(y)+ex~x[log(1-dy(gy(x)))](1)

其中,lgy(gy,dy,x,y)表示第一损失值,dy(y)表示循环生成对抗网络模型中的判别器d对某张原始清晰图像y的判别结果,ey~y[logdy(y)表示对清晰图像集合y中的每张原始清晰图像y的判别结果dy(y)的对数的均值。gy(x)表示循环生成对抗网络模型中的生成器g将某张原始模糊图像x转换成与原始模糊图像x对应的第一生成清晰图像,dy(gy(x))表示判别器d对第一生成清晰图像gy(x)的判别结果。

作为一种可选的实施方式,第二损失值的具体计算方式如公式(2)所示:

lgx(gy,dy,x,y)=ex~x[logdx(x)+ey~y[log(1-dx(gx(y)))](2)

其中,lgx(gy,dy,x,y)表示第二损失值,dx(x)表示判别器d对某张原始模糊图像x的判别结果,gx(y)表示生成器对某张原始清晰图像y转换得到的第一模糊图像,dx(gx(y))表示判别器d对第一模糊图像gx(y)的判别结果。

作为一种可选的实施方式,第三损失值的具体计算方式如公式(3)所示:

lcyc(gy,gx,x,y)=ey~y[||(gy(gx(y)))-y||1]+ex~x[||(gx(gy(x)))-x||1(3)

其中,lcyc(gy,gx,x,y)表示第三损失值,gy(gx(y))表示将某张第一模糊图像转换得到的第二清晰图像。gx(gy(x))表示将某张第一清晰图像转换成的第二模糊图像。通过获得第二清晰图像gy(gx(y))与原始清晰图像y之间的差值的模||(gy(gx(y)))-y||1,再基于所述模获得清晰图像集合y中的每张清晰图相对应的模获得清晰图像集合的均值ey~y[||(gy(gx(y)))-y||1],同样的,gy(x)是基于将某张原始模糊图像x转换成第一清晰图像,(gx(gy(x)))是将第一清晰图像gy(x)转换成的第二模糊图像。

通过采用以上方案,通过基于第二模糊图像与原始模糊图像之差和第二清晰图像与原始清晰图像之差,获得用于判定循环生成对抗网络模型的对原始模糊图像和原始清晰图像的转换的精度大小的第三损失值,第三损失值可以完整地刻画循环生成对抗网络模型的性能。

作为一种可选的实施方式,若第一损失值、第二损失值和第三损失值满足设定条件,停止训练所述机器学习模型,获得训练后的机器学习模型,具体为:当第一损失值、第二损失值和第三损失值收敛至平稳时,表示机器学习模型已经训练至稳定,即机器学习模型将原始模糊图像转换成第一清晰图像以及将原始清晰图像转换成第一模糊图像的精度达到要求,因此,停止训练机器学习模型,此时训练后的机器学习模型可以将模糊图像恢复成清晰图像。

作为一种可选的实施方式,若第一损失值、第二损失值和第三损失值不满足设定条件,调整机器学习模型的训练权重,以使机器学习模型的第一编码器和第二编码器的权重相同,以及机器学习模型的第一生成器和第二生成器的权重相同,训练经过调整训练权重后的机器学习模型,直到第一损失值、第二损失值和第三损失值满足设定条件。

本发明实施例提供了一种档案扫描图像修复方法所述方法包括:获得档案扫描图像;基于档案扫描图像的灰度值,判断档案扫描图像是否是模糊图像;若是,基于训练后的机器学习模型,根据档案扫描图像的灰度值对档案扫描图像进行修复,获得清晰的档案图像。通过基于档案扫描图像的灰度判断档案扫描图像是否是模糊图像,对于可能具有线条宽度不一、图像模糊、图像纹理的特性的档案扫描图像是否是模糊图像的判定准确;图像的灰度可以表征图像的特性,根据档案扫描图像的灰度,对档案扫描图像进行修复,可以提高档案扫描图像的灰度的修复效果;通过机器学习模型基于档案扫描图像的灰度对档案扫描图像进行修复,提高了档案扫描图像的灰度的修复精度。解决了现有技术中档案扫描图像的修复精度低的技术问题,达到了提高了档案扫描图像的灰度的修复精度的技术效果。

针对上述实施例提供一种档案扫描图像修复方法,本申请实施例还对应提供一种用于执行上述的步骤的执行主体,该执行主体可以为图3中档案扫描图像修复装置200。请参考图3,该装置包括:

获得模块210,用于获得档案扫描图像;

处理模块220,用于基于所述档案扫描图像的灰度值,判断所述档案扫描图像是否是模糊图像;若是,基于训练后的机器学习模型,根据所述档案扫描图像的灰度值对所述档案扫描图像进行修复,获得清晰的档案图像。

作为一种可选的实施方式,所述处理模块220还用于:对所述档案扫描图像进行预处理。

作为一种可选的实施方式,所述处理模块220具体还用于:将所述档案扫描图像转化成灰度图像。

作为一种可选的实施方式,所述处理模块220具体还用于:基于所述灰度图像,提取所述档案扫描图像的特征,获得特征图像;基于所述特征图像,判断所述档案扫描图像是否是模糊图像。

作为一种可选的实施方式,所述处理模块220具体还用于:获得所述特征图像的每个像素点的灰度值;基于所述每个像素点的灰度值,获得所述档案扫描图像的灰度值的方差;若所述灰度值的方差小于或者等于设定阈值,则判定所述档案扫描图像为模糊图像。

作为一种可选的实施方式,所述处理模块220具体还用于:训练用于修复图像的机器学习模型,具体为:将多张原始模糊图像和多张原始清晰图像输入机器学习模型中,所述机器学习模型针对所述多张原始模糊图像和所述多张原始清晰图像,分别输出多张第一生成清晰图像和多张第一生成模糊图像;将所述多张第一生成清晰图像和所述多张第一生成模糊图像输入所述机器学习模型中,所述机器学习模型针对所述多张第一生成清晰图像和所述多张第一生成模糊图像,分别输出多张第二生成模糊图像和多张第二生成清晰图像;基于所述多张第一生成清晰图像和所述多张原始清晰图像,获得第一损失值;基于所述多张第一生成模糊图像和所述多张原始模糊图像,获得第二损失值;基于所述多张第二生成清晰图像、所述多张原始清晰图像、所述多张第二生成模糊图像和所述多张原始模糊图像,获得第三损失值;若所述第一损失值、所述第二损失值和所述第三损失值满足设定条件,停止训练所述机器学习模型,获得训练后的机器学习模型,所述训练后的机器学习模型用于将模糊图像恢复成清晰图像。

作为一种可选的实施方式,所述处理模块220具体还用于:若所述第一损失值、所述第二损失值和所述第三损失值不满足设定条件,调整所述机器学习模型的训练权重,以使所述机器学习模型的第一编码器和第二编码器的权重相同,以及所述机器学习模型的第一生成器和第二生成器的权重相同,训练经过调整训练权重后的所述机器学习模型。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

本发明实施例还提供了一种电子设备,如图4所示,包括存储器504、处理器502及存储在存储器504上并可在处理器502上运行的计算机程序,所述处理器502执行所述程序时实现前文所述档案扫描图像修复方法的任一方法的步骤。

其中,在图4中,总线架构(用总线500来代表),总线500可以包括任意数量的互联的总线和桥,总线500将包括由处理器502代表的一个或多个处理器和存储器504代表的存储器的各种电路链接在一起。总线500还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进一步描述。总线接口505在总线500和接收器501和发送器503之间提供接口。接收器501和发送器503可以是同一个元件,即收发机,提供用于在传输介质上与各种其他装置通信的单元。处理器502负责管理总线500和通常的处理,而存储器504可以被用于存储处理器502在执行操作时所使用的数据。

本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现前文所述档案扫描图像修复方法的任一方法的步骤。

在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本发明实施例的装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1