一种图像处理方法、装置、电子设备及存储介质与流程

文档序号:36490809发布日期:2023-12-26 19:05阅读:25来源:国知局
一种图像处理方法与流程

本发明涉及图像处理,尤其涉及一种图像处理方法、装置、电子设备及存储介质。


背景技术:

1、近年来,ocr(optical character recognition,光学字符识别)文本识别任务作为计算机视觉领域的核心问题之一,旨在找出图像中所有的文字信息,进而确定它们的位置和内容。由于文字有不同的外观、形状、尺度和姿态,加上成像时的光照、遮挡等因素干扰,ocr文本识别一直是计算机视觉领域极具挑战性的问题之一。由于样本图像拍摄区域有限、成像条件不足等因素而导致的低分辨率图像会对下游任务带来性能下降。


技术实现思路

1、本发明提供了一种图像处理方法、装置、电子设备及存储介质,以解决由于样本图像拍摄区域有限,成像条件不足等因素而导致的低分辨率的问题。

2、根据本发明的一方面,提供了一种图像处理方法,包括:

3、获取文本模糊图像,对文本模糊图像进行预处理,得到文本模糊图像的先验图像;

4、基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像;

5、基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像;

6、基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像。

7、可选的,对文本模糊图像进行预处理,得到文本模糊图像的先验图像,包括:

8、对文本模糊图像进行二值化处理,得到文本模糊图像的掩码图像,将掩码图像作为文本模糊图像的先验图像;或者,

9、对文本模糊图像进行图像分割,得到分割图像,将分割图像作为文本模糊图像的先验图像。

10、可选的,在得到文本模糊图像的先验图像之后还包括:

11、对先验图像进行至少一层的特征提取,得到先验图像的特征图像;

12、相应的,基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像,包括:

13、基于第一处理模型对先验图像的特征图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像。

14、可选的,基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像,包括:

15、迭代执行如下处理过程,直到满足迭代结束条件,得到粗预测图像对应的残差图像:

16、获取当前次的迭代图像、当前迭代次数和粗预测图像;其中,当前次的迭代图像为第二处理模型在上一次迭代输出图像或者首次输入的初始图像;

17、将当前次的迭代图像、当前迭代次数和粗预测图像输入至第二处理模型,得到当前次迭代输出的图像。

18、可选的,方法还包括:

19、确定不同次迭代输出图像的损失数据,基于损失数据确定是否满足迭代结束条件,迭代结束条件包括:不同次迭代输出图像的损失数据达到收敛状态,或者,当前次迭代输出的图像的损失数据小于预设值。

20、可选的,基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像,包括:

21、将粗预测图像和残差图像的对应像素点进行像素值相加,得到超分辨率图像。

22、可选的,第一处理模型为u-net网络模型,第二处理模型为扩散模型;

23、第一处理模型基于模糊样本图像和清晰标签图像训练得到,其中,模糊样本图像通过对清晰标签图像进行模糊处理得到;

24、第二处理模型基于第一处理模型对模糊样本图像的粗预测图像,以及模糊样本图像和清晰标签图像的差异标签图像训练得到。

25、根据本发明的另一方面,提供了一种图像处理装置,其特征在于,包括:

26、先验图像获取模块,用于获取文本模糊图像,对文本模糊图像进行预处理,得到文本模糊图像的先验图像;

27、粗预测图像确定模块,用于基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像;

28、残差图像确定模块,用于基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像;

29、超分辨率图像确定模块,用于基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像。

30、根据本发明的另一方面,提供了一种电子设备,电子设备包括:

31、至少一个处理器;以及

32、与至少一个处理器通信连接的存储器;其中,

33、存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的图像处理方法。

34、根据本发明的另一方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的图像处理方法。

35、本发明实施例的技术方案,通过获取文本模糊图像,对文本模糊图像进行预处理,得到文本模糊图像的先验图像;基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像;基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像;基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像,通过本方案可以得到文本模糊图像对应的超分辨率图像,解决了由于样本图像拍摄区域有限、成像条件不足等多种因素而导致的低分辨率的问题,提高了文本模糊图像去模糊效果,提升了文本模糊图像的分辨率,也使得得到的超分辨率图像更加具有高质量和高准确度。

36、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种图像处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述文本模糊图像进行预处理,得到所述文本模糊图像的先验图像,包括:

3.根据权利要求1所述的方法,其特征在于,在得到所述文本模糊图像的先验图像之后还包括:

4.根据权利要求1所述的方法,其特征在于,所述基于第二处理模型对所述粗预测图像进行残差预测,得到所述粗预测图像对应的残差图像,包括:

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述基于所述粗预测图像和所述残差图像确定所述文本模糊图像对应的超分辨率图像,包括:

7.根据权利要求1-6中任一项所述的方法,其特征在于,所述第一处理模型为u-net网络模型,所述第二处理模型为扩散模型;

8.一种图像处理装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的图像处理方法。


技术总结
本发明公开了一种图像处理方法、装置、电子设备及存储介质。方法包括:获取文本模糊图像,对文本模糊图像进行预处理,得到文本模糊图像的先验图像;基于第一处理模型对先验图像和文本模糊图像进行预测处理,得到文本模糊图像的粗预测图像;基于第二处理模型对粗预测图像进行残差预测,得到粗预测图像对应的残差图像;基于粗预测图像和残差图像确定文本模糊图像对应的超分辨率图像。通过本方案提出的图像处理方法实现对文本模糊图像进行处理,得到文本模糊图像对应的超分辨率图像,提高了文本模糊图像去模糊效果,提升了文本模糊图像的分辨率,也使得得到的超分辨率图像更加具有高质量和高准确度。

技术研发人员:黎安
受保护的技术使用者:联仁健康医疗大数据科技股份有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1