一种去除图像中水印的方法及装置与流程

文档序号:34105822发布日期:2023-05-10 19:57阅读:37来源:国知局
一种去除图像中水印的方法及装置与流程

本发明涉及一种去除图像中的水印(watermark)的方法。


背景技术:

1、许多纸件的文档会通过拍照、扫描等方式转换为电子化的文档图像,在文档图像中有时会存在水印。一方面,水印影响用户的阅读体验。另一方面,水印会对文档图像的ocr(光学字符识别)带来干扰,影响ocr的识别结果。因此存在将文档图像中的水印去除的需求,这样能提高文档图像的可读性和美观度,提升用户体验。

2、然而图像(不限于文档图像)中的有些水印体现了知识产权所有者等重要信息,权利人希望在文档图像中保留这些水印。因此在去除图像中的水印时,还需要对不同类型的水印分别处理。


技术实现思路

1、本发明所要解决的技术问题是提出一种去除图像中的水印的方法。用户输入任意一张图像(带水印或不带水印),系统会自动判断是否存在水印,如果存在水印则自动去除水印,从而获得整洁漂亮的图像。

2、为解决上述技术问题,本发明公开了一种去除图像中水印的方法,包括如下步骤。步骤s1:采用一种用于图像分割的第一神经网络从输入图像中获得水印区域;如果第一神经网络从输入图片中获取到水印区域,继续步骤s2;否则退出整个方法。步骤s2:对图像中的水印区域进行光学字符识别,在预存的白名单水印集合中搜索识别结果;如果识别结果匹配到某个白名单水印,退出整个方法;否则继续步骤s3。步骤s3:采用第二神经网络去除图像中的水印。

3、优选地,所述第一神经网络是u2-net、u-net、deeplabv3、pspnet、segnet的任意一种。

4、进一步地,所述第一神经网络的训练方法如下;(1)制作训练数据;采集或生成多张带有水印的图片,在每张图片中由人工标注出水印区域;(2)训练第一神经网络;将每张带有水印的图片送入第一神经网络,第一神经网络输出该图片中的水印区域,使第一神经网络的输出尽可能与每张图片中已标注的水印区域保持一致。

5、优选地,所述步骤s1中,第一神经网络从输入图像中获取水印区域的掩膜;掩膜的大小与第一神经网络的输入图像的大小相同;掩膜中像素值为0表示不是水印区域、像素值不为0表示是水印区域;统计掩膜中像素值不为0的像素的数量n;如果n>t,则判定为输入图片中存在水印;否则判定为输入图片中不存在水印;t是判断阈值。

6、优选地,所述第二神经网络是自校准定位和背景优化slbr。

7、进一步地,所述第二神经网络的训练方法如下;(1)制作训练数据;采集或生成多组图片;每组图片中的第一张是带有水印的图片;每组图片中的第二张是不带水印的图片;(2)训练第二神经网络;将每组图片中的第一张送入第二神经网络,第二神经网络输出去除水印区域的图片,使第二神经网络的输出尽可能与每组图片中的第二张保持一致。

8、可选地,所述第二神经网络的训练数据中,每组图片中还有第三张,第三张是第一张图片中的水印区域的掩膜;在训练第二神经网络时,还将每组图片中的第三张送入第二神经网络。

9、优选地,所述步骤s1和/或步骤s3中,先将输入图像缩小尺寸,再送入第一神经网络或第二神经网络。

10、优选地,当所述第二神经网络处理的图片是缩放后的图片时,在步骤s3之后增加步骤s4。步骤s4:将所述第二神经网络输出的去除水印后的图片放大为步骤s1的原始图像大小,然后将原始图片去除水印区域后、与所述第二神经网络输出的去除水印且放大后的图片中的原水印区域进行合成,得到原始图像大小的去除水印后的图片。

11、优选地,所述步骤s1中,输入图像缩小后,一路经过第一神经网络、第二神经网络时不再缩放尺寸;所述步骤s3中,从第二神经网络输出后再放大回原始图像大小。

12、本发明还公开了一种去除图像中水印的装置,包括水印区域判断获取单元、白名单比对单元、水印去除单元。所述水印区域判断获取单元用于采用一种用于图像分割的第一神经网络从输入图像中获得水印区域;如果第一神经网络从输入图片中获取到水印区域,则将图片及其水印区域传递给其他单元;否则退出整个流程。所述白名单比对单元用于对图像中的水印区域进行光学字符识别,在预存的白名单水印集合中搜索识别结果;如果识别结果匹配到某个白名单水印,退出整个方法;否则交由水印去除单元继续处理。所述水印去除单元用于采用第二神经网络去除图像中的水印。

13、本发明取得的技术效果是:能够较好地去除图像中的水印,从而获得更干净的图像,同时对展示知识产权信息等的白名单水印进行保护而不予去除。如果是文档图像还能提升ocr识别的准确率,提升用户的阅读体验。



技术特征:

1.一种去除图像中水印的方法,其特征是,包括如下步骤;

2.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第一神经网络是u2-net、u-net、deeplabv3、pspnet、segnet的任意一种。

3.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第一神经网络的训练方法如下;(1)制作训练数据;采集或生成多张带有水印的图片,在每张图片中由人工标注出水印区域;(2)训练第一神经网络;将每张带有水印的图片送入第一神经网络,第一神经网络输出该图片中的水印区域,使第一神经网络的输出尽可能与每张图片中已标注的水印区域保持一致。

4.根据权利要求1所述的去除图像中水印的方法,其特征是,所述步骤s1中,第一神经网络从输入图像中获取水印区域的掩膜;掩膜的大小与第一神经网络的输入图像的大小相同;掩膜中像素值为0表示不是水印区域、像素值不为0表示是水印区域;统计掩膜中像素值不为0的像素的数量n;如果n>t,则判定为输入图片中存在水印;否则判定为输入图片中不存在水印;t是判断阈值。

5.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第二神经网络是自校准定位和背景优化slbr。

6.根据权利要求1所述的去除图像中水印的方法,其特征是,所述第二神经网络的训练方法如下;(1)制作训练数据;采集或生成多组图片;每组图片中的第一张是带有水印的图片;每组图片中的第二张是不带水印的图片;(2)训练第二神经网络;将每组图片中的第一张送入第二神经网络,第二神经网络输出去除水印区域的图片,使第二神经网络的输出尽可能与每组图片中的第二张保持一致。

7.根据权利要求6所述的去除图像中水印的方法,其特征是,所述第二神经网络的训练数据中,每组图片中还有第三张,第三张是第一张图片中的水印区域的掩膜;在训练第二神经网络时,还将每组图片中的第三张送入第二神经网络。

8.根据权利要求1所述的去除图像中水印的方法,其特征是,所述步骤s1和/或步骤s3中,先将输入图像缩小尺寸,再送入第一神经网络或第二神经网络。

9.根据权利要求8所述的去除图像中水印的方法,其特征是,当所述第二神经网络处理的图片是缩放后的图片时,在步骤s3之后增加步骤s4;

10.根据权利要求1所述的去除图像中水印的方法,其特征是,所述步骤s1中,输入图像缩小后,一路经过第一神经网络、第二神经网络时不再缩放尺寸;所述步骤s3中,从第二神经网络输出后再放大回原始图像大小。

11.一种去除图像中水印的装置,其特征是,包括水印区域判断获取单元、白名单比对单元、水印去除单元;


技术总结
本发明公开了一种去除图像中水印的方法。步骤S1:采用一种用于图像分割的第一神经网络从输入图像中获得水印区域;如果第一神经网络从输入图片中获取到水印区域,继续步骤S2;否则退出整个方法。步骤S2:对图像中的水印区域进行光学字符识别,在预存的白名单水印集合中搜索识别结果;如果识别结果匹配到某个白名单水印,退出整个方法;否则继续步骤S3。步骤S3:采用第二神经网络去除图像中的水印。本发明能够较好地去除图像中的水印,同时对展示知识产权信息等的白名单水印进行保护而不予去除。

技术研发人员:刘鹏伟,郭丰俊,龙腾,牛力,丁凯,张彬
受保护的技术使用者:上海合合信息科技股份有限公司
技术研发日:
技术公布日:2024/1/12
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1