本申请属于文字处理,尤其涉及一种文字掩码的生成方法及相关设备。
背景技术:
1、随着数字化和网络通信的普及,个人和企业产生的信息量在不断增加,其中包含的隐私和敏感信息也随之增加,这使得文字的隐私和安全问题也越来越突出。文字掩码是一种用于隐藏敏感信息或保护隐私的文本处理技术。通过将文本中的某些字符或信息替换为其他字符或信息,实现对文本内容的限制和保护。
2、目前,输入的图像多种多样,有些图像可能存在光照不足、字体模糊,以及背景颜色与文字颜色非常接近等问题,可能导致根据输入图像生成的文字掩码无法使用,使得文字掩码的有效性很低。
技术实现思路
1、鉴于上述问题,本申请提出了一种文字掩码的生成方法及相关设备,为了提高生成的文字掩码的可用性,具体方案如下:
2、一种文字掩码的生成方法,包括:
3、获取目标图像,所述目标图像中包括文本框区域;
4、基于所述文本框区域,获得第一文字掩码;
5、判断所述第一文字掩码是否为异常掩码;
6、如果所述第一文字掩码为所述异常掩码,则将所述目标图像进行颜色反转,得到颜色反转后的目标图像;
7、基于所述颜色反转后的目标图像,获得第二文字掩码。
8、可选的,所述目标图像是初始图像,或,高斯文字增强后的初始图像。
9、可选的,所述基于所述文本框区域,获得第一文字掩码,包括:
10、对所述文本框区域进行基于自适应阈值的二值化处理,得到二值化处理后的文本框区域;
11、对所述二值化处理后的文本框区域进行膨胀操作,获得所述第一文字掩码。
12、可选的,所述判断所述第一文字掩码是否为异常掩码,包括:
13、获取所述第一文字掩码和所述文本框区域的重叠率,基于所述重叠率确认所述第一文字掩码是否为所述异常掩码;
14、或,
15、获取所述二值化处理后的文本框区域内各像素点的像素值,基于所述各像素点的像素值确认所述第一文字掩码是否为所述异常掩码。
16、可选的,所述对所述文本框区域进行基于自适应阈值的二值化处理,得到二值化处理后的文本框区域,包括:
17、对所述文本框区域进行灰度化,得到所述文本框区域的灰度图,所述文本框区域的灰度图包括多个像素点;
18、对各个所述像素点进行基于自适应阈值的二值化处理,得到二值化处理后的文本框区域。
19、可选的,所述二值化处理后的文本框区域包括多个非零元素,每个所述非零元素对应至少一个像素值;
20、所述对所述二值化处理后的文本框区域进行膨胀操作,获得所述第一文字掩码,包括:
21、将预设的结构元素依次移动至所述二值化处理后的文本框区域中的所述多个非零元素处,所述结构元素对应至少一个像素值;
22、判断所述多个非零元素中是否存在满足预设条件的非零元素,所述预设条件为所述非零元素被所述结构元素覆盖,且所述结构元素对应的像素值与所述非零元素对应的像素值不同;
23、如果所述多个非零元素中存在满足预设条件的非零元素,则将所述满足预设条件的非零元素对应的像素值修改为所述结构元素对应的像素值,获得第一文字掩码。
24、一种文字掩码的生成装置,包括:
25、获取单元,用于获取目标图像,所述目标图像中包括文本框区域;
26、第一获得单元,用于基于所述文本框区域,获得第一文字掩码;
27、判断单元,用于判断所述第一文字掩码是否为异常掩码;
28、反转单元,用于如果所述第一文字掩码为所述异常掩码,则将所述目标图像进行颜色反转,得到颜色反转后的目标图像;
29、第二获得单元,用于基于所述颜色反转后的目标图像,获得第二文字掩码。
30、可选的,所述目标图像是初始图像,或,高斯文字增强后的初始图像。
31、一种文字掩码的生成设备,包括存储器和处理器;
32、所述存储器,用于存储程序;
33、所述处理器,用于执行所述程序,实现上述任一项所述的文字掩码的生成方法的各个步骤。
34、一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现上述任一项所述的文字掩码的生成方法的各个步骤。
35、基于上述技术方案,本发明提供的文字掩码的生成方法及相关设备,首先获取目标图像,该目标图像中包括文本框区域,基于文本框区域,获得第一文字掩码,判断第一文字掩码是否为异常掩码,如果第一文字掩码为异常掩码,可以对目标图像进行颜色反转,颜色反转后的目标图像中影响文字掩码的特征会发生变化,可以使得之前影响文字掩码的特征不复存在,通过颜色反转后的目标图像获得第二文字掩码,可以有效提高获得有效文字掩码的成功率。
1.一种文字掩码的生成方法,其特征在于,包括:
2.根据权利要求1所述的文字掩码的生成方法,其特征在于,所述目标图像是初始图像,或,高斯文字增强后的初始图像。
3.根据权利要求1所述的文字掩码的生成方法,其特征在于,所述基于所述文本框区域,获得第一文字掩码,包括:
4.根据权利要求3所述的文字掩码的生成方法,其特征在于,所述判断所述第一文字掩码是否为异常掩码,包括:
5.根据权利要求3所述的文字掩码的生成方法,其特征在于,所述对所述文本框区域进行基于自适应阈值的二值化处理,得到二值化处理后的文本框区域,包括:
6.根据权利要求3所述的文字掩码的生成方法,其特征在于,所述二值化处理后的文本框区域包括多个非零元素,每个所述非零元素对应至少一个像素值;
7.一种文字掩码的生成装置,其特征在于,包括:
8.根据权利要求7所述的文字掩码的生成装置,其特征在于,所述目标图像是初始图像,或,高斯文字增强后的初始图像。
9.一种文字掩码的生成设备,其特征在于,包括存储器和处理器;
10.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1至6中任一项所述的文字掩码的生成方法的各个步骤。