数据隐私处理方法和装置、电子设备、存储介质与流程

文档序号:30270021发布日期:2022-06-02 07:50阅读:80来源:国知局
数据隐私处理方法和装置、电子设备、存储介质与流程

1.本技术涉及人工智能技术领域,尤其涉及一种数据隐私处理方法和装置、电子设备、存储介质。


背景技术:

2.隐私保护是人工智能领域的重要话题,个人隐私的泄露会使人陷入不可预知的风险。近几年,国家相继出台法律法规,保护数据安全和个人隐私。人工智能需要使用标注的图片训练图像识别模型。在文本图像的识别中,图像是经前序检测算法框选出的字段,这些字段内容可能包括个人姓名、身份证号、家庭住址、电话号码、银行账号等敏感信息,这些敏感信息在图像的标注过程中容易泄露。因此,在图像标注时,也需要对图片进行隐私化处理。
3.相关技术中,将未经脱敏的图片通过电脑、u盘、移动硬盘、邮件、手机客户端等方式分发给标注人员,标注人员可以直接看到图片上的所有信息,这为个人隐私的泄露带来了风险。因此,如何保证在图片标注时也能够保护隐私信息成为本领域亟需解决的技术问题。


技术实现要素:

4.本技术实施例的主要目的在于提出一种数据隐私处理方法和装置、电子设备、存储介质,能够实现隐私信息的保护。
5.为实现上述目的,本技术实施例的第一方面提出了一种数据隐私处理方法,所述方法包括:
6.获取待处理的原始图片集;其中,所述原始图片集包括至少一个原始图片,每一所述原始图片包括原始字段;
7.对每一所述原始图片进行切分处理,得到至少三个分段图片;
8.根据所述分段图片的尺寸对所述分段图片进行延伸处理,以得到延伸图片;
9.对所述延伸图片标记顺序标识符;
10.根据预设的目标标记符和预设的目标标识符,对标记处理后的所述延伸图片中的所述原始字段进行隐私化处理,得到目标图片;
11.根据所述顺序标识符和所述目标标记符对所述目标图片进行拼接处理,得到脱敏图片。
12.在一些实施例,所述根据预设的目标标记符和预设的目标标识符,对标记处理后的所述延伸图片中的所述原始字段进行隐私化处理,得到目标图片,包括:
13.以所述目标标识符对所述延伸图片中的所述原始字段进行标识处理,得到标识图片;
14.根据所述目标标记符对所述标识图片进行标记处理,得到所述目标图片。
15.在一些实施例中,所述原始字段包括至少三个原始字符;
16.所述根据所述目标标记符对所述标识图片进行标记处理,得到所述目标图片,包括:
17.获取每一所述延伸图片的第一个原始字符的位置,得到起始位置;
18.获取每一所述延伸图片的最后一个原始字符的位置,得到结束位置;
19.根据所述起始位置和结束位置,以所述目标标记符对所述标识图片添加处理,得到所述目标图片。
20.在一些实施例,所述目标标记符包括第一标记符和第二标记符;
21.所述根据所述起始位置、结束位置和所述标记规则,以所述目标标记符对所述标识图片添加处理,得到所述目标图片,包括:
22.若所述起始位置处于预设位置,则在对应的所述原始字符前添加所述第一标记符,得到所述目标图片;其中,所述预设位置用于表征所述分段图片的切分处;
23.若所述起始位置不处于所述预设位置,则在对应的所述原始字符前添加所述第二标记符,得到所述目标图片;
24.若所述结束位置处于所述预设位置,则在对应的所述原始字符后添加所述第一标记符,得到所述目标图片;
25.若所述结束位置不处于所述预设位置,则在对应的所述原始字符后添加所述第二标记符,得到所述目标图片。
26.在一些实施例,所述目标标记符包括第一标记符和第二标记符;
27.所述根据所述顺序标识符和所述目标标记符对所述目标图片进行拼接处理,得到脱敏图片,包括:
28.获取当前的顺序标识符,得到第一标识符;
29.获取所述第一标识符对应的目标图片右侧的目标标记符,得到当前标记符;
30.获取所述第一标识符的下一顺序的顺序标识符,得到第二标识符;
31.获取所述第二标识符对应的目标图片左侧的目标标记符,得到顺序标记符;
32.若所述当前标记符为所述第二标记符,且所述顺序标记符为所述第二标记符,则删除所述第二标记符,并将所述目标图片进行拼接处理,得到所述脱敏图片;
33.若所述标记符为所述第一标记符,或者所述顺序标记符为第一标记符,则获取所述第一标识符对应的的所述目标图片的右侧第二个原始字符,获取所述第二标识符对应的所述目标图片的左侧第二个原始字符,并根据所述右侧第二个原始字符和所述左侧第二个原始字符,对所述目标图片进行拼接处理,得到所述脱敏图片。
34.在一些实施例,所述根据所述右侧第二个原始字符和所述左侧第二个原始字符,对所述目标图片进行拼接处理,包括:
35.若所述右侧第二个原始字符和所述左侧第二个原始字符一致,则删除所述第一标记符,且删除所述第二个原始字符或所述左侧第二个原始字符,并将所述目标图片进行拼接处理,得到所述脱敏图片;
36.若所述右侧第二个原始字符和所述左侧第二个原始字符不一致,则删除所述第一标记符,并将所述目标图片进行拼接处理,得到所述脱敏图片。
37.在一些实施例,在所述根据预设的目标标记符和预设的目标标识符,对标记处理后的所述延伸图片中的所述原始字段进行隐私化处理,得到目标图片之前,所述方法还包
括:
38.对所述延伸图片进行阴影化处理,得到阴影化后的延伸图片。
39.为实现上述目的,本技术实施例的第二方面提出了一种数据隐私处理装置,所述装置包括:
40.获取模块,用于获取待处理的原始图片集;其中,所述原始图片集包括至少一个原始图片,每一所述原始图片包括原始字段;
41.切分模块,用于对每一所述原始图片进行切分处理,得到至少三个分段图片;
42.延伸模块,用于根据所述分段图片的尺寸对所述分段图片进行延伸处理,以得到延伸图片;
43.顺序标记模块,用于对所述延伸图片标记顺序标识符;
44.隐私化模块,用于根据预设的目标标记符和预设的目标标识符,对标记处理后的所述延伸图片中的所述原始字段进行隐私化处理,得到目标图片;
45.拼接模块,用于根据所述顺序标识符和所述目标标记符对所述目标图片进行拼接处理,得到脱敏图片。
46.为实现上述目的,本技术实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述程序被所述处理器执行时实现上述第一方面所述的方法。
47.为实现上述目的,本技术实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述第一方面所述的方法。
48.本技术提出的数据隐私处理方法和装置、电子设备、存储介质,其通过对原始图片进行切分处理,得到至少三个分段图片,然后根据每个分段图片的尺寸对分段图片进行延伸处理,得到延伸图片,再对每个延伸图片标记顺序标识符,然后根据预设的目标标记符和预设的目标标识符,对标记处理后的延伸图片中的原始字段进行隐私化处理,得到目标图片,最后再根据顺序标识符和目标标记符对目标图片进行拼接处理,得到脱敏图片,本技术实施例的数据隐私处理方法,实现了个人隐私信息的保护,也阻止了漏标字符的可能。
附图说明
49.图1是本技术实施例提供的数据隐私处理方法的流程图;
50.图2是本技术实施例提供的原始图片切分和分段图片延伸的示意图;
51.图3是图1中的步骤s500的具体方法的流程图;
52.图4是图2中的步骤s520的具体方法的流程图;
53.图5是图3中的步骤s523的具体方法的流程图;
54.图6是图1中的步骤s600的具体方法的流程图;
55.图7是图5中的步骤s660的具体方法的流程图;
56.图8是本技术实施例提供的数据隐私处理装置的结构示意图;
57.图9是本技术实施例提供的电子设备的硬件结构示意图。
具体实施方式
58.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本技术,并不用于限定本技术。
59.需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
60.除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本技术实施例的目的,不是旨在限制本技术。
61.首先,对本技术中涉及的若干名词进行解析:
62.人工智能(artificial intelligence,ai):是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学;人工智能是计算机科学的一个分支,人工智能企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
63.医疗云(medical cloud):医疗云是指在云计算、移动技术、多媒体、4g通信、大数据、以及物联网等新技术基础上,结合医疗技术,使用“云计算”来创建医疗健康服务云平台,实现了医疗资源的共享和医疗范围的扩大。因为云计算技术的运用于结合,医疗云提高医疗机构的效率,方便居民就医。像现在医院的预约挂号、电子病历、医保等都是云计算与医疗领域结合的产物,医疗云还具有数据安全、信息共享、动态扩展、布局全局的优势。
64.隐私保护是人工智能领域的重要话题,个人隐私的泄露会使人陷入不可预知的风险。近几年,国家相继出台法律法规,保护数据安全和个人隐私。人工智能需要使用标注的图片训练图像识别模型。在文本图像的识别中,图像是经前序检测算法框选出的字段,这些字段内容可能包括个人姓名、身份证号、家庭住址、电话号码、银行账号等敏感信息,这些敏感信息在图像的标注过程中容易泄露。因此,在图像标注时,也需要对图片进行隐私化处理。
65.相关技术中,将未经脱敏的图片通过电脑、u盘、移动硬盘、邮件、手机客户端等方式分发给标注人员,标注人员可以直接看到图片上的所有信息,这为个人隐私的泄露带来了风险。因此,如何保证在图片标注时也能够保护隐私信息成为本领域亟需解决的技术问题。
66.基于此,本技术实施例提出了一种数据隐私处理方法和装置、电子设备、存储介质,能够在图片标注的同时,也能实现对隐私信息的保护。
67.本技术实施例提供的数据隐私处理方法和装置、电子设备、存储介质,具体通过如下实施例进行说明,首先描述本技术实施例中的数据隐私处理方法。
68.本技术实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工
智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
69.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
70.本技术实施例提供的数据隐私处理方法,涉及人工智能技术领域。本技术实施例提供的数据隐私处理方法可应用于终端中,也可应用于服务器端中,还可以是运行于终端或服务器端中的软件。在一些实施例中,终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等;服务器端可以配置成独立的物理服务器,也可以配置成多个物理服务器构成的服务器集群或者分布式系统,还可以配置成提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn以及大数据和人工智能平台等基础云计算服务的云服务器;软件可以是实现数据隐私处理方法的应用等,但并不局限于以上形式。
71.本技术可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本技术可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本技术,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
72.下面结合附图对本技术实施例的技术方案作进一步阐述。
73.图1是本技术实施例提供的数据隐私处理方法的一个可选的流程图,图1中的方法可以包括步骤s100、步骤s200、步骤s300、步骤s400、步骤s500和步骤s600,应理解,本技术实施例的数据隐私处理方法包括但不限于步骤s100至步骤s600,下面结合图1对这六个步骤进行详细介绍。
74.步骤s100,获取待处理的原始图片集;其中,原始图片集包括至少一个原始图片,每一原始图片包括原始字段;
75.步骤s200,对每一原始图片进行切分处理,得到至少三个分段图片;
76.步骤s300,根据分段图片的尺寸对分段图片进行延伸处理,以得到延伸图片;
77.步骤s400,对延伸图片标记顺序标识符;
78.步骤s500,根据预设的目标标记符和预设的目标标识符,对标记处理后的延伸图片中的原始字段进行隐私化处理,得到目标图片;
79.步骤s600,根据顺序标识符和目标标记符对目标图片进行拼接处理,得到脱敏图片。
80.本技术提出的数据隐私处理方法,通过对原始图片进行切分处理,得到至少三个分段图片,然后根据每个分段图片的尺寸对分段图片进行延伸处理,得到延伸图片,再对每
个延伸图片标记顺序标识符,然后根据预设的目标标记符和预设的目标标识符,对标记处理后的延伸图片中的原始字段进行隐私化处理,得到目标图片,最后再根据顺序标识符和目标标记符对目标图片进行拼接处理,得到脱敏图片,本技术实施例的数据隐私处理方法,实现了个人隐私信息的保护,也阻止了漏标字符的可能。
81.在一些实施例的步骤s100中,原始图片可以是医疗诊断图片,或者是医疗领域的其他图片,也可以是银行的一些敏感图片,或者平时个人使用的图片等等,对于此,本技术不做具体限制。如果是医疗诊断图片或者医疗领域的其他图片,则原始图片集可以通过医疗云服务器获取。原始图片上设有原始字段,该原始字段可以包括身份证号、家庭地址、手机号码、个人姓名、银行账号等敏感字段。
82.请参照图2,在一些实施例的步骤s200中,假设原始图片的宽度是w,高度是h,可以采取以下方式对原始图片进行切分处理:
83.在原始图片的宽度方向上,将原始图片进行三等分的切分,得到三个分段图片,用字母w表示宽度,用字母h表示高度,则每个分段图片的宽度是13w,高度是h。当然,也可以采取其他形式的切分方式,如四等分、六等分,或者仅仅切成三份、切成四份,不进行等分,而采取任意切分的方式等等,并且,切分的方向也不限制是宽度方向,高度方向也可以进行切分,对于此,本技术不做具体限制。
84.通过将原始图片进行切分处理,使得标注人员只能看到原始图片的原始字段的一部分内容,如果是三等分的切分方式,那么标注人员只能看到原始图片的原始字段的三分之一的内容。
85.在一些实施例的步骤s300中,根据分段图片的尺寸对分段图片进行延伸处理,以得到延伸图片。
86.例如,请参照图2,某分段图片的宽度是高度是h,则可以采取以下方式对该分段图片进行延伸处理:
87.在步骤s200的切分处,在分段图片的宽度方向上添加则这三个分段图片的每个分段图片的宽度依次是添加的部分为图2中的a部分、b部分、c部分和d部分。即图2中的a部分为切分时的第一段,a部分分段图片的宽度是高度是h,图2中b部分为切分时的第二段,b部分分段图片的宽度为高度是h,图2中c部分为切分时的第三段,c部分分段图片的宽度是高度是h。
88.需要说明的是,本技术中的延伸处理方式不限于此,也可以采取其他形式的延伸处理方式,在此不再一一赘述。
89.分段图片延伸处理得到延伸图片的具体方式可以为:
90.获取分段图片的尺寸,然后根据分段图片的尺寸在切分处增大分段图片,再对增加的部分进行填充,即可实现分段图片的延伸。
91.通过对切分开的分段图片进行延伸处理,能够保证不会因为步骤s200中的切分处
理,切分开原始字符,导致出现两个分段图片的切分处的原始字符都看不清,从而导致后续漏标原始字符的情况。这样设置,辅助切分处的原始字符的观察和标注。
92.在一些实施例的步骤s400中,对延伸处理后的分段图片,即延伸图片标记顺序标识符,以便于后续对延伸图片进行拼接。顺序标识符可以是顺序排列的数字。如,第一张延伸图片叫做“图片1”,第二张延伸图片叫做“图片2”,以此类推。顺序标识符也可以是字母等等,或者自定义的文件名等等。
93.需要说明的是,一个顺序标识符仅能使用一次。例如,第一个原始图片切分得到的第一个延伸图片标记为“图片1”,则后续顺序标识符“图片1”,也不能用于其他原始图片切分得到的延伸图片的标记。
94.请参照图3,在本技术的一些实施例中,步骤s500包括但不限于步骤s510和步骤s520,下面结合图3对这两个步骤进行详细说明。
95.步骤s510,以目标标识符对延伸图片中的原始字段进行标识处理,得到标识图片;
96.步骤s520,根据目标标记符对标识图片进行标记处理,得到目标图片。
97.具体地,在本实施例中,目标标识符为字符串,通过在原始字段上标注目标标识符,得到标识图片,从而实现对原始字段的覆盖,达到延伸图片隐私化的作用;然后,将隐私化处理后得到的标识图片,采取目标标记符进行标记处理,得到目标图片,以便于后续的拼接处理,阻止了拼接时多标原始字符的可能,便于判断分段字符两侧是否为同一个原始字符。
98.请参照图4,在本技术的一些实施例中,原始字段包括至少三个原始字符;步骤s520包括但不限于步骤s521、那种s522和步骤s523,下面结合图4,对这三个步骤进行详细介绍。
99.步骤s521,获取每一延伸图片的第一个原始字符的位置,得到起始位置;
100.步骤s522,获取每一延伸图片的最后一个原始字符的位置,得到结束位置;
101.步骤s523,根据起始位置和结束位置,以目标标记符对标识图片添加处理,得到目标图片。
102.具体地,在本实施例中,首先获取每个延伸图片中第一个原始字符的位置,得到起始位置,获取每个延伸图片中最后一个原始字符的位置,得到结束位置,再根据起始位置和结束位置,将目标标记符添加到标识图片中,得到目标图片,以便于后续根据目标标记符和顺序标识符对目标图片进行拼接处理。
103.请参照图5,在本技术的一些实施例中,目标标记符包括第一标记符和第二标记符;步骤s523包括步骤s5231、步骤s5232、步骤s5233和步骤s5234,应理解,本技术实施例的步骤s523包括但不限于步骤s5231至步骤s5234,下面结合图5对这四个步骤进行详细描述。
104.步骤s5231,若起始位置处于预设位置,则在对应的原始字符前添加第一标记符,得到目标图片;其中,预设位置用于表征分段图片的切分处;
105.步骤s5232,若起始位置不处于预设位置,则在对应的原始字符前添加第二标记符,得到目标图片;
106.步骤s5233,若结束位置处于预设位置,则在对应的原始字符后添加第一标记符,得到目标图片;
107.步骤s5234,若结束位置不处于预设位置,则在对应的原始字符后添加第二标记
符,得到目标图片。
108.具体地,在本实施中,预设位置用于表征分段图片的切分处,对于处于中间位置的分段图片,具有两个预设位置,对于处于边缘的分段图片,只具有一个预设位置。如果起始位置处于预设位置,则说明存在原始字符横跨不同分段图片的情况,即在步骤s200切分时,存在原始字符被切分的情况。在这种情况下,该原始字符又处于分段图片的起始位置,因此,在该原始字符的前面添加第一标记符,得到目标图片。
109.如果起始位置不处于预设位置,则说明不存在原始字符横跨不同分段图片的情况,即在步骤s200切分时,该分段图片的起始位置对应的原始字符没有被切分。在这种情况下,在该原始字符的前面添加第二标记符,得到目标图片。
110.如果结束位置处于预设位置,则说明存在原始字符横跨不同分段图片的情况,即在步骤s200切分时,存在原始字符被切分的情况。在这种情况下,该原始字符又处于分段图片的结束位置,因此,在该原始字符后面添加第一标记符,得到目标图片。
111.如果结束位置不处于预设位置,则说明不存在原始字符横跨不同分段图片的情况,即在步骤s200切分时,该分段图片的起始位置对应的原始字符没有被切分。在这种情况下,在该原始字符的后面添加第二标记符,得到目标图片。
112.通过在分段图片的起始位置之前或者结束位置之后添加目标标记符,便于后续对目标图片的拼接,能够保证不出现拼接错误。
113.请参照图6,在本技术的一些实施例中,目标标记符包括第一标记符和第二标记符,步骤s600包括步骤s610、步骤s620、步骤s630、步骤s640、步骤s650和步骤s660。应理解,本技术实施例的步骤s600包括但不限于步骤s610至步骤s660,下面结合图6对这六个步骤进行详细介绍。
114.步骤s610,获取当前的顺序标识符,得到第一标识符;
115.步骤s620,获取第一标识符对应的目标图片右侧的目标标记符,得到当前标记符;
116.步骤s630,获取第一标识符的下一顺序的顺序标识符,得到第二标识符;
117.步骤s640,获取第二标识符对应的目标图片左侧的目标标记符,得到顺序标记符;
118.步骤s650,若当前标记符为第二标记符,且顺序标记符为第二标记符,则删除第二标记符,并将目标图片进行拼接处理,得到脱敏图片;
119.步骤s660,若当前标记符为第一标记符,或者顺序标记符为第一标记符,则获取第一标识符对应的的目标图片的右侧第二个原始字符,获取第二标识符对应的目标图片的左侧第二个原始字符,并根据右侧第二个原始字符和左侧第二个原始字符,对目标图片进行拼接处理,得到脱敏图片。
120.具体地,在本实施例中,获取当前目标图片的顺序标识符,并将该顺序标识符记为第一标识符,然后,获取第一标识符对应的目标图片右侧的目标标记符,并将该目标标记符记为当前标记符,获取第一标识符的下一顺序的顺序标识符,并将该顺序标识符记为第二标识符,获取第二标识符对应的目标图片的左侧的目标标记符,并将该目标标记符记为顺序标记符。
121.例如,当前目标图片的顺序标识符为“图片1”,即第一标识符为“图片1”,则第二标识符为“图片2”,则获取“图片1”右侧的目标标记符,记为当前标记符,获取“图片2”左侧的目标标记符,记为顺序标记符。
122.如果当前标记符为第二标记符,且顺序标记符为第二标记符,则说明当前标记符对应的目标图片和顺序标记符对应的目标图片,在原始图片中是连接在一起的,因此,在这种情况下,只需要将当前标记符和顺序标记符删除,并将两个目标图片拼接在一起,即可得到脱敏图片。
123.如果当前标记符为第一标记符,或者顺序标记符为第一标记符,这种情况只能判断在切分时有原始字符被切分开了,此时,需要获取第一标识符对应的目标图片的右侧第二个原始字符,获取第二标识符对应的目标图片的左侧第二个原始字符,再根据右侧第二个原始字符和左侧第二个原始字符,对目标图片进行拼接处理,得到脱敏图片。
124.例如,以第一标记符为字母“a”,第二标记符为字母“b”,第一标识符为“图片1”,第二标识符为“图片2”为例进行详细说明。如果当前标记符和顺序标记符都为字母“b”,则说明“图片1”和“图片2”在原始图片中是连接在一起的,因此,在这种情况下,只需要将当前标记符和顺序标记符删除,并将两个目标图片拼接在一起,即可得到脱敏图片。
125.如果当前标记符和顺序标记符有一个是字母“a”,则这种情况只能判断在切分时有原始字符被切分开了,此时,获取“图片1”的右侧第二个原始字符,获取“图片2”的左侧第二个原始字符,再根据右侧第二个原始字符和左侧第二个原始字符,对目标图片进行拼接处理,得到脱敏图片。
126.请参照图7,在本技术的一些实施例中,步骤s660包括但不限于步骤s661和步骤s662,下面结合图7,对这两个步骤进行详细介绍。
127.步骤s661,若右侧第二个原始字符和左侧第二个原始字符一致,则删除第一标记符,且删除第二个原始字符或左侧第二个原始字符,并将目标图片进行拼接处理,得到脱敏图片;
128.步骤s662,若右侧第二个原始字符和左侧第二个原始字符不一致,则删除第一标记符,并将目标图片进行拼接处理,得到脱敏图片。
129.具体地,在本实施中,如果右侧第二个原始字符和左侧第二个原始字符一直,则将当前标记符和顺序标记符都删除,然后,删除第二个原始字符或左侧第二个原始字符,再将目标图片进行拼接处理,得到脱敏图片;如果右侧第二个原始字符和左侧第二个原始字符不一致,则只要删除当前标记符和顺序标记符,再将目标图片拼接在一起,即可得到脱敏图片。
130.在本技术的一些实施例中,在步骤s500之前,数据隐私处理方法还包括以下步骤:
131.对延伸图片进行阴影化处理,得到阴影化后的延伸图片。
132.具体地,在本实施例中,对延伸图片中的添加部分进行阴影化处理,即图2中的a部分、b部分、c部分和d部分进行阴影化处理,得到阴影化后的延伸图片,通过阴影化处理,使延伸图片中的a部分、b部分、c部分和d部分呈现出阴影效果。阴影化的具体处理方式可以为:
133.将延伸图片中的a部分、b部分、c部分和d部分的像素值降低,使其呈现出阴影效果。例如,将延伸图片中的a部分、b部分、c部分和d部分的像素值除以2,实现对延伸图片中的a部分、b部分、c部分和d部分的阴影化处理,得到阴影化后的延伸图片。
134.通过对延伸图片中的a部分、b部分、c部分和d部分进行阴影化处理,使延伸图片整体呈现出正常亮度和阴影两个部分,以便于后续对延伸图片的标记处理。
135.对延伸图片阴影化处理后,对得到的阴影化后的延伸图片,可以进行乱序处理,得到乱序后的延伸图片,以打乱延伸图片之间的顺序,以降低同一标注人员标注同一原始图片的概率,从而增强对隐私信息的保护力度。
136.需要说明的是,在本技术实施例中,第一标记符和第二标记符仅仅是一种标记符号,并没有其他意义,如第一标记符采取“1”,第二标记符采取“0”,或者采取其他形式。
137.对应的,对延伸图片的隐私化处理和拼接处理,即步骤s500和步骤s600为:
138.目标标识符为字符串,目标标记符包括第一标记符和第二标记符,第一标记符采取数字“1”,第二标记符采取数字“0”。将目标标识符标注在原始字段上,然后将数字“1”或者数字“0”标注在延伸图片上,得到目标图片。具体的标注方法为:
139.若没有原始字符横跨正常亮度和阴影部分,则用目标标识符标注正常亮度部分的原始字符,并且在阴影部分对应的位置,即目标标识符后面或者前面加上数字“0”,对于完全落在阴影部分的原始字符,则不使用目标标识符标注。
140.若有原始字符横跨正常亮度和阴影部分,则用目标标识符标注正常亮度部分的原始字符和该横跨正常亮度和阴影部分的原始字符,并在阴影部分对应的位置,即目标标识符后面或者前面加一个数字“1”,对于完全落在阴影部分的原始字符,则不使用目标标识符标注。
141.对应的,具体拼接方法为:
142.以将原始图片三等分切分为例进行详细说明,其他情况类似,不再一一赘述。顺序标识符分别为:“图片1”、“图片2”和“图片3”。
143.首先获取当前目标图片的顺序标识符,如当前顺序标识符为“图片1”,则找到顺序标识符为“图片2”的目标图片,并获取“图片1”右侧的目标标记符,记为当前标记符,获取“图片2”左侧的目标标记符,记为顺序标记符。
144.如果当前标记符和顺序标记符都为数字“0”,则去除掉当前标记符和顺序标记符,简单的将两个目标图片拼接起来;如果当前标记符和顺序标记符至少有一个是数字“1”,则获取“图片1”右侧第二个原始字符和“图片2”左侧的第二个原始字符,如果“图片1”右侧第二个原始字符和“图片2”左侧的第二个原始字符相同,则拼接时保留一个,否则,简单的将当前标记符和顺序标记符去掉,并将两个目标图片拼接起来,即可得到脱敏图片。
145.请参照图8,本技术的一些实施例还提出了一种数据隐私处理装置,该数据隐私处理装置包括获取模块700、切分模块800、延伸模块900、顺序标记模块1000、隐私化模块1100和拼接模块1200。
146.获取模块700,用于获取待处理的原始图片集;其中,原始图片集包括至少一个原始图片,每一原始图片包括原始字段。
147.切分模块800,用于对每一原始图片进行切分处理,得到至少三个分段图片。
148.延伸模块900,用于根据分段图片的尺寸对分段图片进行延伸处理,以得到延伸图片。
149.顺序标记模块1000,用于对延伸图片标记顺序标识符。
150.隐私化模块1100,用于根据预设的目标标记符和预设的目标标识符,对标记处理后的延伸图片中的原始字段进行隐私化处理,得到目标图片。
151.拼接模块1200,用于根据顺序标识符和目标标记符对目标图片进行拼接处理,得
到脱敏图片。
152.本技术实施例的数据隐私处理装置,通过对原始图片进行切分处理,得到至少三个分段图片,然后根据每个分段图片的尺寸对分段图片进行延伸处理,得到延伸图片,再对每个延伸图片标记顺序标识符,然后根据预设的目标标记符和预设的目标标识符,对标记处理后的延伸图片中的原始字段进行隐私化处理,得到目标图片,最后再根据顺序标识符和目标标记符对目标图片进行拼接处理,得到脱敏图片,本技术实施例的数据隐私处理方法,实现了个人隐私信息的保护,也阻止了漏标字符的可能。
153.需要说明的是,本技术实施例的数据隐私处理装置与前述的数据隐私处理方法相对应,具体的处理流程或者处理方式请参照前述的数据隐私处理方法,在此不再赘述。
154.本技术实施例还提供了一种电子设备,电子设备包括:存储器、处理器、存储在存储器上并可在处理器上运行的程序以及用于实现处理器和存储器之间的连接通信的数据总线,程序被处理器执行时实现上述数据隐私处理方法。该电子设备可以为包括平板电脑、车载电脑等任意智能终端。
155.本技术实施例的电子设备,通过执行上述的数据隐私处理方法,通过对原始图片进行切分处理,得到至少三个分段图片,然后根据每个分段图片的尺寸对分段图片进行延伸处理,得到延伸图片,再对每个延伸图片标记顺序标识符,然后根据预设的目标标记符和预设的目标标识符,对标记处理后的延伸图片中的原始字段进行隐私化处理,得到目标图片,最后再根据顺序标识符和目标标记符对目标图片进行拼接处理,得到脱敏图片,本技术实施例的数据隐私处理方法,实现了个人隐私信息的保护,也阻止了漏标字符的可能。
156.请参阅图9,图9示意了另一实施例的电子设备的硬件结构,电子设备包括:
157.处理器1300,可以采用通用的cpu(centralprocessingunit,中央处理器)、微处理器、应用专用集成电路(applicationspecificintegratedcircuit,asic)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本技术实施例所提供的技术方案;
158.存储器1400,可以采用只读存储器(readonlymemory,rom)、静态存储设备、动态存储设备或者随机存取存储器(randomaccessmemory,ram)等形式实现。存储器1400可以存储操作系统和其他应用程序,在通过软件或者固件来实现本说明书实施例所提供的技术方案时,相关的程序代码保存在存储器1400中,并由处理器1300来调用执行本技术实施例的数据隐私处理方法;
159.输入/输出接口1500,用于实现信息输入及输出;
160.通信接口1600,用于实现本设备与其他设备的通信交互,可以通过有线方式(例如usb、网线等)实现通信,也可以通过无线方式(例如移动网络、wifi、蓝牙等)实现通信;
161.总线1700,在设备的各个组件(例如处理器1300、存储器1400、输入/输出接口1500和通信接口1600)之间传输信息;
162.其中处理器1300、存储器1400、输入/输出接口1500和通信接口1600通过总线1700实现彼此之间在设备内部的通信连接。
163.本技术实施例还提供了一种存储介质,存储介质为计算机可读存储介质,用于计算机可读存储,存储介质存储有一个或者多个程序,一个或者多个程序可被一个或者多个处理器执行,以实现上述数据隐私处理方法。
164.本技术实施例的存储介质,通过执行上述的数据隐私处理方法,通过对原始图片
进行切分处理,得到至少三个分段图片,然后根据每个分段图片的尺寸对分段图片进行延伸处理,得到延伸图片,再对每个延伸图片标记顺序标识符,然后根据预设的目标标记符和预设的目标标识符,对标记处理后的延伸图片中的原始字段进行隐私化处理,得到目标图片,最后再根据顺序标识符和目标标记符对目标图片进行拼接处理,得到脱敏图片,本技术实施例的数据隐私处理方法,实现了个人隐私信息的保护,也阻止了漏标字符的可能。
165.存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
166.本技术实施例描述的实施例是为了更加清楚的说明本技术实施例的技术方案,并不构成对于本技术实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本技术实施例提供的技术方案对于类似的技术问题,同样适用。
167.本领域技术人员可以理解的是,图1-7中示出的技术方案并不构成对本技术实施例的限定,可以包括比图示更多或更少的步骤,或者组合某些步骤,或者不同的步骤。
168.以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
169.本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。
170.本技术的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
171.应当理解,在本技术中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“a和/或b”可以表示:只存在a,只存在b以及同时存在a和b三种情况,其中a,b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
172.在本技术所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的
相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
173.上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
174.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
175.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括多指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例的方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,简称rom)、随机存取存储器(random access memory,简称ram)、磁碟或者光盘等各种可以存储程序的介质。
176.以上参照附图说明了本技术实施例的优选实施例,并非因此局限本技术实施例的权利范围。本领域技术人员不脱离本技术实施例的范围和实质内所作的任何修改、等同替换和改进,均应在本技术实施例的权利范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1