基于云数据安全的信息去标识化处理方法及系统与流程

文档序号:36809703发布日期:2024-01-23 12:41阅读:47来源:国知局
基于云数据安全的信息去标识化处理方法及系统与流程

本发明涉及信息去标识化,尤其涉及一种基于云数据安全的信息去标识化处理方法及系统。


背景技术:

1、云数据涉及基于云计算商业模式应用的数据集成、数据分析、数据整合、数据分配、数据预警等技术与平台。随着云数据在云服务业务中的广泛应用,云数据安全受到越来越多的重视。云数据安全处理的其中一个关键技术是信息去标识化/信息匿名化处理。通过信息去标识化/信息匿名化处理,能够实现对隐私数据信息的保护,避免泄露。

2、中国专利公开号:cn116522401b,公开了一种基于云数据安全的信息去标识化处理方法及系统,包括,对存在文本生成延时的会话交互文本进行的隐私特征共性评分确定,并且在确定隐私特征共性评分时基于不同会话交互文本大数据的文本块敏感知识描述变量进行确定,由此可见,所述现有技术存在以下问题:由于未考虑到在完成对信息的去标识化处理后对输送单元输出的去标识信息进行截取,以根据截取的去标识信息对去标识处理单元针对信息的去标识化是否符合标准进行判定,进而根据判定结果对去标识处理单元的运行参数进行调节,影响了针对信息传输的安全性,进而影响了针对信息的去标识处理的稳定性,进而影响了针对信息的去标识化处理的效率。


技术实现思路

1、为此,本发明提供一种基于云数据安全的信息去标识化处理方法及系统,用以克服现有技术中由于未考虑到在完成对信息的去标识化处理后对输送单元输出的去标识信息进行截取,以根据截取的去标识信息对去标识处理单元针对信息的去标识化是否符合标准进行判定,进而根据判定结果对去标识处理单元的运行参数进行调节,影响了针对信息传输的安全性,进而影响了针对信息的去标识处理的稳定性,影响了针对信息的去标识化处理的效率的问题。

2、一方面,本发明提供一种基于云数据安全的信息去标识化处理方法,包括,

3、步骤s1,数据采集单元获取待去标识的信息,并将获取的信息输送至去标识处理单元,去标识处理单元对信息进行去标识化处理以生成去标识信息和用以重新识别去标识信息的额外信息;

4、步骤s2,所述去标识处理单元将所述去标识信息输送至输送单元,并将所述额外信息输送至存储单元;

5、步骤s3,所述输送单元将接收到的所述去标识信息输送至接收单元,攻击模拟单元在输送单元输送所述去标识信息过程中攻击输送单元和接收单元之间的通道以截取通道中的去标识信息,攻击模拟单元将截取到的去标识信息输送至比对单元;

6、步骤s4,所述攻击模拟单元对截取到的去标识信息进行重新识别处理,并将重新识别后的识别信息输送至比对单元,比对单元确定识别信息和所述信息的重合度;

7、步骤s5,分析单元基于所述比对单元求得的重合度判定所述去标识处理单元针对信息的去标识化处理是否符合预设标准;

8、步骤s6,所述分析单元在判定不符合预设标准时基于确定的原因将对应单元在针对下一信息去标识处理过程中的对应参数调节至对应值,使用调节后的参数重复所述步骤s1至所述步骤s5并基于重新获取的重合度重新判定所述去标识处理单元针对信息的去标识化处理是否符合预设标准;

9、步骤s7,重复所述步骤s1至所述步骤s6直至所述分析单元判定所述去标识处理单元针对信息的去标识化处理符合预设标准,此时,分析单元控制各单元以当前参数运行以完成对信息进行去标识处理。

10、进一步地,所述分析单元基于所述识别信息与所述信息的重合度确定所述去标识处理单元针对信息的去标识化是否符合标准的判定方式,其中,重合度为识别信息与信息中相同字符的数量与信息中字符总数的占比:

11、第一判定方式为所述分析单元判定所述去标识处理单元针对所述信息的去标识处理符合预设标准;所述第一判定方式满足所述重合度小于等于所述分析单元中设置的第一预设重合度;

12、第二判定方式为所述分析单元初步判定所述去标识处理单元针对所述信息的去标识处理符合预设标准,并基于重合的字符在信息中的分布情况对去标识处理单元针对所述信息的去标识处理是否符合预设标准进行二次判定;所述第二判定方式满足所述重合度大于所述第一预设重合度且小于等于所述分析单元中设置的第二预设重合度,第一预设重合度小于第二预设重合度;

13、第三判定方式为所述分析单元判定所述去标识处理单元针对所述信息的去标识处理不符合预设标准,并基于重合度与所述第二预设重合度的差值确定去标识处理不符合预设标准的原因;所述第三判定方式满足所述重合度大于所述第二预设重合度。

14、进一步地,所述分析单元在所述第二判定方式下确定所述信息与所述识别信息中重合的字符在信息中的位置,并依次确定相邻两重合字符之间相隔的字符数,分析单元计算字符数的平均值并根据平均值确定去标识处理单元针对所述信息的去标识处理是否符合预设标准的二次判定方式,其中:

15、第一二次判定方式为所述分析单元二次判定所述去标识处理单元针对所述信息的去标识处理符合预设标准;所述第一二次判定方式满足所述平均值大于所述分析单元中设置的预设平均值;

16、第二二次判定方式为所述分析单元二次判定所述去标识处理单元针对所述信息的去标识处理不符合预设标准,并基于所述预设平均值与平均值的差值确定所述去标识处理单元对信息的去标识处理不符合预设标准的原因;所述第二二次判定方式满足所述平均值小于等于所述预设平均值。

17、进一步地,所述分析单元在所述第二二次判定方式下将求得的所述预设平均值与所述平均值的差值记为平均值差值,并基于平均值差值确定所述去标识处理单元对信息的去标识处理不符合预设标准的二级原因判定方式,其中:

18、第一二级原因判定方式为所述分析单元判定所述去标识处理单元对信息的去标识处理不符合预设标准的原因为所述去标识处理单元针对信息中的去标识字符占比低于预设值,并基于所述重合度将所述去标识处理单元针对下一信息进行去标识处理过程中去标识的字符占比调节至对应值;所述第一二级原因判定方式满足所述平均值差值小于等于所述分析单元中设置的预设平均值差值;

19、第二二级原因判定方式为所述分析单元判定所述去标识处理单元对信息的去标识处理不符合预设标准的原因为所述信息的字符总数低于预设标准,分析单元基于所述信息的字符总数对所述预设平均值差值进行修正;所述去标识处理单元对信息的去标识处理不符合预设标准的原因所述第二二级原因判定方式满足所述平均值差值大于所述预设平均值差值。

20、进一步地,所述分析单元在所述第一二级原因判定方式下将所述重合度与所述第一预设重合度的差值记为一级重合度差值并根据一级重合度差值确定所述去标识处理单元针对下一所述信息去标识化过程中去标识字符与信息中总字符占比的占比调节方式,其中:

21、第一占比调节方式为所述分析单元使用第一预设占比调节系数将所述去标识字符与所述信息中总字符的占比调节至对应值;所述第一占比调节方式满足所述一级重合度差值小于等于所述分析单元中设置的第一预设一级重合度差值;

22、第二占比调节方式为所述分析单元使用第二预设占比调节系数将所述去标识字符与所述信息中总字符的占比调节至对应值,第二预设占比调节系数大于所述第一预设占比调节系数;所述第二占比调节方式满足所述一级重合度差值大于所述第一预设一级重合度差值且小于等于所述分析单元中设置的第二预设一级重合度差值,第一预设一级重合度差值小于第二预设一级重合度差值;

23、第三占比调节方式为所述分析单元使用第三预设占比调节系数将所述去标识字符与所述信息中总字符的占比调节至对应值,第三预设占比调节系数大于所述第二预设占比调节系数;所述第三占比调节方式满足所述一级重合度差值大于所述第二预设一级重合度差值。

24、进一步地,所述分析单元在所述第二二级原因判定方式下根据所述信息的字符总数确定针对所述预设平均值差值的修正方式,其中:

25、第一修正方式为所述分析单元使用第一预设修正系数将所述预设平均值差值修正至对应值;所述第一修正方式满足所述信息的字符总数小于等于所述分析单元中设置的第一预设字符总数;

26、第二修正方式为所述分析单元使用第二预设修正系数将所述预设平均值差值修正至对应值,第二预设修正系数小于所述第一预设修正系数;所述第二修正方式满足所述信息的字符总数大于所述第一预设字符总数且小于等于所述分析单元中设置的第二预设字符总数,第一预设字符总数小于第二预设字符总数;

27、第三修正方式为所述分析单元使用第三预设修正系数将所述预设平均值差值修正至对应值,第三预设修正系数小于所述第二预设修正系数;所述第三修正方式满足所述信息的字符总数大于所述第二预设字符总数。

28、进一步地,所述分析单元在所述第三判定方式下将所述重合度与所述第二预设重合度的差值记为二级重合度差值并根据二级重合度差值确定所述去标识处理单元针对所述信息的去标识处理不符合预设标准的一级原因判定方式,其中:

29、第一一级原因判定方式为所述分析单元判定所述去标识处理单元针对信息的去标识处理不符合预设标准的原因为所述去标识处理单元针对信息的去标识处理不符合预设标准的原因为所述攻击模拟单元完成对去标识信息的截取,分析单元控制所述去标识处理单元在针对下一信息进行去标识处理前对该信息进行匿名处理并在匿名处理后对处理后信息进行去标识处理;所述第一一级原因判定方式满足所述二级重合度差值小于等于所述分析单元中设置的预设二级重合度差值;

30、第二一级原因判定方式为所述分析单元判定所述攻击模拟单元对所述存储单元进行攻击并截取到了对应的额外信息,分析单元控制所述去标识处理单元在对下一信息进行去标识处理过程中对获取的额外信息进行加密处理;所述第二一级原因判定方式满足所述二级重合度差值大于所述预设二级重合度差值。

31、进一步地,所述分析单元在所述第一一级原因判定方式下基于所述信息的字符总数量确定针对该信息中匿名处理的字符数量与信息中字符总数的占比。

32、进一步地,所述分析单元在完成对所述额外信息的加密处理且在基于下一信息对所述去标识处理单元针对该信息的去标识处理不符合预设标准时,若不符合标准的原因仍为所述第二一级原因判定方式,则所述分析单元变更所述去标识处理单元与所述存储单元之间的数据通信协议。

33、另一方面,本发明还提供一种使用上述方法的基于云数据安全的信息去标识化处理系统,包括,

34、数据采集单元,其用以采集信息;

35、去标识处理单元,其与所述数据采集单元相连,用以对数据采集单元输出的信息进行去标识化处理;

36、存储单元,其与所述去标识处理单元相连,用以接收去标识针对单个所述信息进行去标识处理过程中产生的额外信息;

37、输送单元,其与所述去标识处理单元相连,用以输出去标识单元输出的去标识信息;

38、接收单元,其与所述输送单元相连,用以接收输送单元输出的去标识信息;

39、攻击模拟单元,其用以截取所述输送单元输出的去标识信息,并对截取的去标识信息进行重新识别;

40、比对单元,其分别与所述数据采集单元和所述攻击模拟单元相连,用以分别接收数据采集单元采集的信息和攻击模拟单元重新识别的识别信息,以及,确定信息与识别信息的重合度;

41、分析单元,其分别与所述比对单元和所述去标识处理单元相连,用以根据比对单元输出的重合度确定所述去标识处理单元针对信息的去标识化处理是否符合标准,以及,在去标识处理单元针对信息的去标识化处理不符合标准时根据确定的原因将所述去标识处理单元针对信息去标识化处理过程中的对应参数调节至对应值。

42、与现有技术相比,本发明的有益效果在于,攻击模拟单元对输送单元输出的去标识信息进行截取,以对截取的去标识信息进行重新识别,对完成去标识化处理的信息进行获取并根据获取的信息获得识别信息,以对完成去标识化处理的信息进行监测,及时在其不符合预设标准时采取对应的措施,以保证信息传输的安全性;在识别信息与信息的重合度较大时,确定重合的字符在信息中的分布情况,以进一步精准对去标识处理单元针对信息的去标识处理是否符合预设标准进行判定,并在普遍相隔较少字符数就出现重合字符时,判定传输的去标识信息极易被破解,故确定去标识处理单元对信息的去标识处理不符合预设标准的原因,以根据具体原因采取对应的措施,以保证信息传输的安全性;

43、进一步地,在平均值差值较小时,即平均值距预设标准差距较小,故判定因去标识处理单元对去标识的字符占比过低导致信息未能被充分保护,故将去标识处理单元针对下一信息进行去标识处理过程中去标识的字符占比进行调节,在提高了信息传输的安全性的同时,进一步针对性的根据信息的实际传输情况确定字符占比有效提高了针对信息的去标识化处理的效率。

44、进一步地,在平均差值过大时,即平均值距预设标准差距过大,在此情况下为信息的字符本身过小故完成去标识处理化的信息的字符数亦过小,故平均值过小,故判定去标识处理不符合预设标准的原因为信息的字符总数低于预设标准,根据信息的字符总数对预设平均值差值进行修正,根据信息的实际字符数确定分析单元的判定标准,在有效提高分析单元对去标识处理单元针对信息的去标识化是否符合标准的判定的准确度的同时,进一步有效提高了针对信息的去标识化处理的效率。

45、进一步地,在重合度过大时,根据二级重合度差值确定去标识处理单元针对信息的去标识处理不符合预设标准的原因,在二级重合度较大时判定因攻击模拟单元获取到了对应的额外信息并根据额外信息和去标识信息获取了重合度极高的识别信息,故对额外信息进行加密处理,以提高信息传输的安全性,进一步有效提高了针对信息的去标识化处理的效率。

46、进一步地,在二级重合度较小时,在此情况下重合度仍较大故判定仅通过去标识化处理难以完成对信息的保护,故对信息进行匿名处理并在匿名处理后对处理后信息进行去标识处理,以有效提高信息传输的安全性,进一步有效提高了针对信息的去标识化处理的效率。

47、进一步地,在去标识处理单元的运行过程中根据重合度对去标识处理单元针对信息的去标识化处理是否符合预设标准进行判定,以在判定信息的去标识处理不符合预设标准时,采取对应的措施以对去标识处理单元的运行参数进行调节,有效保证了针对信息的去标识处理的稳定性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1