一种在同构数据源中保护敏感信息的方法

文档序号:6630699阅读:177来源:国知局
一种在同构数据源中保护敏感信息的方法
【专利摘要】一种在同构数据源中保护敏感信息的方法,它涉及信息工程安全【技术领域】。它的方法为:首先将欲保护数据表示成数据正交矩阵D,数据正交矩阵中的每一行代表一条记录,每一列代表一个属性;然后通过身份验证之后,将一个随机矩阵H绑定身份验证,然后将数据正交矩阵D与随机矩阵H的乘积N作为获取同构数据源中保护敏感信息的密钥。它保持向量间距离的特性使得挖掘结果能够达到较低的误差水平,不同于一般的正交变换保护方法,随机矩阵的变换过程使得合谋者无法获得其他参与者的原始数据;另外,客户数据传输过程以及最终数据的整合算法,也使得保护方法能够适用于拥有大规模参与者的实际场景。
【专利说明】一种在同构数据源中保护敏感信息的方法

【技术领域】
:
[0001]本发明涉及信息工程安全【技术领域】,具体涉及一种在同构数据源中保护敏感信息的方法。

【背景技术】
:
[0002]知识发现过程的海量数据需求对隐私信息带来了巨大的威胁,面对当前个人数据不断被滥用的趋势,人们对自身信息安全性的担忧日趋加重。为此,人们提出了许多保护隐私的技术和方法,这些方法旨在对敏感信息提供保护的同时,使得数据挖掘过程也能得到有效的结果。


【发明内容】

:
[0003]本发明的目的是提供一种在同构数据源中保护敏感信息的方法,它保持向量间距离的特性使得挖掘结果能够达到较低的误差水平,不同于一般的正交变换保护方法,随机矩阵的变换过程使得合谋者无法获得其他参与者的原始数据;另外,客户数据传输过程以及最终数据的整合算法,也使得保护方法能够适用于拥有大规模参与者的实际场景。
[0004]为了解决【背景技术】所存在的问题,本发明是采用以下技术方案:它的方法为:首先将欲保护数据表示成数据正交矩阵D,数据正交矩阵中的每一行代表一条记录,每一列代表一个属性;然后通过身份验证之后,将一个随机矩阵H绑定身份验证,然后将数据正交矩阵D与随机矩阵H的乘积N作为获取同构数据源中保护敏感信息的密钥。
[0005]本发明工作原理:多个拥有同构数据源的参与者,准备将各自的数据发送到数据仓库中以供分析。为了保护各自的原始数据,每个数据拥有者并不会直接发送自己的数据,而是通过一定的转换过程,再将数据传送到数据仓库中。同时,这一转换方案不仅要使得挖掘者难以得到敏感的原始数据,同时也要使得他们能够获得原始数据中的知识。在众多隐私保护方法中,噪声干扰技术也能应用在以上场景中。但是不同参与者的不同参数选择将使得数据难以整合。而在基于多方安全计算的方法中,随着数据量的增多,方法的效率将会大大降低。在匿名化模型中,则需要牺牲较多的数据细节来保护隐私。近来出现了使用类似正交变换的技术来保护数据的方法。但是大部分方法都只针对单一的数据源,也没有考虑到存在合谋获取隐私的情形。
[0006]本发明具有以下有益效果:它保持向量间距离的特性使得挖掘结果能够达到较低的误差水平,不同于一般的正交变换保护方法,随机矩阵的变换过程使得合谋者无法获得其他参与者的原始数据;另外,客户数据传输过程以及最终数据的整合算法,也使得保护方法能够适用于拥有大规模参与者的实际场景。

【具体实施方式】
:
[0007]本【具体实施方式】采用以下技术方案:它的方法为:首先将欲保护数据表示成数据正交矩阵D,数据正交矩阵中的每一行代表一条记录,每一列代表一个属性;然后通过身份验证之后,将一个随机矩阵H绑定身份验证,然后将数据正交矩阵D与随机矩阵H的乘积N作为获取同构数据源中保护敏感信息的密钥。
[0008]本【具体实施方式】工作原理:多个拥有同构数据源的参与者,准备将各自的数据发送到数据仓库中以供分析。为了保护各自的原始数据,每个数据拥有者并不会直接发送自己的数据,而是通过一定的转换过程,再将数据传送到数据仓库中。同时,这一转换方案不仅要使得挖掘者难以得到敏感的原始数据,同时也要使得他们能够获得原始数据中的知识。在众多隐私保护方法中,噪声干扰技术也能应用在以上场景中。但是不同参与者的不同参数选择将使得数据难以整合。而在基于多方安全计算的方法中,随着数据量的增多,方法的效率将会大大降低。在匿名化模型中,则需要牺牲较多的数据细节来保护隐私。近来出现了使用类似正交变换的技术来保护数据的方法。但是大部分方法都只针对单一的数据源,也没有考虑到存在合谋获取隐私的情形。
[0009]本【具体实施方式】具有以下有益效果:它保持向量间距离的特性使得挖掘结果能够达到较低的误差水平,不同于一般的正交变换保护方法,随机矩阵的变换过程使得合谋者无法获得其他参与者的原始数据;另外,客户数据传输过程以及最终数据的整合算法,也使得保护方法能够适用于拥有大规模参与者的实际场景。
【权利要求】
1.一种在同构数据源中保护敏感信息的方法,其特征在于它的方法为:首先将欲保护数据表示成数据正交矩阵D,数据正交矩阵中的每一行代表一条记录,每一列代表一个属性;然后通过身份验证之后,将一个随机矩阵H绑定身份验证,然后将数据正交矩阵D与随机矩阵H的乘积N作为获取同构数据源中保护敏感信息的密钥。
【文档编号】G06F21/62GK104361292SQ201410552761
【公开日】2015年2月18日 申请日期:2014年10月16日 优先权日:2014年10月16日
【发明者】傅涛, 傅德胜, 经正俊, 孙文静 申请人:盐城华大网安科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1