一种大数据安全与隐私保护方法、装置及存储介质与流程

文档序号:16538403发布日期:2019-01-08 20:06阅读:159来源:国知局
一种大数据安全与隐私保护方法、装置及存储介质与流程

本发明属于信息安全技术领域,具体涉及一种大数据安全与隐私保护方法、装置及存储介质。



背景技术:

互联网、大数据技术的蓬勃发展给我们的工作和生活带来了不少便利的同时也对数据安全和隐私保护等问题提出了新的要求。我们在讨论大数据数据安全隐私保护的时候包括多种情况,比如为了学术研究和数据交流开放用户数据,学术机构或者个人可以向数据库发起查询请求,公司返回对应的数据时需要保证用户的隐私。还有的情况是公司作为服务提供商,为了提高服务质量,主动收集用户的数据,这些在客户端上收集的数据也需要保证数据安全与隐私性。

匿名化、加密、密码学等方法是解决数据隐私问题的传统机制,然而这些方法的实际应用范围还比较狭隘,通常集中于单一的小数据,是对隐私的被动保护,尚不能完全应对大数据的大规模性、高速性与多样性。



技术实现要素:

本发明提出了一种大数据安全与隐私保护方法、装置及存储介质,利用区块技术实现安全存储,并通过区块索引进行分级、加密、授权、签名、解密等方式对大数据的安全和隐私进行保护。

本发明实施例的第一方面,公开了一种大数据安全与隐私保护方法,具体提出了如下技术方案:s1、根据用户身份标识id和数据属性对用户隐私数据进行区块划分,建立数据属性与数据信息的键值对关系,并建立区块索引来标识各个区块所记录的数据属性;s2、根据隐私数据敏感度对各个区块所记录的数据属性进行安全分级;s3、通过对称加密算法分别对所述区块索引的数据属性及区块内数据信息加密存储;s4、当接收到访问者的数据检索请求,将请求中的数据属性对称加密并检索所述区块索引,根据请求中的用户身份标识id,获取对应区块内数据信息;s5、通过对称加密算法将所述对应区块内数据信息还原为明文,获取所述数据检索请求的公钥,通过非对称加密算法对所述明文再次加密,得到数据密文;s6、采用非对称加密算法对所述数据密文解密,得到数据明文的文本文件,返回给访问者。

可选的,在所述技术方案中,步骤s2中对各个区块所记录的数据属性进行安全分级之后还包括:安全级别数字大的区块拒绝被低授权的访问者访问;对高安全级别的数据属性,在复制后加入干扰,形成新的较低级别的数据属性,为必要的核对与确认提供依据。

可选的,在所述技术方案中,步骤s3中所述对称加密存储最终保存的数据结构为“区块索引编号”+sync_encode(“密钥”,“数据属性或数据信息”),其中sync_encode为对称加密算法,所述密钥为对称加密算法产生的密钥。

可选的,在所述技术方案中,所述步骤s4中接收到访问者的数据检索请求之前还包括:数据检索请求需先获取授权,得到授权访问表和区块索引;按非对称加密机制,为所述数据检索请求产生公钥和私钥,访问者获取私钥。

可选的,在所述技术方案中,所述步骤s4中获取对应区块内数据信息之后还包括:根据访问者所持私钥为数据检索请求产生签名并记录请求信息和检索结果。

可选的,在所述技术方案中,步骤s6中所述数据解密利用所述私钥和签名结合非对称加密算法得到,得到所述数据明文的文本文档之后,返回给访问者之前还包括:在所述文本文件中加入数字签名或水印。

本发明实施例第二方面,提供了一种大数据安全与隐私保护装置,具体包括以下内容:

区块索引模块:根据用户身份标识id和数据属性对用户隐私数据进行区块划分,建立数据属性与数据信息的键值对关系,并建立区块索引来标识各个区块所记录的数据属性;

安全分级模块:根据隐私数据敏感度对各个区块所记录的数据属性进行安全分级;

加密存储模块:通过对称加密算法分别对所述区块索引的数据属性及区块内数据信息加密存储;

区块检索模块:当接收到访问者的数据检索请求,将请求中的数据属性对称加密并检索所述区块索引,根据请求中的用户身份标识id,获取对应区块内数据信息;

再次加密模块:通过对称加密算法将所述对应区块内数据信息还原为明文,获取所述数据检索请求的公钥,通过非对称加密算法对所述明文再次加密,得到数据密文;

解密返回模块:采用非对称加密算法对所述数据密文解密,得到数据明文的文本文件,返回给访问者。

可选的,所述大数据安全与隐私保护装置中,所述安全分级模块还包括:

脱敏单元:安全级别数字大的区块拒绝被低授权的访问者访问;对高安全级别的数据属性,在复制后加入干扰,形成新的较低级别的数据属性,以便为必要的核对与确认提供依据。

可选的,所述大数据安全与隐私保护装置中,所述区块检索模块还包括:

授权单元:据检索请求需先获取授权,得到授权访问表和区块索引;

密钥单元:按非对称加密机制,为所述数据检索请求产生私钥和公钥,访问者者获取私钥;

签名单元:根据访问者所持有的私钥,为该数据检索请求生成签名,并记录数据请求信息和所获取的结果。

本发明实施例的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的所述方法的步骤。

本发明针对目前大数据平台既要求数据属性覆盖全面,但又要求涉及到的用户隐私不被滥用的矛盾,利用区块技术实现大数据安全存储,并通过区块索引进行分级、加密、授权、签名、解密等方式让使用人在监督的情况下获取和使用数据,从而对大数据的安全和隐私进行保护,防止有人通过撞库、拖库、刷库等技术手段非法获取隐私数据,同时实现对数据被使用的情况进行监管。

同时通过本技术,采用区块加密的存储方式,可防止数据维护人员可以直接查看数据库信息,安全分级可以对敏感数据进行识别和保护同时也提供了对某类数据降级使用的技术方案,在数据请求中通过非对称算法,实现非授权人员无法解密,同时也记录了该信息被谁获取,防止数据请求者抵赖获取请求,为数据泄密提供了追溯手段。本发明可从数据存储、数据访问、数据返回、使用监管、泄密追溯等方面全方位地保障数据安全。

附图说明

为了更清楚地说明本发明实中的技术方案,下面将对本发明技术描述中所需要使用的附图作简单地介绍。

图1为本发明实施例提供的大数据安全与隐私保护方法流程示意图;

图2为本发明实施例提供的大数据安全与隐私保护装置结构示意图;

具体实施方式

本发明提出了一种大数据安全与隐私保护方法、装置及存储介质,利用区块技术实现安全存储,并通过区块索引进行分级、加密、授权、签名等方式让使用人在由监督的情况下获取和使用数据,从而对大数据的安全和隐私进行保护,同时实现对数据被使用的情况进行监管。

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中,省略对众所周知的系统、装置、电路、以及方法的详细说明,以免不必要的细节妨碍本申请的描述。

应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。

下面对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

参见图1,本发明提出了一种大数据安全与隐私保护方法,具体包括如下步骤:

s1、根据用户身份标识id和数据属性对用户隐私数据进行区块划分,建立数据属性与数据信息的键值对关系,并建立区块索引来标识各个区块所记录的数据属性;

步骤s1中所述建立区块索引是对每个区块都进行编码,不同编码的区块对应某一个属性的数据,标识各个区块所记录该数据属性,区块内只保留单一的键值对(key-value)关系。例如区块001,只对应名称;区块002只对应手机号码,等等。

s2、根据隐私数据敏感度对各个区块所记录的数据属性进行安全分级;

可选的,步骤s2中所述安全分级之后还包括:安全级别数字大的区块拒绝被低授权的访问者访问;对高安全级别的数据属性,在复制后加入干扰,形成新的较低级别的数据属性,以便为必要的核对与确认提供依据。

例如,将各类数据属性分为0-9个安全级别,将区块002中的数据(对应手机号码,安全级别为8),全部都用****代替中间4位后,复制到区块003中。则可在区块索引中新增“区块003”并标识其为“4*脱敏手机号码”,同时可以将区块003的安全级别设置为降低为6。对部分高安全级别的数据属性,降低安全级别是为了将用户数据在无害的情况下可以展示出来,数据请求者可以根据较低的安全级别获取加入干扰的数据信息,为必要的核对与确认提供依据。

s3、通过对称加密算法分别对所述区块索引的数据属性及区块内数据信息加密存储;

可选的,步骤s3中所述对称加密存储最终保存的数据结构为“区块索引编号”+sync_encode(“密钥”,“数据属性或数据信息”),其中sync_encode为对称加密算法,所述密钥为对称加密算法产生的密钥;

s4、当接收到访问者的数据检索请求,将请求中的数据属性对称加密并检索所述区块索引,根据请求中的用户身份标识id,获取对应区块内数据信息;

可选的,所述步骤s4中,接收到访问者的数据检索请求之前还包括:数据检索请求需先获取授权,得到授权访问表和区块索引;按非对称加密机制,为所述数据检索请求产生公钥和私钥,访问者获取私钥。

可选的,所述步骤s4中,获取对应区块内数据信息之后还包括:根据访问者所持私钥为数据检索请求产生签名并记录请求信息和检索结果。

s5、通过对称加密算法将所述对应区块内数据信息还原为明文,获取所述数据检索请求的公钥,通过非对称加密算法对所述明文再次加密,得到数据密文;

例如,通过对称加密算法sync_decode将获取的检索结果信息还原为明文;根据所述签名获取公钥,通过非对称加密算法asym_encode(“公钥”,“数据明文”)对上述明文进行再次加密,得到数据密文。

s6、采用非对称加密算法对所述数据密文解密,得到数据明文的文本文件,返回给访问者。

可选的,步骤s6中所述数据解密利用所述私钥和签名结合非对称加密算法得到,得到所述数据明文的文本文档之后,返回给访问者之前还包括:在所述文本文件中加入数字签名或水印。

例如,通过非对称加密算法asym_decode(“私钥”,“签名”,“数据密文”)将数据子集中的加密信息还原为明文信息,得到数据明文的pdf文件,并在pdf中加入数字签名或水印,返回给数据请求者。

参见图2,本发明提供了一种大数据安全与隐私保护装置,具体包括以下内容:

区块索引模块210:根据用户身份标识id和数据属性对用户隐私数据进行区块划分,建立数据属性与数据信息的键值对关系,并建立区块索引来标识各个区块所记录的数据属性;

安全分级模块220:根据隐私数据敏感度对各个区块所记录的数据属性进行安全分级;

加密存储模块230:通过对称加密算法分别对所述区块索引的数据属性及区块内数据信息加密存储;

区块检索模块240:当接收到访问者的数据检索请求,将请求中的数据属性对称加密并检索所述区块索引,根据请求中的用户身份标识id,获取对应区块内数据信息;

再次加密模块250:通过对称加密算法将所述对应区块内数据信息还原为明文,获取所述数据检索请求的公钥,通过非对称加密算法对所述明文再次加密,得到数据密文;

解密返回模块260:采用非对称加密算法对所述数据密文解密,得到数据明文的文本文件,返回给访问者。

可选的,所述安全分级模块220还包括:

脱敏单元:安全级别数字大的区块拒绝被低授权的访问者访问;对高安全级别的数据属性,在复制后加入干扰,形成新的较低级别的数据属性,以便为必要的核对与确认提供依据。

可选的,所述区块检索模块240还包括:

授权单元:据检索请求需先获取授权,得到授权访问表和区块索引;

密钥单元:按非对称加密机制,为所述数据请求产生私钥和公钥,数据访问者获取私钥;

签名单元:根据访问者所持有的私钥,为该请求生成签名,并记录数据请求信息和所获取的结果。

本发明还提供一种计算机可读存储介质,其中,该计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现实施例一中记载的大数据安全与隐私保护方法的部分或全部步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各实施例的模块、单元和/或方法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1