隐私保护聚类数据挖掘方法、电子设备、存储介质及系统与流程

文档序号:16062480发布日期:2018-11-24 12:19阅读:256来源:国知局

本发明涉及数据挖掘技术领域,尤其涉及隐私保护聚类数据挖掘方法、电子设备、存储介质及系统。

背景技术

随着云计算的发展和普及,用户越来越倾向于将数据存储到云上,租用云计算服务中心提供的丰富计算和存储资源,能够为用户提供更加高效、专业的数据分析服务。然而,云服务提供商往往并不完全可信,用户在享用云计算高效服务的同时,用户隐私数据也直接暴露给云服务中心,因此,数据隐私安全问题就成为用户使用云计算不得不考虑的首要问题。现有数据挖掘算法没有考虑云环境下云服务提供商不可信的情况,因此,急需一种能够在保证用户隐私的前提条件下提高挖掘结果准确性的隐私保护聚类数据挖掘方法。



技术实现要素:

为了克服现有技术的不足,本发明的目的之一在于提供隐私保护聚类数据挖掘方法,解决了现有数据挖掘算法没有考虑云环境下云服务提供商不可信的情况,无法保证用户隐私的问题。

本发明提供隐私保护聚类数据挖掘方法,包括以下步骤:

生成密钥,生成优质基、随机整数矩阵、公开参数,对所述优质基和所述随机整数矩阵进行初等变换,生成劣质基,将所述优质基作为私钥存储于本地,将所述劣质基作为公钥提交至云服务提供商;

加密数据,通过所述公钥加密明文多维数据,生成密文,将所述密文和所述公开参数发送至所述云服务提供商;

挖掘数据,所述云服务提供商调用密文中心点计算算法和密文距离计算算法对所述密文进行数据挖掘,返回数据挖掘结果;

解密数据,采用所述公钥和所述私钥对所述数据挖掘结果进行解密,生成明文挖掘结果。

进一步地,所述步骤加密数据还包括通过同态加密对所述明文多维数据进行加密。

进一步地,所述步骤挖掘数据还包括所述云服务提供商根据所述密文计算密文数据点和聚类中心点的距离,比较所述密文数据点到所述聚类中心点的距离,将距离最近的密文数据点划分到对应的聚类中。

进一步地,所述步骤解密数据包括采用babai算法计算最接近所述密文的最近向量,通过所述最近向量和所述公钥生成所述明文挖掘结果。

一种电子设备,包括:处理器;

存储器;以及程序,其中所述程序被存储在所述存储器中,并且被配置成由处理器执行,所述程序包括用于执行上述隐私保护聚类数据挖掘方法。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行上述隐私保护聚类数据挖掘方法。

隐私保护聚类数据挖掘系统,包括:

生成密钥模块:用于生成优质基、随机整数矩阵、公开参数,对所述优质基和所述随机整数矩阵进行初等变换,生成劣质基,将所述优质基作为私钥存储于本地,将所述劣质基作为公钥提交至云服务提供商;

加密数据模块:用于通过所述公钥加密明文多维数据,生成密文,将所述密文和所述公开参数发送至所述云服务提供商;

挖掘数据模块:用于所述云服务提供商调用密文中心点计算算法和密文距离计算算法对所述密文进行数据挖掘,返回数据挖掘结果;

解密数据模块:用于采用所述公钥和所述私钥对所述数据挖掘结果进行解密,生成明文挖掘结果。

进一步地,所述加密数据模块还包括通过同态加密对所述明文多维数据进行加密。

进一步地,所述挖掘数据模块还包括所述云服务提供商根据所述密文计算密文数据点和聚类中心点的距离,比较所述密文数据点到所述聚类中心点的距离,将距离最近的密文数据点划分到对应的聚类中。

进一步地,所述解密数据模块包括采用babai算法计算最接近所述密文的最近向量,通过所述最近向量和所述公钥生成所述明文挖掘结果。

相比现有技术,本发明的有益效果在于:

本发明提供隐私保护聚类数据挖掘方法,包括以下步骤:生成密钥,生成优质基、随机整数矩阵、公开参数,对优质基和随机整数矩阵进行初等变换,生成劣质基,将优质基作为私钥存储于本地,将劣质基作为公钥提交至云服务提供商;加密数据,通过公钥加密明文多维数据,生成密文,将密文和公开参数发送至云服务提供商;挖掘数据,云服务提供商调用密文中心点计算算法和密文距离计算算法对密文进行数据挖掘,返回数据挖掘结果;解密数据,采用公钥和私钥对数据挖掘结果进行解密,生成明文挖掘结果。本发明还涉及一种电子设备、存储介质、隐私保护聚类数据挖掘系统。本发明通过构建隐私数据的安全同态运算方法,并且在此基础上实现了支持隐私保护的云端密文数据聚类分析数据挖掘服务;为保护用户数据隐私,用户将数据加密之后发布给云服务提供商,云服务提供商利用同态加密算法实现隐私保护,但云服务提供商并不能直接访问用户数据破坏用户隐私;本发明具有很高的安全性,有效保持了密文数据间距离的精确性。

上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。本发明的具体实施方式由以下实施例及其附图详细给出。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明的隐私保护聚类数据挖掘方法流程图;

图2为本发明的隐私保护聚类数据挖掘系统结构示意图。

具体实施方式

下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。

隐私保护聚类数据挖掘方法,如图1所示,包括以下步骤:

生成密钥,生成优质基kpri、随机整数矩阵u、公开参数p,对优质基和随机整数矩阵进行初等变换,生成劣质基kpub,将优质基作为私钥存储于本地,将劣质基作为公钥提交至云服务提供商;本实施例中,劣质基kpub计算公式如下:

kpub=ukpri=w1,w2,…,wn

加密数据,通过公钥加密明文多维数据,生成密文,将密文和公开参数发送至云服务提供商;优选的,步骤加密数据还包括通过同态加密对明文多维数据进行加密。本实施例中,明文多维数据以向量的形式存储,对于明文高维向量m,用户使用kpub加密m,生成的密文二元组(si,ti)由两部分组成,si用于解密过程还原明文数据;ti为kpubm的哈希值,用于密文状态下的辅助同态计算过程。

挖掘数据,云服务提供商调用密文中心点计算算法和密文距离计算算法对密文进行数据挖掘,返回数据挖掘结果;优选的,步骤挖掘数据还包括云服务提供商根据密文计算密文数据点和聚类中心点的距离,比较密文数据点到聚类中心点的距离,将距离最近的密文数据点划分到对应的聚类中。本实施例中,对于一对密文向量(s1,t1)及(s2,t2),密文的计算过程如下:

解密数据,采用公钥和私钥对数据挖掘结果进行解密,生成明文挖掘结果。优选的,步骤解密数据包括采用babai算法计算最接近密文的最近向量,通过最近向量和公钥生成明文挖掘结果。本实施例中,明文挖掘结果计算公式如下:

v=round(sikpri-1)·kpri

code=v·kpub-1

一种电子设备,包括:处理器;

存储器;以及程序,其中程序被存储在存储器中,并且被配置成由处理器执行,程序包括用于执行上述隐私保护聚类数据挖掘方法。

一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行上述隐私保护聚类数据挖掘方法。

隐私保护聚类数据挖掘系统,如图2所示,包括:

生成密钥模块:用于生成优质基kpri、随机整数矩阵u、公开参数p,对优质基和随机整数矩阵进行初等变换,生成劣质基kpub,将优质基作为私钥存储于本地,将劣质基作为公钥提交至云服务提供商;本实施例中,劣质基kpub计算公式如下:

kpub=ukpri=w1,w2,...,wn

加密数据模块:用于通过公钥加密明文多维数据,生成密文,将密文和公开参数发送至云服务提供商;优选的,加密数据模块还包括通过同态加密对明文多维数据进行加密。本实施例中,明文多维数据以向量的形式存储,对于明文高维向量m,用户使用kpub加密m,生成的密文二元组(si,ti)由两部分组成,si用于解密过程还原明文数据;ti为kpubm的哈希值,用于密文状态下的辅助同态计算过程。

挖掘数据模块:用于云服务提供商调用密文中心点计算算法和密文距离计算算法对密文进行数据挖掘,返回数据挖掘结果;优选的,挖掘数据模块还包括云服务提供商根据密文计算密文数据点和聚类中心点的距离,比较密文数据点到聚类中心点的距离,将距离最近的密文数据点划分到对应的聚类中。本实施例中,对于一对密文向量(s1,t1)及(s2,t2),密文的计算过程如下:

解密数据模块:用于采用公钥和私钥对数据挖掘结果进行解密,生成明文挖掘结果。优选的,解密数据模块包括采用babai算法计算最接近密文的最近向量,通过最近向量和公钥生成明文挖掘结果。本实施例中,明文挖掘结果计算公式如下:

v=round(sikpri-1)·kpri

code=v·kpub-1

本发明提供隐私保护聚类数据挖掘方法,包括以下步骤:生成密钥,生成优质基、随机整数矩阵、公开参数,对优质基和随机整数矩阵进行初等变换,生成劣质基,将优质基作为私钥存储于本地,将劣质基作为公钥提交至云服务提供商;加密数据,通过公钥加密明文多维数据,生成密文,将密文和公开参数发送至云服务提供商;挖掘数据,云服务提供商调用密文中心点计算算法和密文距离计算算法对密文进行数据挖掘,返回数据挖掘结果;解密数据,采用公钥和私钥对数据挖掘结果进行解密,生成明文挖掘结果。本发明还涉及一种电子设备、存储介质、隐私保护聚类数据挖掘系统。本发明通过构建隐私数据的安全同态运算方法,并且在此基础上实现了支持隐私保护的云端密文数据聚类分析数据挖掘服务;为保护用户数据隐私,用户将数据加密之后发布给云服务提供商,云服务提供商利用同态加密算法实现隐私保护,但云服务提供商并不能直接访问用户数据破坏用户隐私;本发明具有很高的安全性,有效保持了密文数据间距离的精确性。

以上,仅为本发明的较佳实施例而已,并非对本发明作任何形式上的限制;凡本行业的普通技术人员均可按说明书附图所示和以上而顺畅地实施本发明;但是,凡熟悉本专业的技术人员在不脱离本发明技术方案范围内,利用以上所揭示的技术内容而做出的些许更动、修饰与演变的等同变化,均为本发明的等效实施例;同时,凡依据本发明的实质技术对以上实施例所作的任何等同变化的更动、修饰与演变等,均仍属于本发明的技术方案的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1