一种基于随机抽样检测的大数据可信性验证方法及系统的制作方法

文档序号:7823203阅读:734来源:国知局
一种基于随机抽样检测的大数据可信性验证方法及系统的制作方法
【专利摘要】本发明提供一种基于随机抽样检测的大数据可信性验证方法及系统,首先对大数据进行分块并为数据块生成认证标签;再进行质询,根据质询抽取数据块,并生成该轮可信性验证请求所对应的示证;最后根据示证来验证抽样的数据块的可信性。通过采用基于聚合的广播加密算法的数据签名方案,能够支持数据使用者验证大数据的可信性,无需数据属主实时在线,同时还能够避免哈希函数方案中存在的替换攻击,和散列消息认证码方案中数据属主自己验证数据的可信性,或者需要实时在线将其私钥共享给数据使用者的局限性。同时采用随机抽样检测方法和线性聚合方法,使数据使用者可在不下载数据的情况下,以高置信率验证数据的可信性,且降低了示证验证的计算开销。
【专利说明】一种基于随机抽样检测的大数据可信性验证方法及系统

【技术领域】
[0001] 本发明涉及计算机信息安全【技术领域】,具体涉及一种基于随机抽样检测的大数据 可信性验证方法及系统。

【背景技术】
[0002] 由于大数据包含了大量的原始信息,通过对大数据进行分析,能够有效地分析掌 握个性化特征,获得知识与推测趋势。但是,若数据本身不可信,分析的结果就难以得出真 实有用的信息。
[0003] 大数据可信性的威胁在于伪造或刻意制造的数据,而错误的数据往往会导致错误 的结论。如果数据的应用场景明确,就可能有人刻意制造数据、营造出假象,诱导分析者得 出对其有利的结论。而且,虚假的信息往往隐藏在大量信息中,使得人们无法鉴别真伪,从 而做出错误的判断。由于当前网络社区中虚假信息的产生和传播变得越来越容易,其所产 生的影响不可低估。因此,应当设计大数据的可信性验证方法来验证大数据的可信性,包括 大数据的来源可信性、内容可信性,使得数据使用者能够对数据的可信性做出评估,防止使 用不可信的数据分析得出无意义或者错误的结果。


【发明内容】

[0004] 有鉴于此,有必要提供一种能够以高置信率有效地对大数据的来源可信性、内容 可信性进行验证的基于随机抽样检测的大数据可信性验证方法及系统。
[0005] -种基于随机抽样检测的大数据可信性验证方法,包括签证机构CA、数据属主 Owner、大数据发布平台BDDP、数据使用者User4个参与方,即所述基于随机抽样检测的大 数据可信性验证方法包括如下步骤:
[0006]S1、获得证书:数据属主Owner根据其身份信息及公开参数自签证机构CA获得证 书;
[0007]S2、数据的处理:数据属主Owner对大数据进行分块,并生成认证标签;
[0008]S3、质询的生成:数据使用者User生成包含有抽样的数据块索引及对应的盲化因 子的质询;
[0009]S4、示证的生成:大数据发布平台BDDP根据质询、大数据和认证标签生成该轮可 信性验证请求所对应的示证;
[0010] S5、示证的验证:根据大数据发布平台BDDP返回的示证验证抽样的数据块的可信 性,如果示证能通过验证,则当前抽样的大数据处于可信状态;反之则表示大数据不可信。
[0011] 一种基于随机抽样检测的大数据可信性验证系统,所述基于随机抽样检测的大数 据可信性验证系统包括签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者 User4个参与方,所述签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者User 依次连接,且所述签证机构CA还与大数据发布平台BDDP相连,所述数据属主Owner还与数 据使用者User相连。
[0012] 本发明实施例提供一种基于随机抽样检测的大数据可信性验证方法及系统,通过 采用基于聚合的广播加密算法的数据签名方案,属于一种公钥签名方案,能够支持第三方 即数据使用者User验证大数据的可信性,无需数据属主Owner实时在线,既能避免哈希函 数方案中存在的替换攻击,又能避免散列消息认证码方案中数据属主Owner自己验证数据 的可信性,或者需要实时在线将其私钥共享给数据使用者User的局限性。同时对需要验证 可信性的大数据采用随机抽样检测方法和线性聚合方法,使数据使用者User可在不下载 数据的情况下,以高置信率验证数据的可信性,且大大降低了示证验证的计算开销。总之, 本发明利用基于聚合的广播加密算法的数据签名方案和随机抽样检测方法,能够以高置信 率有效地验证大数据的可信性,包括数据来源的可信性和数据内容的可信性。

【专利附图】

【附图说明】
[0013] 图1为本发明所述的基于随机抽样检测的大数据可信性验证方法的传递关系图;
[0014] 图2是本发明一较佳实施例的一种基于随机抽样检测的大数据可信性验证方法 的流程图;
[0015] 图3是图2中步骤S1的子流程图;
[0016] 图4是图2中步骤S2的子流程图;
[0017] 图5是图2中步骤S3的子流程图;
[0018] 图6是图2中步骤S4的子流程图;
[0019]图7是本发明实施例中基于随机抽样检测的大数据可信性验证方法的工作流程 示意图;
[0020] 图8是本发明一较佳实施例的一种基于随机抽样检测的大数据可信性验证系统 的结构框图。

【具体实施方式】
[0021] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对 本发明进行进一步详细说明,应当理解,此处所描述的具体实施例仅仅用以解释本发明,并 不用于限定本发明。
[0022] 如图1和图2所示,本发明实施例提供一种基于随机抽样检测的大数据可信性验 证方法,包括签证机构CA、数据属主Owner、大数据发布平台BDDP、数据使用者User4个参与 方,即所述基于随机抽样检测的大数据可信性验证方法包括如下步骤:
[0023]S1、获得证书:数据属主Owner根据其身份信息及公开参数自签证机构CA获得证 书。
[0024] 可选地,如图3所示,所述步骤S1包括以下子步骤:
[0025] S11、数据属主Owner根据安全参数k生成公开参数pk和秘密参数sk ;
[0026]S12、根据其身份信息及公开参数pk自签证机构CA获得证书;
[0027]S13、签证机构CA将自己的证书上传到大数据发布平台BDDP。
[0028] 具体的,所述获取证书的计算方法如下:
[0029]⑴数据属主Owner选取两个具有相同素数阶p的乘法循环群G和GT,一个可计算 的双线性映射e:G串GGT,以及安全哈希函数乃(桩:彳0,IKC,将字符串与G中的元素 一一映射;

【权利要求】
1. 一种基于随机抽样检测的大数据可信性验证方法,其特征在于:包括签证机构CA、 数据属主Owner、大数据发布平台BDDP、数据使用者User4个参与方,即所述基于随机抽样 检测的大数据可信性验证方法包括如下步骤: 51、 获得证书:数据属主Owner根据其身份信息及公开参数自签证机构CA获得证书; 52、 数据的处理:数据属主Owner对大数据进行分块,并生成认证标签; 53、 质询的生成:数据使用者User生成包含有抽样的数据块索引及对应的盲化因子的 质询; 54、 示证的生成:大数据发布平台BDDP根据质询、大数据和认证标签生成该轮可信性 验证请求所对应的示证; 55、 示证的验证:根据大数据发布平台BDDP返回的示证验证抽样的数据块的可信性, 如果示证能通过验证,则当前抽样的大数据处于可信状态;反之则不可信。
2. 根据权利要求1所述的基于随机抽样检测的大数据可信性验证方法,其特征在于: 所述步骤Sl包括以下子步骤: 511、 数据属主Owner根据安全参数生成公开参数和秘密参数; 512、 根据其身份信息及公开参数自签证机构CA获得证书; 513、 签证机构CA将自己的证书上传到大数据发布平台BDDP。
3. 根据权利要求1所述的基于随机抽样检测的大数据可信性验证方法,其特征在于: 所述步骤S2包括以下子步骤: 521、 数据属主Owner对大数据进行分块; 522、 数据属主Owner根据秘密参数为数据块生成认证标签; 523、 数据属主Owner将大数据、数据块的认证标签以及公开参数一起上传给大数据发 布平台BDDP。
4. 根据权利要求1所述的基于随机抽样检测的大数据可信性验证方法,其特征在于: 所述步骤S3包括以下子步骤: 531、 数据使用者User从大数据发布平台BDDP处获取数据属主Owner的证书及签证机 构CA的证书,来验证数据属主Owner证书的有效性; 532、 数据使用者User生成包含有抽样的数据块索引及对应的盲化因子的质询; 533、 质询作为抽样数据块的可信性验证请求被发送给大数据发布平台BDDP。
5. 根据权利要求1所述的基于随机抽样检测的大数据可信性验证方法,其特征在于: 所述步骤S4包括以下子步骤: 541、 数据使用者User向大数据发布平台BDDP发出的质询请求; 542、 大数据发布平台BDDP根据数据使用者User发来的质询请求,以质询、大数据和认 证标签为输入,输出该轮可信性验证请求所对应的示证; 543、 将示证返回给数据使用者User。
6. -种基于随机抽样检测的大数据可信性验证系统,其特征在于:所述基于随机抽样 检测的大数据可信性验证系统包括签证机构CA、数据属主Owner、大数据发布平台BDDP、数 据使用者User4个参与方,所述签证机构CA、数据属主Owner、大数据发布平台BDDP、数据 使用者User依次连接,且所述签证机构CA还与大数据发布平台BDDP相连,所述数据属主 Owner还与数据使用者User相连。
7. 根据权利要求6所述的基于随机抽样检测的大数据可信性验证系统,其特征在于: 所述签证机构CA包括证书颁发模块CM,所述证书颁发模块CM用于根据数据属主Owner 的公开参数为其生成并颁发证书。
8. 根据权利要求6所述的基于随机抽样检测的大数据可信性验证系统,其特征在于: 其中,所述数据属主Owner包括密钥生成模块KGM和标签生成模块TGM ; 所述密钥生成模块KGM用于根据安全参数生成公开参数和秘密参数的密钥生成模块 KGM ; 所述标签生成模块TGM用于将大数据分块,根据秘密参数为数据块生成认证标签,并 将大数据、数据块的认证标签以及公开参数一起上传给大数据发布平台BDDP。
9. 根据权利要求6所述的基于随机抽样检测的大数据可信性验证系统,其特征在于: 所述大数据发布平台BDDP包括示证生成模块PGM,所述示证生成模块PGM用于以质询、大数 据和认证标签为输入,输出该轮可信性验证请求所对应的示证。
10. 根据权利要求6所述的基于随机抽样检测的大数据可信性验证系统,其特征在于: 所述数据使用者User包括质询生成模块CGM和示证验证模块PVM,所述质询生成模块CGM 用于生成包含了抽样的数据块索引及对应的盲化因子的质询,所述示证验证模块PVM用于 根据示证来验证抽样的数据块的可信性。
【文档编号】H04L9/08GK104518880SQ201410784294
【公开日】2015年4月15日 申请日期:2014年12月17日 优先权日:2014年12月17日
【发明者】任正伟, 徐明迪, 明瑞扬, 沈楚楚 申请人:中国船舶重工集团公司第七0九研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1