一种基于区块链的数据链接隐私计算方法与流程

文档序号:17443485发布日期:2019-04-17 05:08阅读:1109来源:国知局

本发明涉及区块链技术领域,尤其是涉及一种基于区块链的数据链接隐私计算方法。



背景技术:

基于概率的近似匹配方法的提出很好的解决了存在质量问题的数据记录匹配问题,具有良好的容错性,并且能提高数据链接的效率,挖掘更精确的用户信息,提供更高效的服务。但是,现有的隐私保护数据链接记录方案由于应用密码学技术导致时间代价较大,其拓展性不适用于真实庞大的现实生活中。同时,在处理质量问题数据的时候,查全率也无法得到保证。区块链作为一个分布式数据库,由所有节点共同维护,很好地解决第三方信任度问题,但是,区块链却存在着由于个人隐私数据的公开而造成隐私泄露的问题。因此,设计出一种基于区块链的数据链接隐私计算和数据保护方法是十分重要的。



技术实现要素:

为了弥补现有技术的不足,本发明提供了一种基于区块链的数据链接隐私计算方法。

本发明采用的技术方案为:

数据库将包含用户个人公共属性信息的数据记录链接任务信息发布到区块链中,区块链根据启发式算法计算出数据相似度的阈值合理范围,并将该任务信息在新的区块生成时推送给区块链中的各参与方,各数据源使用分块策略并使用多方安全的布隆过滤器技术将位数组均分并将相应的片段传送给对应的参与方,参与方接收到除自己以外的其他参与方相应的片段信息;各位数组将对应位置的字符做与运算,计算出各位数组在各对应位置1所占的比率,与区块链利用二项分布定理计算出来的动态阈值进行比较,产生候选匹配成功的位置;区块链利用pow共识机制推选出绝对安全可靠的唯一参与方执行贪心检查机制,以便筛选出真正匹配成功的位置;区块链利用相似度计算函数和安全合计计算来自各数据源位数组间的相似度,进而判断位数组的记录信息是否来源于同一实体,若相似度大于全局阈值,则检测通过,链接成功;反之链接失败,完成此项任务的链接过程。

本发明与现有技术相比,其有益效果为:本发明具有较高的查全率和较低的时间代价等优点,同时,又实现了隐私数据的保护,本发明可以有效处理存在质量问题的数据,从而保证了数据的容错性,而且本发明还利用贪心检查机制功能,能够保证提高查全率的同时,也能保证查准率,此外,本发明还适用于真实庞大的现实环境中,提高了本发明的可拓展性。

具体实施方式

一种基于区块链的数据链接隐私计算方法,包括以下步骤

1)数据库将包含用户个人公共属性信息的数据记录链接任务信息发布到区块链中;

2)区块链根据启发式算法计算出数据相似度的阈值合理范围,并将该任务信息在新的区块生成时推送给区块链中的各参与方;

3)各数据源使用分块策略并使用多方安全的布隆过滤器技术将位数组均分并将相应的片段传送给对应的参与方,参与方接收到除自己以外的其他参与方相应的片段信息;

4)各位数组将对应位置的字符做与运算,计算出各位数组在各对应位置1所占的比率,与区块链利用二项分布定理计算出来的动态阈值进行比较,产生候选匹配成功的位置;

5)区块链利用pow共识机制推选出绝对安全可靠的唯一参与方执行贪心检查机制,以便筛选出真正匹配成功的位置;

6)区块链利用相似度计算函数和安全合计计算来自各数据源位数组间的相似度,进而判断位数组的记录信息是否来源于同一实体,若相似度大于全局阈值,则检测通过,链接成功;反之链接失败,完成此项任务的链接过程。

本发明采用区块链对任务信息进行存储和处理,并使用分块技术对各数据源记录信息进行切分,利用布隆过滤器技术对用户公共属性信息进行加密,保护了用户信息隐私;本发明通过二项分布定理计算链接数据记录的容错率,并通过切比雪夫定理获得存在质量问题的数据记录数目,利用贪心检查机制对候选匹配位置的数据记录信息进行判断,完成此项任务的链接过程,该上述设置保证了只有区块链认证的参与方才能获得有效的用户的公共属性值,并且区块链利用pow共识机制算法推选出来的绝对安全可靠的唯一参与方,保证了贪心检查机制算法的安全执行,有效防止了敌手的攻击。

优选地,区块链为以太坊区块链。该上述设置可使得本发明具有可编程功能。

优选地,步骤1)中,数据库对用户的数据信息进行预处理,对数据清洗、去重等操作,再将包含用户个人公共属性信息的数据记录链接任务信息发布到区块链中。本发明在发布任务前,对数据进行预处理,保证了数据的高质量和完整性。

优选地,步骤2)中,根据区块链启发式算法与二项分布定理计算链接数据记录相似度的容错率从而计算出数据相似度的动态阈值,用来筛选候选匹配位置。该上述设置保证了数据的容错性。

优选地,步骤3)中,各数据源使用分块策略和多方安全的布隆过滤器技术将位数组均分并将相应的片段传送给对应的参与方。该上述设置保证数据的隐私性和真实性。

优选地,步骤4)中,各位数组将对应位置的字符做与运算,计算bit1所占的比率,与区块链计算出来的动态阈值进行比较,产生候选匹配成功的位置。该上述设置对候选匹配成功的位置分析有参考作用。

优选地,还包括步骤5),以太坊区块链利用pow共识机制推选出绝对安全可靠的唯一参与方执行贪心检查机制,以便筛选出真正匹配成功的位置。该上述设置可安全有效保证数据链接方案的正常执行。

优选地,还包括步骤6),以太坊区区块链利用相似度计算函数和安全合计计算来自各数据源位数组间的相似度,进而判断位数组的记录信息是否来源于同一实体。该上述设置可保证数据计算的隐私性和高效性。

本发明对多个数据源中找出代表现实同一实体的记录信息进行了链接并且不暴露实体的属性信息,很好地保护了数据的隐私。本发明要求各个数据源之间具有公共的属性信息,链接过程才能正常进行,本发明需要保证区块链中有足够多的参与方,保证用户数据信息的隐私性,保证链接过程的顺利进行。



技术特征:

技术总结
本发明公开了一种基于区块链的数据链接隐私计算方法。本发明中的数据库将用户需要链接的数据记录任务信息发送到区块链上;区块链给出数据记录间相似度的合理阈值。其次各数据源对公共属性信息进行分块,并将各数据源的公共属性值转换为0或1的位数组。然后计算位数组间各对应位置所占的比率并根据区块链给出的动态阈值筛选候选匹配成功的位置。最后通过推选出安全可靠的唯一参与方执行贪心检查机制;区块链利用相似度计算函数和安全合计来计算来自各数据源位数组间的相似度,进而判断位数组是否来源于同一实体即记录间是否匹配成功。本发明实现了基于区块链的数据链接中的隐私计算和数据保护,并在记录匹配的情况下保证数据链接成功。

技术研发人员:顾绵雪;韩嵩;李凤华;牛犇
受保护的技术使用者:浙江工商大学
技术研发日:2018.11.23
技术公布日:2019.04.16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1