数据匹配方法、装置、计算机设备及存储介质与流程

文档序号:36722616发布日期:2024-01-16 12:26阅读:16来源:国知局
数据匹配方法、装置、计算机设备及存储介质与流程

本技术涉及计算机信息处理,特别是涉及一种数据匹配方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

1、随着企业和个人对数据隐私保护重视程度的提高,隐私数据匹配逐渐有了越来越广泛的需求。例如,金融机构在为客户提供服务时,可能需要进行跨机构敏感数据匹配,对客户资质或信息进行核查。

2、目前跨机构的敏感数据匹配一般采用精准匹配,但是精准匹配的方式只有双方数据完全一致的情况下才能匹配成功,无法识别本质相同、但有较小区别的敏感数据,导致匹配错误率高,例如,两家金融机构拥有若干共同的客户,需求是确认这些共同客户所提供的个人住址信息是否一致,但是同一个地址信息可能会有不同的留存形式,如“a号院”和“a小区”指向的是同一个小区,此时若是利用精确匹配的方式,容易将这两个地址信息误判为不同的小区。因此,如何提升敏感数据匹配的准确性,是当前亟待解决的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够在不暴露额外信息的情况下,提升敏感数据匹配准确性的数据匹配方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本技术提供了一种数据匹配方法。所述方法应用于数据接收方,包括:

3、根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量;

4、基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的相似度;

5、根据所述相似度确定模糊匹配结果;

6、将所述模糊匹配结果同步至所述数据发送方。

7、在其中一个实施例中,所述根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量,包括:

8、生成随机数,并根据所述随机数和私钥对第一待匹配数据进行签名,得到第一密文数据;

9、将所述第一密文数据发送给数据发送方,以指示所述数据发送方使用公钥对所述第一密文数据进行加密,得到第二密文数据,将所述第二密文数据和第三密文数据发送至数据接收方,其中,所述第三密文数据为所述数据发送方使用所述公钥对第二待匹配数据加密得到,所述数据发送方的公钥与所述数据接收方的私钥对应;

10、利用所述私钥和所述随机数对接收到的所述第二密文数据进行解密,得到第四密文数据;

11、计算所述第三密文数据与所述第四密文数据之间的交集,得到交集字符数量。

12、在其中一个实施例中,所述基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的相似度,包括:

13、基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的第一相似度;

14、提取所述第三密文数据对应的第一差异数据,并提取所述第四密文数据对应的第二差异数据;

15、将所述第一差异数据和所述第二差异数据输入至预先训练好的神经网络模型,得到第二相似度;

16、根据所述第一相似度和所述第二相似度确定所述第一待匹配数据与所述第二待匹配数据之间的相似度。

17、在其中一个实施例中,所述根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量之前,所述方法还包括:

18、根据待匹配信息查询得到第一目标数据;

19、根据预设字典对所述第一目标数据进行数字转换,得到第一待匹配数据;

20、并根据所述待匹配信息向数据发送方请求数据,以指示所述数据发送方根据所述待匹配信息查询得到第二目标数据,根据预设字典对所述第二目标数据进行数字转换,得到第二待匹配数据。

21、在其中一个实施例中,所述基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的第一相似度,包括:

22、利用杰卡德相似系数,基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量确定并集数量;

23、根据所述交集字符数量和所述并集数量计算所述第一待匹配数据与所述第二待匹配数据之间的第一相似度。

24、在其中一个实施例中,所述根据所述相似度确定模糊匹配结果,包括:

25、在所述相似度大于预设阈值时,确定模糊匹配结果为匹配成功;

26、在所述相似度小于或等于预设阈值时,确定模糊匹配结果为匹配失败。

27、第二方面,本技术还提供了一种数据匹配装置。所述装置应用于数据接收方,包括:

28、隐私集合求交模块,用于根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量;

29、模糊匹配模块,用于基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的相似度,根据所述相似度确定模糊匹配结果;

30、结果管理模块,用于将所述模糊匹配结果同步至所述数据发送方。

31、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

32、根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量;

33、基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的相似度;

34、根据所述相似度确定模糊匹配结果;

35、将所述模糊匹配结果同步至所述数据发送方。

36、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

37、根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量;

38、基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的相似度;

39、根据所述相似度确定模糊匹配结果;

40、将所述模糊匹配结果同步至所述数据发送方。

41、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:

42、根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量;

43、基于所述第一待匹配数据的总字符数量、所述第二待匹配数据的总字符数量以及所述交集字符数量计算所述第一待匹配数据与所述第二待匹配数据之间的相似度;

44、根据所述相似度确定模糊匹配结果;

45、将所述模糊匹配结果同步至所述数据发送方。

46、上述数据匹配方法、装置、计算机设备、存储介质和计算机程序产品,根据预设隐私集合求交策略计算数据接收方对应的第一待匹配数据与数据发送方对应的第二待匹配数据之间的交集字符数量;基于第一待匹配数据的总字符数量、第二待匹配数据的总字符数量以及交集字符数量计算第一待匹配数据与第二待匹配数据之间的相似度;根据相似度确定模糊匹配结果;将模糊匹配结果同步至数据发送方。通过上述方式,调用预设隐私集合求交策略能够避免暴露待匹配数据的额外信息,通过计算相似度的方式进行数据的模糊匹配,与精准匹配相比,提升了敏感数据匹配准确性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1