一种可验证的多用户模糊关键词搜索方法及系统

文档序号:33823320发布日期:2023-04-19 20:37阅读:73来源:国知局
一种可验证的多用户模糊关键词搜索方法及系统

本发明属于云计算,尤其涉及一种可验证的多用户模糊关键词搜索方法及系统。


背景技术:

1、本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。

2、在数据库即服务(database-as-a-service)的范例中,由于资源有限的设备,用户更喜欢将他们的海量数据外包给云服务器;然而,这种模式带来了许多安全挑战,例如不完全可信的云服务器和恶意窃听者;为了避免隐私泄露,数据以加密形式存储;对密文执行搜索或其他操作可以显著增强加密数据库的有用性;关键词可搜索加密允许用户根据所需的关键词搜索匹配的加密记录(或文件),不过大部分都是精确关键词搜索;在很多情况下,用户不确定某个关键词的确切拼写,但仍然希望检索文件;因此,当用户想要检索的数据信息有限时,支持模糊搜索的能力对于云服务器尤为重要。

3、模糊关键词可搜索加密方案包括两个基本组成部分:(1)底层匹配技术,用于提供模糊匹配,例如预定义的模糊字典,位置敏感散列(lsh)和布隆过滤器(bf),基于树的索引和矢量编码;然而,它们中的大多数在实际应用中具有一定的局限性,例如,基于预定义字典的算法会导致很高的存储成本,并且使用lsh和bf可能会造成误报,即服务器会返回不匹配的结果,影响准确率;(2)隐私保护机制,用于实现数据和搜索隐私,如对称加密和非对称加密等;非对称加密便于提供丰富的搜索功能,但计算量很大;对称加密带来了高效率,最具代表性的就是k近邻(knn)技术;但是它在应用多样性方面有局限性,比如不支持多用户场景;目前,大多数高效的可搜索加密方案都是基于knn技术的。

4、为了适应多用户场景,已经提出了一系列多用户关键词搜索方案,然而,大多数方案认为服务器是诚实但好奇的,这在实际应用场景中并不总是正确的,云服务器可能会返回不完整或不正确的搜索结果;为了验证搜索结果的正确性和完整性,一些研究者提出了可验证的关键词搜索方案,但是它们要么不支持模糊搜索,要么依赖于昂贵的操作。


技术实现思路

1、为克服上述现有技术的不足,本发明提供了一种可验证的多用户模糊关键词搜索方法及系统,提出了一种新的基于通配符的模糊关键词搜索技术,称为向量和范围判定(vsrd)匹配方案,通过结合vsrd和shami r阈值方案,在多用户环境中实现既高效率又高准确度的模糊关键词搜索。

2、为实现上述目的,本发明的一个或多个实施例提供了如下技术方案:

3、本发明第一方面提供了一种可验证的多用户模糊关键词搜索方法;

4、一种可验证的多用户模糊关键词搜索方法,基于向量和范围判定方案实现关键词的搜索,包括:

5、步骤s1:验证中心初始化公共参数;

6、步骤s2:数据所有者将数据的索引关键词,编码成预设固定长度的索引向量,发送到对应的数据服务器上保存;

7、步骤s3:数据搜索者将查询关键词,编码成预设固定长度的查询向量,发送到对应的数据服务器上搜索;

8、步骤s4:数据服务器根据本地存储的索引向量和接收到的查询向量,执行搜索,并将搜索结果传送给验证中心;

9、步骤s5:验证中心基于搜索结果,验证关键词是否匹配,并验证结果的正确性和完整性;

10、其中,所述向量和范围判定方案,是将每个关键词编码为固定长度的向量,并将索引向量和查询向量相加以获得和向量,通过确定和向量是否在固定范围内来决定关键词是否匹配。

11、进一步的,所述初始化公共参数,具体为:

12、验证中心根据预设的安全参数,初始化基于向量和范围判定方案,生成公共参数,并通过安全通道将生成的公共参数传送给数据所有者和数据搜索者。

13、进一步的,所述关键词,包含三种类型的字符:确切字符、填充字符和通配符;其中,所述确切字符,指的是26个英文字母;

14、所述填充字符,用于在必要时将索引关键词填充到预设固定长度;

15、所述通配符,表示相关位置的字符是不确定的,必要时用于将查询关键词填充到预设固定长度。

16、进一步的,所述初始化基于向量和范围判定方案,具体为:

17、选择预设固定长度l和一个大素数p;

18、基于大素数p,分别为确切字符、填充字符和通配符定义不同的字符编码函数e。

19、进一步的,所述编码,是利用基于向量和范围判定方案中的字符编码函数e对关键词中的确切字符、填充字符和通配符分别进行编码。

20、进一步的,所述发送到对应的数据服务器上保存前,还利用shami r的阈值方案将生成的索引向量分成k份,其中,k为数据服务器的个数;

21、数据所有者将每个份额连同加密的身份标签发送到相应的数据服务器上。

22、进一步的,所述搜索结果,是匹配的索引关键词,根据索引关键词,提取关联的数据。

23、本发明第二方面提供了一种可验证的多用户模糊关键词搜索系统。

24、一种可验证的多用户模糊关键词搜索系统,基于向量和范围判定方案实现关键词的搜索,包括初始化模块、第一构建模块、第二构建模块、搜索模块和验证模块:

25、初始化模块,被配置为:验证中心初始化公共参数;

26、第一构建模块,被配置为:数据所有者将数据的索引关键词,编码成预设固定长度的索引向量,发送到对应的数据服务器上保存;

27、第二构建模块,被配置为:数据搜索者将查询关键词,编码成预设固定长度的查询向量,发送到对应的数据服务器上搜索;

28、搜索模块,被配置为:数据服务器根据本地存储的索引向量和接收到的查询向量,执行搜索,并将搜索结果传送给验证中心;

29、验证模块,被配置为:验证中心基于搜索结果,验证关键词是否匹配,并验证结果的正确性和完整性;

30、其中,所述向量和范围判定方案,是将每个关键词编码为固定长度的向量,并将索引向量和查询向量相加以获得和向量,通过确定和向量是否在固定范围内来决定关键词是否匹配。

31、本发明第三方面提供了计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如本发明第一方面所述的一种可验证的多用户模糊关键词搜索方法中的步骤。

32、本发明第四方面提供了电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如本发明第一方面所述的一种可验证的多用户模糊关键词搜索方法中的步骤。

33、以上一个或多个技术方案存在以下有益效果:

34、本发明提出了向量和范围判定(vsrd)匹配方案,可应用多个领域,如可搜索加密、私有信息检索等;结合向量和范围判定(vsrd)匹配方案和shamir阈值方案,本发明提出可验证的模糊关键词搜索方法,该方法能抵抗选择关键词攻击(cka)和内部关键词猜测攻击(ikga),还支持验证搜索结果的正确性和完整性;可以检测不超过k-1个云服务器执行的恶意操作,如伪造虚假中间结果等;另外,在保证准确性的同时实现了高效率,这一点已被实验所证实。

35、本发明附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1