一种可验证的加密搜索方法与流程

文档序号：14426328阅读：488来源：国知局

本发明涉及加密搜索领域，特别是涉及一种可验证的加密搜索方法。

背景技术：

云存储使得用户可以随时随地地存取数据，并且极大地方便了用户之间的数据共享。但与此同时，云存储带来了许多安全性问题，总体来说可以分为以下两类：

(1)可用性(availability)。要求云服务器保证数据不丢失，用户可以将云端作为数据中枢进行数据备份和同步。目前，一般的云服务提供商都采用了多副本的方式保障数据的可用性，即将数据的多个副本分别写入其他的存储节点，当一个节点发生故障时，其他节点上的数据继续提供服务，同时通过其他节点中的数据副本，快速恢复故障节点上丢失的数据。目前，针对数据可用性的相关学术研究包括数据拥有证明(Proof of Data Possession,PDP)以及数据可恢复性证明(Proof of Retrievability,PoR)。

(2)隐私性(privacy)。要求云服务器保证数据的隐私并且不泄露数据。目前，云服务提供商一般采用数据加密方式对隐私数据进行保护，但数据加密往往会导致数据可用性的降低，例如数据失去可搜索性，因此加密搜索(Searchable Encryption)应运而生。

加密搜索技术主要分为两类，一是对称加密搜索(Searchable Symmetric Encryption,SSE)，二是非对称加密搜索(Searchable Asymmetric Encryption，SAE)。由于非对称加密搜索的效率问题，目前的加密搜索领域对对称加密搜索关注较多。

对称加密搜索的模型如图1所示。用户自行对数据进行加密并上传到云端，与此同时，用户还需额外上传一个加密索引(index)使得云可以通过该索引来搜索数据。当用户需要搜索数据时，生成一个陷门(trapdoor)，该陷门与关键字相关，使得用户可以在不暴露关键字内容的情况下进行内容搜索。

加密搜索使得用户在保护数据隐私的同时，满足了其搜索需求，但加密搜索并不能保证搜索结果的正确性。也就是说，加密搜索的前提是云服务器是诚实的，即服务器会遵守与用户的协议来正确的执行搜索操作，然而实际应用中，云服务器往往是不可信的，例如，云服务器有可能为了节省计算开销和通信开销而返回少量搜索结果给用户，甚至有可能不返回搜索结果给用户。为了防止云服务器的不诚信行为，学术界又提出了可验证的对称加密搜索机制(Verifiable Searchable Symmetric Encryption,VSSE)。可验证的加密搜索允许用户对搜索结果进行验证，来检测服务器的不诚信行为，保障了加密搜索的正确性。

在可验证加密搜索中，由于服务器不诚信导致的安全性攻击主要可以分为以下两种：

数据新鲜性攻击(Data Freshness Attack)：在加密搜索中，数据新鲜性攻击是指服务器(攻击者)试图返回旧的搜索结果，而不是最新的搜索结果。例如，用Δ_n＝{δ₁,δ₂,…,δ_n}来表示旧版本的数据集，用δ_n+1来表示最新的数据集，则服务器返回的搜索结果是数据集δ_i的搜索结果，其中1≤i≤n。

数据完整性攻击(Data Integrity Attack)：在加密搜索中，数据完整性攻击是指服务器(攻击者)试图不让用户获取完整的搜索结果。例如，用τ来表示加密搜索中用户的搜索陷门，用户应该得到的搜索结果为F(τ)，而服务器返回的搜索结果为G(τ)，其中并且G(τ)可能为

数据新鲜性攻击仅存在于动态的加密搜索方案中，在数据库静态的情况下不存在。但现实中，动态数据库较为常见，因此防范数据新鲜性攻击是可验证加密搜索必须要解决的问题。数据完整性攻击不仅包括服务器少返回搜索结果的情况，还包括了服务器不返回搜索结果来规避结果验证的情况。该问题是很严重的一个问题，但目前很少有研究考虑到该问题。

以上背景技术内容的公开仅用于辅助理解本发明的发明构思及技术方案，其并不必然属于本专利申请的现有技术，在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下，上述背景技术不应当用于评价本申请的新颖性和创造性。

技术实现要素：

本发明所要解决的技术问题是：弥补上述现有技术的不足，提出一种可验证的加密搜索方法，可同时验证服务器不诚信导致的新鲜性攻击和完整性攻击，适用范围较广泛，且开销小。

本发明的技术问题通过以下的技术方案予以解决：

一种客户端执行的可验证的加密搜索方法，包括以下步骤：U1，客户端对文件集合计算倒排索引，对倒排索引中的每一个关键字计算一组键值对，其中，所述键为关键字对应的令牌，所述值为包含该关键字的文件的增量哈希和；将各组键值对插入MPT树结构中，得到初始化的MPT树；计算并存储各组键值对构建的MPT树结构的根哈希；U2，客户端上传所述初始化的MPT树至服务器，并在文件集合有更新时，上传更新的键值对至服务器；U3，客户端向服务器发送挑战令牌，接收服务器返回的搜索结果和用于验证的参考信息，所述参考信息为服务器根据挑战令牌对应的MPT树结构中的叶子节点存在与否提取的MPT树结构中节点的键和键值对；U4，客户端将发送的挑战令牌和所述参考信息进行匹配，根据匹配结果重构出MPT树结构的根哈希；U5，将重构出的根哈希与客户端存储的根哈希进行比对，如果相同，表明服务器无篡改行为，搜索结果准确；如果不相同，表明服务器有篡改行为，搜索结果不准确。

一种服务器执行的可验证的加密搜索方法，S1，服务器接收客户端上传的初始化的MPT树，并接收更新的键值对，根据所述更新的键值对更新初始的MPT树结构，得到最新的MPT树结构；S2，服务器根据客户端发送的挑战令牌，进行搜索，得到搜索结果；S3，服务器根据客户端发送的挑战令牌，判断所述挑战令牌对应的MPT树结构中的叶子节点存在与否，根据判断结果提取的MPT树结构中节点的键和键值对作为用于验证的参考信息；S4，服务器将所述搜索结果和参考信息发送给客户端。

一种可验证的加密搜索方法，涉及客户端和服务器；A1，客户端对文件集合计算倒排索引，对倒排索引中的每一个关键字计算一组键值对，其中，所述键为关键字对应的令牌，所述值为包含该关键字的文件的增量哈希和；将各组键值对插入MPT树结构中，得到初始化的MPT树；计算并存储各组键值对构建的MPT树结构的根哈希；A2，客户端上传所述初始化的MPT树至服务器，并在文件集合有更新时，上传更新的键值对至服务器；A3，服务器接收客户端上传的初始化的MPT树，并接收更新的键值对，根据所述更新的键值对更新初始的MPT树结构，得到最新的MPT树结构；A3，客户端向服务器发送挑战令牌；服务器根据客户端发送的挑战令牌，进行搜索，得到搜索结果；服务器根据客户端发送的挑战令牌，判断所述挑战令牌对应的MPT树结构中的叶子节点存在与否，根据判断结果提取的MPT树结构中节点的键和键值对作为用于验证的参考信息；服务器将所述搜索结果和参考信息发送给客户端；客户端接收服务器返回的搜索结果和用于验证的参考信息；A4，客户端将发送的挑战令牌和所述参考信息中的键进行匹配，根据匹配结果重构出MPT树结构的根哈希；A5，将重构出的根哈希与客户端存储的根哈希进行比对，如果相同，表明服务器无篡改行为，搜索结果准确；如果不相同，表明服务器有篡改行为，搜索结果不准确。

本发明与现有技术对比的有益效果是：

本发明的可验证的加密搜索方法，利用新型的MPT树数据结构并设计合理的机制来完善对数据新鲜性和数据完整性攻击的防御，尤其是可防御服务器返回空结果规避结果验证的情况。通过构建MPT，将用于结果验证的索引与加密搜索的索引进行分离，使得验证过程可与任何加密搜索方案得到的搜索结果相结合，可在广泛范围内提供结果验证服务。通过挑战令牌与参考信息中的键进行匹配、由匹配结果重构出MPT树结构的根哈希，由根哈希与客户端存储的根哈希进行比对验证，本发明完善地解决了云存储中可能存在的数据完整性攻击和数据新鲜性攻击，尤其可以检测到服务器恶意返回空结果来规避结果验证的情况。本发明的方法，服务器与客户端进行一轮通讯即可完成验证，通讯轮次少，开销小。综上所述，本发明不仅是一种通用的可验证加密搜索框架，而且以较低成本完善地解决了加密搜索中的结果验证问题。

【附图说明】

图1是现有技术的对称加密搜索模型的示意图；

图2a是本发明具体实施方式的搜索方法中将键值对插入MPT树结构的分支节点的一种情形时的示意图；

图2b是本发明具体实施方式的搜索方法中将键值对插入MPT树结构的分支节点的另一种情形时的示意图；

图2c是本发明具体实施方式的搜索方法中将键值对插入MPT树结构的叶子节点的一种情形时的示意图；

图2d是本发明具体实施方式的搜索方法中将键值对插入MPT树结构的叶子节点的另一种情形时的示意图；

图3是本发明具体实施方式的搜索方法中的倒排索引以及键值对的示意图；

图4是本发明具体实施方式的搜索方法中构建的MPT树结构的示意图；

图5a是本发明具体实施方式的搜索方法中用户搜索的令牌存在时的结果证明的示意图；

图5b是本发明具体实施方式的搜索方法中用户搜索的令牌不存在时的结果证明的示意图。

【具体实施方式】

下面结合具体实施方式并对照附图对本发明做进一步详细说明。

可验证加密搜索方案的系统框架包括client和server两个实体，其中client将与其数据对应的验证索引(index)上传给云；云服务器(server)为client提供存储、搜索和验证服务；client搜索后对云服务器返回的搜索结果进行验证。如下，在描述系统的工作流程之前，先给出本具体实施方式将会用到的标记以及部分概念的含义。

系统的工作流程定义如下：

KGen_C(1^k)→{K₁,K₂}:是由Client执行的概率计算操作。它的输入为一个安全参数，输出为对称密钥集合K₁,K₂。

Init_C(K₁,K₂,D)→{λ}:是由Client执行的初始化操作。它的输入为对称密钥集合K₁,K₂以及文件结合D，它的输出包括一个验证索引λ。Client将验证索引λ上传给服务器。

PreUpdate_C(K₁,K₂,f)→{τ_u}:是由Client执行的预更新操作。它的输入为对称密钥集合K以及待更新文件f，输出为更新令牌集合τ_u。Client将更新令牌集合上传给云。

Update_S(λ,τ_u)→{λ′,π}:是由Server执行的更新操作。它的输入为验证索引λ和更新令牌集合τ_u，输出为更新后的验证索引λ′和更新路径π。Server将更新路径发送给Client。

Update_C(rt,π)→{rt′}:是由Client执行的更新操作。它的输入为验证索引根哈希rt和更新路径π，输出为更新后的根哈希值。

Challenge_C(K₁,w)→{τ_w}:是由Client发起的挑战操作。它的输入是对称密钥集合K₁与关键字w，输出为该关键字对应的挑战令牌τ_w。Client将该令牌提交给云。

Prove_s(λ,τ_w)→{ρ}:是由Server执行的证明操作。它的输入是验证索引λ和一个挑战令牌τ_w，输出是结果证明ρ。服务器将该结果证明ρ发送给发起挑战的Client。

Verify_C(K₁,K₂,C_w,ρ,τ_w,rt)：是由Client执行的验证操作。它的输入为对称秘钥集合K₁,K₂，服务器返回的搜索结果C_w，参考信息ρ，挑战令牌τ_w以及Client保留的根哈希rt，最终Verify算法输出accept或者reject。

MPT表示默克尔帕特里夏树(Merkle Patricia Tree，MPT)。最早在以太坊(Ethereum)中提出，它将传统的Trie Tree和Merkle Tree结合，使得该树同时具有查找和验证的功能。MPT具有四种类型的节点，分别为空节点(Blank Node，BN)，叶子节点(Leaf Node，LN)，分支节点(Branch Node，BN)和扩展节点(Extension Node，EN)。其中空节点只是一个不存任何信息的节点，叶子节点存储了键值对(key-valuepair)，扩展节点也存储了键值对，但扩展节点的键值分别为其子节点的公共前缀和子节点的哈希值。分支节点有17个元素，其中前16个元素代表了该节点上有可能的分支，即16个十六进制数字，第17个元素为值域，当某一个关键字在该分支节点匹配完成时，该关键字对应的值就存储该元素中。MPT中的每一个节点都通过RLP进行了编码并对编码值再进行了哈希，在数据库中存储了每个节点的键值对，其中键为该节点RLP编码的哈希，值为该节点的RLP编码。这样每个节点可以通过他的哈希值被引用，就同时保证了MPT的可搜索性和可验证性。通过这种方式，MPT的根哈希成为了整棵树的指纹信息，根哈希的值由所有下层节点的哈希值所决定，任何节点的微小改变都会导致根哈希的值发生变化。

增量哈希函数(Incremental Hash，IH)最早由Bellare等人提出，并且被CS2方案所采用。IH函数是抗碰撞的，其定义为IH：{0,1}^*→{0,1}^l在IH函数中两个随机字符串的相加或相减不会产生碰撞。

如下将具体阐述本具体实施方式的加密搜索方法的流程。首先，将描述如何建立并更新验证索引，然后将给出生成结果证明的过程，并详细解释如何利用结果证明进行验证，以确保搜索结果的正确性。

1、建立验证索引

首先Client根据文件集合D计算出倒排索引Δ，其中倒排索引Δ是指关键字与包含该关键字的文件组成的索引。对倒排索引中的每一个关键字w_i，计算它的键值对，其中键是每一个关键字通过加密处理(例如伪随机函数)生成的令牌，而值是包含该关键字的所有文件的增量哈希和。通过将这些键值对插入MPT中来形成验证索引。

将键值对插入MPT树中时，包括插入键值对到一个分支节点或者叶子节点。

将键值对键入分支节点包括两种可能情况：第一种情况，键为空，此时直接将值存储到分支节点的第17个位置即可。如图2a所示，为插入【key，value】＝【“”，dog】到分支节点的示意图。第二种情况，键值不为空，此时生成一个新的叶子节点，将未匹配的键和值存储在该叶子节点中，并通过原始的分支节点指向该叶子节点。如图2b所示，为插入【key，value】＝【“345”，dog】到分支节点的示意图。

将键值对插入到一个叶子节点也包括两种情况：第一种情况带插入的键和叶子节点的键完全匹配，这时，只需要修改原有叶子结点的值为新的值即可。如图2c所示，为插入【key，value】＝【“123”，dog】到叶子节点的示意图。第二种情况插入的键和叶子节点的键不匹配，则需要利用能匹配的公共前缀生成扩展节点，然后利用分支节点的多分支特性，指向多个叶子节点来存储新的键值对【1200，dog】和原有叶子节点中的键值对【123，cat】。如图2d所示，为插入【key，value】＝【“1200”，dog】到叶子节点的示意图。

如下为实现上述建立验证索引的代码：

对验证索引的更新操作支持三种方式，即插入、删除和编辑文件，其中编辑文件相当于删除一个文件后再新增一个文件。对于插入新文件操作，首先解析该文件f，得到该文件包含的关键字集合W_f，对每一个关键字w_i∈W_f，通过伪随机函数生成它的令牌并将文件的伪随机结果同时上传给云。Server收到后通过更新令牌找到对应的叶子节点，并将(包含关键字K的文件f进行增量哈希运算得到的值)与原有的叶子节点的值相加。删除操作是同样的过程，只是将原有的叶子节点的值减去

需说明的是，“键”的称呼是对应于放在MPT树结点的称呼；令牌(或者叫陷门trapdoor)的称呼是对应于在传输过程中。一个加密后的关键字是一个令牌，存储到MPT中后，每一条从根节点到叶子节点的路径组成了一个令牌。也即，MPT从根到叶子的路径＝令牌＝加密后的关键字。

具体地，如图3所示，以包含文件f1～f4的文件集合D为例，计算倒排索引后，包含关键字w1、w2、w3和w4。图3中的第一栏与第二栏即为由关键字与包含该关键字的文件组成的倒排索引。第三栏为键，即各关键字对应的令牌(token)。第四栏为值，也即包含该关键字的文件的增量哈希和。将图3所示的键值对插入MPT树结构中，得到的MPT树结构即如图4所示。

客户端一般是将MPT树结构的初始结构上传给服务器，服务器存储该初始结构的MPT树结构后，当有更新时，接收更新的键值对，根据更新的键值对更新初始的MPT树结构，得到最新的MPT树结构。例如，当文件集合D中新增文件f5时，得到该文件包含的关键字集合为w2和w5。对每一个关键字，通过伪随机函数生成它的令牌并计算文件f5的增量哈希值对于每一个关键字，将键值对(令牌和文件f5的增量哈希值)同时上传给云。Server收到后，对于已经存在的关键字w₂，通过令牌找到对应的叶子节点，并将与原有的叶子节点的值相加。对于不存在的关键字w₅，则创建一个新的叶子节点，并将作为它的节点值。图3和图4中用浅色的示意了该更新过程。注意，服务器在更新完MPT后，需要将更新路径发回给客户端，以便用户进行验证并更新根哈希值。

搜索时，客户端向服务器发送挑战令牌。服务器根据客户端发送的挑战令牌，进行搜索，得到搜索结果。此外，服务器根据客户端发送的挑战令牌，在MPT树结构中寻找令牌对应的搜索路径，提取搜索路径上的键值对作为参考信息。

2、生成结果证明(即用于验证的参考信息)

Server根据用户提交的挑战令牌和验证索引λ来生成结果证明。首先Server根据挑战令牌来寻找搜索路径。如果对应的叶子节点存在，即用户查询的关键字存在，则服务器从叶子节点上一层节点开始，返回搜索路径上的“键”作为结果证明。对于分支节点，服务器还返回不在搜索路径上的键值对，从而便于后续重构出MPT树结构的根哈希。如果对应的终结的节点不存在，即用户查询的关键字不存在，则服务器需要从搜索终结的节点开始，向上返回搜索路径中的“键”作为结果证明，而对于搜索的终结节点，服务器返回完整的键值对。

如下为实现上述生成结果证明的代码：

客户端收到上述结果证明值后，即可执行验证操作。

3、进行结果验证

当Client收到了搜索结果及其对应的结果证明时，就可以开始验证数据的新鲜性和完整性。

首先，Client通过在搜索的时上传的关键字的令牌与结果证明中的键进行匹配。

如果结果证明中的键是挑战令牌的前缀，则设置remain_key存储挑战令牌中剩余的键。从根节点到叶子节点的路径事实上是一个完整的key，但前述结果证明中返回的是从根节点到叶子结点的上一层节点的路径，是不完整的，因此定义的remain_key用于指代令牌与结果证明中匹配完成后剩余的key。例如，以匹配图3中的令牌a5432时，服务器返回的结果证明包括BN2，EN1，BN1，这条路径只包含了a54，则与a5432匹配后，remain_key就是32。

如果结果证明中的键不是挑战令牌的前缀，那么设置remain_key就为

其次，重建MPT树结构的根哈希值。如果搜索结果和remain_key都为空集，则通过结果证明直接计算出根哈希值。如果二者都不为空，则首先通过搜索结果和remain_key生成叶子节点的哈希值，得到完整的结果证明值，然后通过结果证明值重建出根哈希值。除了这两种情况以外，就认为服务器故意返回了空结果，或服务器篡改了结果证明的内容。

最后，用户通过对比重建得到的根哈希和客户端存储保留的根哈希是否相等来判断数据新鲜性和完整性。如果二者相等，则验证通过，如果二者不相等，则说明服务器少返回了搜索结果或者服务器篡改了结果证明。

如下为实现上述结果验证的代码：

如下结合图3和图4的具体结构说明上述生成结果证明和验证步骤的具体过程。

一种情形：

当客户端想要搜索的关键字为w₂时，根据图3所示的对应关系，则提交的对应该关键字的挑战令牌为“a5432”。由于该关键字令牌在图4所示的MPT树(也即验证索引)中已经存在，服务器可以找到与该令牌对应的搜索路径为{BN1,EN1,BN2,LN3}。根据上述生成结果证明的过程，服务器则返回路径上除LN3以外的节点(从叶子节点的上一层节点BN2开始到根节点BN1)的键以及对于分支节点，其不在路径上的键值对一并作为结果证明。得到的结果证明如图5a中的C_n2,C_n1,C_n0所示。其中，结果证明C_n2对应分支节点BN2上的提取内容，也即键“4”，其值为空(因为未提取LN3的内容)，键“c”及其值LN4，键“f”及其值LN5。结果证明C_n1对应扩展节点EN1上的提取内容，也即键“5”及其值，其值即为C_n2。结果证明C_n0对应分支节点BN1上的提取内容，也即键“4”及其值LN1，键“a”及其值C_n1，键“f”及其值LN2。

提取得到上述结果证明值后，可以根据该证明和搜索结果f₂,f₅重新构建MPT树结构的根哈希。首先用户将令牌“a5432”与结果证明中的键进行匹配，发现“a54”为令牌的前缀，remain_key为“32”。用户根据“32”以及搜索结果f₂,f₅重新生成节点LN3，则可完善结果证明。这样，通过完善的结果证明中的内容，自底向上构建出根哈希的值。最后用户通过比较重构得到的根哈希和用户端保留的根哈希，来判断数据是否完整。假如服务器只返回了文件f₂，那么重构得到的根哈希将与正确的根哈希不匹配。

另一种情形：

当用户想要搜索的关键字对应的令牌为“a5433”时，根据图3和图4可知，该令牌在MPT树(也即验证索引)中不存在，但其搜索路径与“a5432”相同，不同的是，该令牌在LN3处发生了不匹配。此时，服务器提取从LN3节点开始自底向上的路径上的节点的键值对来生成结果证明，如图5b中的C_n3,C_n2,C_n1,C_n0所示。相对于图5a所示的情形，多提取了叶子节点LN3的键“32”以及值“H₂”作为C_n3。需说明的是，如为增加文件f5之前，则叶子节点的值为H2。如为更新增加文件f5之后，则叶子节点的值为H2+IH(C_K(f₅))。

用户在收到该结果证明以后，由于发现令牌“a5433”与结果证明中的键a5432无法匹配，因此remain_key被置空。则用户将直接根据结果证明重构根哈希。同样，通过与正确的根哈希进行对比，如果不相同，则说明服务器篡改了结果证明，产生了恶意行为。

综上，本具体实施方式通过Merkle Patricia Tree(MPT)构建索引，并以该索引为基础，提出了一种完善的结果验证机制。验证时，通过MPT树的根哈希进行验证。由于根哈希的第一次生成是由用户执行的，因此可以保证根哈希的正确性。随后的根哈希更新也由用户验证并更新，因此可以保证根哈希的正确性和新鲜性。结果验证过程中，是基于用户保留的根哈希来进行最终的比对判断，任何节点的改动，都会引起重构出的根哈希与用户保留根哈希无法匹配。因此可以保证验证环节的参照对象准确可靠，从而验证后确保用户拿到的搜索结果是新鲜并且完整的。

本具体实施方式的搜索方法，可以防止数据完整性攻击和数据新鲜性攻击。特别地，本方法可以在用户不保留关键字集合的情况下，检测出服务器故意返回空结果的情况。该方法是一种通用的结果验证方案，它将传统加密搜索方案作为黑盒，可以为多种加密搜索方案提供结果验证功能。此外，通过一次通讯轮次即可实现验证搜索，具有开销小的优势。综上，本方法具有开销小、实现简单以及不依赖于原有加密搜索方案的特性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下做出若干替代或明显变型，而且性能或用途相同，都应当视为属于本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2 3

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。