一种保护隐私的时间序列相似度计算方法

文档序号:9417755阅读:363来源:国知局
一种保护隐私的时间序列相似度计算方法
【技术领域】
[0001] 本发明涉及一种数据隐私保护方法,特别是涉及一种保护隐私的时间序列相似度 计算方法。
【背景技术】
[0002] 时间序列的相似性度量是衡量两个时间序列的相似程度的方法;它是时间序列分 类,聚类,异常发现等诸多数据挖掘问题的基础,也是时间序列挖掘的核心问题之一。早期, 相似性度量算法大部分是欧式距离或者其方法的变体。然而,各类实验已经有力地表明,基 于欧式距离的时间序列相似度非常脆弱,并对于序列细节之处的波动干扰不能有效的进行 处理。时间序列相似度度量的另一经典算法动态时间弯曲算法(Dynamic Time Warping, DTW),尽管在算法复杂度上高于前者,但其能够很好的克服序列的波动带来的影响,并支 持不同长度序列之间的形状匹配。正是由于这种灵活性,DTW被广泛应用于科学,医学,工 业和金融业。
[0003] DTW算法主要用于时间序列的相似度计算,在保护隐私的时间序列相似度计算方 法中,两时间序列分别来自不同用户,为了保证用户的私有数据隐私安全,双方分别将各自 的时间序列发送到第三方,由第三方完成计算,并将结果反馈给用户,在第三方完全可信的 基础上,保护隐私的时间序列相似度计算得以实现。而在现实生活中,完全可信赖的第三方 这一假设通常是不成立的。由此可见,一个安全可靠的保护隐私的时间序列相似度计算方 法十分必要。

【发明内容】

[0004] 本发明主要解决的技术问题是:如何提供一种保护隐私的时间序列相似度计算框 架,在不泄露任一参与方私有数据信息的前提下,合作完成相似度计算。
[0005] 为解决上述技术问题,本发明采用的一个技术方案是:提供一种保护隐私的时间 序列相似度计算方法,包括以下操作步骤: 51 :将参与双方进行分组为第一参与方和第二参与方,并对第一参与方和第二参与方 分别赋予相应的第一时间序列和第二时间序列,同时,在所述第一时间序列中设置有η个k 维序列点,所述第二时间序列中设置有m个k维序列点; 52 :令第一参与方和第二参与方利用同态加密方式计算欧式距离平方值; 53 :令第一参与方和第二参与方实现欧式距离平方值的秘密共享; 54 :将第一参与方和第二参与方的相似度结果进行计算。
[0006] 在本发明一个较佳实施例中,在步骤S2中,利用加密系统中的加乘法同态性 质,将持有加密数据的第一参与方和第二参与方基于密文计算出欧式距离的平方值 £以),平方值$(( 1以密文形式由第一参与方或第二参与方持有。
[0007] 在本发明一个较佳实施例中,在步骤S2中,所述同态加密方式设置为通过加法同 态加密系统,所述第二参与方生成加法同态加密密钥对(反功,同时对第二时间序列进行 加密,并且将加密后的第二时间序列与同态加密密钥对(瓦D)发送至第一参与方。
[0008] 在本发明一个较佳实施例中,所述第二参与方同态加密密钥对(反功满足 公式
同时得出£)(识〇 * 2(?)) = ?κ + ?和

[0009] 在本发明一个较佳实施例中,在步骤S2中,所述第一参与方接收加密后的第二时 间序列与同态加密密钥对后,利用公式
计算出每对序列点之间加密后的欧式距离平方值,形成欧式距离平方值密文。
[0010] 在本发明一个较佳实施例中,在步骤S3中,所述第一参与方产生与欧式距离平方 值密文同等个数的随机数,同时利用随机数构成随机数向量通,利用加密系统的加乘法同 态性质计算tsor1,得到- r),并将结果发送给第二参与方; 所述第二参与方在接收到数据- 〃)后,利用私钥D解密,得到向量恶, 同时将元素转化为明文形式的i-r,其中,£? = 5>及。
[0011] 在本发明一个较佳实施例中,在步骤S4中,所述第一参与方和第二参与方相似度 结果进行计算时基于FGC框架进行。
[0012] 在本发明一个较佳实施例中,在步骤S4中,令第二参与方的随机数向量_和第一 参与方的向量_为输入后,基于FGC框架提供的加法计算单元和最小值选择单元,完成相 似度矩阵的填充,得出阵顶角元素,在填充计算过程中,数据均为加密状态。
[0013] 在本发明一个较佳实施例中,在步骤S4中,第一参与方或第二参与方对矩阵顶角 元素解密,得到两方的相似度明文结果。
[0014] 在本发明一个较佳实施例中,所述第一参与方或第二参与方可互换。
[0015] 本发明的有益效果是:基于算法实现的保护隐私的时间序列相似度比较方法不但 安全性高,适应性强,且对于其他时间序列相似度度量方法,如LCSS,EDR等的隐私保护实 现,有着极大的借鉴意义。
【附图说明】
[0016] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它 的附图,其中: 图1是本发明的一种保护隐私的时间序列相似度计算方法一较佳实施例的原理示意 图; 图2是本发明的一种保护隐私的时间序列相似度计算方法一较佳实施例的轨迹数据 示意图。
【具体实施方式】
[0017] 下面将对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施 例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通 技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范 围。
[0018] 本发明实施例提供如下技术方案。
[0019] 请参阅图1-2,在本实施例中提供一种保护隐私的时间序列相似度计算方法,所述 的保护隐私的时间序列相似度计算方法包括以下操作步骤: 51 :将参与双方进行分组为第一参与方和第二参与方,并对第一参与方和第二参与方 分别赋予相应的第一时间序列和第二时间序列,同时,在所述第一时间序列中设置有η个k 维序列点,所述第二时间序列中设置有m个k维序列点; 52 :令第一参与方和第二参与方利用同态加密方式计算欧式距离平方值; 53 :令第一参与方和第二参与方实现欧式距离平方值的秘密共享; 54 :将第一参与方和第二参与方的相似度结果进行计算。
[0020] 所述步骤S2中,利用加密系统中的加乘法同态性质,将持有加密数据的第一参与 方和第二参与方基于密文计算出欧式距离的平方值$以),平方值$以)以密文形式由第一 参与方或第二参与方持有。所述同态加密方式设置为通过加法同态加密系统,所述第二参 与方生成加法同态加密密钥对,同时对第二时间序列进行加密,并且将加密后的第 二时间序列与同态加密密钥对(及3)发送至第一参与方,所述第二参与方同态加密密钥对 满足公式所如*丑(《)=所??? + ?)和机哪)=,同时得出+ ? 和?(5〇?)5) =崎。所述第一参与方接收加密后的第二时间序列与同态加密密钥对(5,i)) 后,利用公式
计算出每对序列点之 间加密后的欧式距离平方值,形成欧式距离平方值密文。
[0021] 所述步骤S3中,所述第一参与方产生与欧式距离平方值密文同等个数的随机数, 同时利用随机数构成随机数向量·,利用加密系统的加乘法同态性质计算A(⑷Mtr 1, 得到-轉,并将结果发送给第二参与方。所述第二参与方在接收到数据_|?-導后, 利用私钥D解密1^1|^:-|1,得到向量s,同时将元素转化为明文形式的其中,
[0022] 所述步骤S4中,所述第一参与方和第二参与方相似度结果进行计算时基于FGC框 架进行。令第二参与方的随机数向量兹和第一参与方的向量_为输入后,基于FGC框架提 供的加法计算单元和最小值选择单元,完成相似度矩阵的填充,得出阵顶角元素,在填充计 算过程中,数据均为加密状态。第一参与方或第二参与方对矩阵顶角元素解密,得到两方的 相似度明文结果。其中,上述步骤中,所述第一参与方或第二参与方可互换。
[0023] 在一个具体实施例中,所述的保护隐私的时间序列相似度计算方法包括:两参与 方Alice和Bob,分别持有时间序列Q和C,其中,Q包含了 η个k维序列点,C包含了 m个k 维序列点,计算中保证双方数据信息无泄漏。
[0024] 我们假设Alice和Bob都是半诚实的,两方将严格的执行协议,但是计算过程中两 方也会尽可能的根据中间信息推测出更多的额外信息。
[0025] 具体包括如下操作步骤: (1)所述两端利用同态加密性质计算欧式距离平方值: 利用Pai 11 i er加密系统的加法同态性质,数据持有双方可以方便基于密文计算出欧 式距离的平方值,其值识:〇以密文形式由一方(如Bob)持有。
[0026] (2)所述两端实现欧式距离平方值的秘密共享: 所述欧式距离平方值密文持有端(如Bob),产生与密文同等个数的随机数,构成随机数 向量:皮,利用Paillier加密机制的加乘法同态性质计算,得到_系-_,并将 结果发送给所述Alice端。
[0027] 所述Alice端在接收到来自所述Bob端的数据后,借助私钥D解密 ,得到向量怒:,即元素为明文形式的。
[0028] (3 )所述两端基于FGC框架计算相似度结果: 以Alice端的随机数向量遞和Bob端的向量_为输入,基于FGC框架提供的加法计算 单元和最小值选择单元,可以顺利完成相似度矩阵的填充,在计算过程中,数据均为加密状 态,最终,只需对矩阵顶角元素解密,即可得到两方的相似度明文结果。
[0029] 优选地,步骤(1)中的所述同态加密方法通过加法同态加密系统生成加 法同态加密密钥对,且满足遂以及=玛叫%则 Si/φ ; m + 找认及 D{E{mf.) = ms。
[0030] 优选地,步骤(2)中的所述随机数向量龙必须足够大,以保证Alice端无法根据 滅雅测出任何关于欧式距离平方值#的信息。
[0031] 在另外一个具体实施例中,将两个参与方分别称为Alice和Bob,问题的形式化定 义如下:参与者Alice持有时间序列Q,其中Q包含了 η个d维序列点;参与者Bob持有时 间序列C,C包含了 m个d维序列点;在不向对方泄露轨迹也不借助第三方的情况下,计算出 两方序列的相似度值,并且双方同时知道比较的结果。
[0032] 其中,我们假设Alice和Bob都是半诚实的,两方将严格的执行协议,但
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1