1.一种基于本地差分隐私的活动时序轨迹挖掘的方法,设有采集数据的客户端和本地客户端,其特征是该方法包括以下步骤:
步骤一:采集数据的客户端在本地将采用客户端算法的原始隐私数据加噪声,使之满足隐私保护预算参数为
(一)首先需要设置以下参数的值,第一个参数为p(p<0.5),该参数被称之为翻转概率,第二个参数为事件界定时间间隔dt,第三个参数为次序固定的事件数据记录集中元素个数m;
(二)随机从本地记录的事件集中选取一个元素e(ti),并记录该事件发生的时间为ti;
(三)随机从本地记录的事件集的[e(ti),e(ti+dt)]中选取另一个事件元素e(tj);
(四)将序列(e(ti),e(tj))转化为时序矩阵t,具体说明如下:
首先初始化一个m*m的矩阵,将tij,即第i行第j列的元素置为1,即将tij置为1,其它元素全部置为0,该矩阵即为时序矩阵,如下矩阵所示:
(五)采用随机应答的方法对时序矩阵进行加噪处理,即将每一位以概率p进行翻转,也就是0变1,1变0;
步骤二:服务端从客户端收集到数据后,利用服务端算法对数据进行解析,进而统计出用户活动时序轨迹,服务端收到客户端发来数据后,进行数据处理,包括如下步骤:
(一)初始化一个m*m的矩阵a,并将其元素全部设置为0;
(二)依次遍历n个时序矩阵,然后每次遍历一个矩阵时,然后对于矩阵中a的每个元素aij,作如下的计算:
(三)返回矩阵h,矩阵h的元素就是客户端总体上发生的每个事件元素时序对的统计期望,该期望等于原始矩阵的期望,即还原了客户端整体的用户行为统计情况。