车联网云数据的防泄漏方法

文档序号:10515583阅读:291来源:国知局
车联网云数据的防泄漏方法
【专利摘要】本发明提出了一种车联网云数据的防泄漏方法,包括如下步骤:系统初始化,包括:车载终端采集车辆的车辆数据,并将所述车辆数据上传至云服务器;计算Bloom滤波器的最优设置策略,包括:设置所述Bloom滤波器的位置、所需比特和哈希函数的数量;设置Bloom滤波器,包括:对所述云服务器中的车辆数据进行网络基因提取,将车辆数据的网络基因设置在Bloom滤波器中;对所述车辆数据进行实时检测,包括:对输入的车辆数据进行CRC校验处理,将车辆数据的对应位置的数值与已设置好的滤波器进行匹配,如果不匹配,则立即停止数据流的传输;否则数据流继续传输。本发明保证预期检测结果的同时,降低了整个系统的内存开销。
【专利说明】
车联网云数据的防泄漏方法
技术领域
[0001] 本发明设及车联网技术领域,特别设及一种车联网云数据的防泄漏方法。
【背景技术】
[0002] 现有技术中存在很多基于网络端的模型解决数据泄露问题,包括:
[0003] (1)通过检测是否出现给定关键字与数据模式来阻止网络内部数据的非法窃取。
[0004] (2)设置信息黑名单,利用基于内容相似度的分类器来检测待访问数据与黑名单 内容是否一致,如果一致则中止数据访问操作。
[0005] (3)在分析用户在使用云计算时容易产生数据泄露的问题的基础上,提出一种新 的防泄露技术,该技术主要是检测HTTP消息,可检测到用户和云服务之间的数据扩散,截获 用户和云计算服务之间的文件传输并进行记录,严格执行数据扩散的预制策略。
[0006] (4)在数据网络边界设置一个代理进行检测,通过在哈希表中存储指纹来提高数 据传输的安全性,该方案的成功性取决于如下两个关键因素:1)指纹长度:为达到区分任何 两个不同数据内容的要求,指纹必须足够长。2)哈希表大小:哈希表大小应该足够大,W避 免在匹配过程中出现太多冲突,因为出现过多冲突,就必须进行多次对比和匹配,W确定数 据是否包含在数据库中。
[0007] 但是,上述方法要消耗较多的内存。对于云平台设备来说,降低内存使用是一个重 要的指标。

【发明内容】

[000引本发明的目的旨在至少解决所述技术缺陷之一。
[0009] 为此,本发明的目的在于提出一种车联网云数据的防泄漏方法,可W保证预期检 测结果的同时,降低了整个系统的内存开销。
[0010] 为了实现上述目的,本发明的实施例提供一种车联网云数据的防泄漏方法,包括 如下步骤:
[0011] 步骤S1,系统初始化,包括:
[0012] 车载终端采集车辆的车辆数据,并将所述车辆数据上传至云服务器;
[0013] 计算Bloom滤波器的最优设置策略,包括:设置所述Bloom滤波器的位置、所需比特 和哈希函数的数量;
[0014] 步骤S2:根据步骤S1中的初始化结果,设置Bloom滤波器,包括:对所述云服务器中 的车辆数据进行网络基因提取,将车辆数据的网络基因设置在Bloom滤波器中;
[0015] 步骤S3,对所述车辆数据进行实时检测,包括:对输入的车辆数据进行CRC校验处 理,将车辆数据的对应位置的数值与已设置好的滤波器进行匹配,如果不匹配,则立即停止 数据流的传输;否则数据流继续传输。
[0016] 进一步,在所述步骤S1中,所述车辆数据包括:车辆行驶数据、车体数据、车辆动力 数据、车辆安全数据、车辆环境数据。
[0017] 进一步,在所述步骤SI中,
[0018] 首先,设^^=0^〇')表示在到^'比特检测时所需的最佳比特数量,在最后一个检 测J点,即dtk处,有dk+l = Ψ = lmax-dtk,即dtk=lmax-dk+l,由于在dtk之后就不再检测,所W设 置f (Imax-Ψ ) =0且pQmax-ψ )=巫;
[0019] 然后,计算每个检测到j时,从j开始需要的比特数目
[0020] 最后,在滤波器设置的位置和检测概率一致的情况下,可求出所需的哈希函数的 数量和滤波器所需要的比特数目。令化J表示第j个检测位置,j = l,2,…,k。
[0021] 进一步,在所述步骤S2中,
[00剖根据最优化方法得到第j个检测点的位置化功化-1+h*,其中,j = 2,3, . . .,k且化1 =h,对所有的dtj点处进行网络基因的提取,包括:车辆数据的网络基于在文件的每预设比 特产生一个DGIDi,其中,DGIDi的产生采用32位的CRC校验方法。
[0023] 进一步,DGIDi的产生,包括如下步骤:
[0024] 对车辆数据进行分组,按照化^立置将整个内容分为k+1部分;
[0025] 32位的CRCi是第i部分的校验码,设CRCiWO为种子数,包括文件的第一部分,CRCi+i WCRCi为种子数,计算第i + 1部分的校验码,W此类推,计算处所有检测位置处的CRC校验 码。
[0026] 进一步,设置Bloom滤波器,包括:对获得的k+1个CRC校验码进行模m运算,将数值 与Bloom滤波器检测位置一一关联,其中,m表示滤波器所包含的比特总数。
[0027] 根据本发明实施例的车联网云数据的防泄漏方法,利用网络基因唯一标示数据信 息的特征和Bloom滤波器的快速检索和较少的内存开销特性,并利用最优规划的方法计算 滤波器的最佳设置,保证预期检测结果的同时,降低了整个系统的内存开销,节约了云平台 中的内存使用。
[0028] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变 得明显,或通过本发明的实践了解到。
【附图说明】
[0029] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得 明显和容易理解,其中:
[0030] 图1为根据本发明实施例的车联网云数据的防泄漏方法的流程图。
【具体实施方式】
[0031] 下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同 或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描 述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0032] 如图1所示,本发明实施例的车联网云数据的防泄漏方法,包括如下步骤:
[0033] 步骤S1,系统初始化,包括:
[0034] 首先,车载终端采集车辆的车辆数据,并将车辆数据上传至云服务器。
[0035] 在本发明的一个实施例中,车辆数据包括:车辆行驶数据、车体数据、车辆动力数 据、车辆安全数据、车辆环境数据。
[0036] 具体地,车载终端采用模块化设计理念,由智能忍片,中央处理模块,通信模块,定 位模块等模块组成,其内部嵌有多种传感器,可对车辆所有静态和动态信息进行感知和监 控。运些数据信息设及车辆行驶和车体,动力,车辆安全,环境等与具体车辆相关的一些属 性。将车辆在运行中产生的相关数据,如车辆行驶的历史轨迹,访问的路线等,进行动态实 时采集,实现车辆驾乘等智能感知。车载终端将运些与车辆相关的数据利用通信网络上传 至云设备。
[0037] 然后,在预先设定的检测时延的前提下,计算Bloom滤波器的最优设置策略,包括: 设置Bloom滤波器的位置、所需比特和哈希函数的数量。
[0038] 下面首先对Bloom滤波器进行介绍。
[0039] Bloom滤波器是一种特殊的数据结构,相比较其他的数据结构,其主要应用于对信 息进行检索。原理是利用标识位来表示数据库的数据内容信息,在进行数据查找和检索时, 利用标识位是否一致来判断数据库中是否包含该信息。由特征比特向量和哈希函数两部分 组成。
[0040] Bloom滤波器在进行数据检索时,包括W下Ξ个步骤:
[0041 ] 1)初始化:滤波器的m位特征比特向量都为0。
[0042] 2)添加数据元素:将数据集合中每一个数据项,计算k个哈希函数的数值,然后将 该函数值映射到特征比特向量的对应位置中。
[0043] 3)数据检索:将待查询数据计算k个哈希函数数值,若k若是k位有1位或者1位W上 为0时,则原数据集合中一定不包含待查询数据。若k个比特位都是1,则原数据集合中极有 可能包含待查询数据。当不在集合中的元素 X被认为在集合中时,Bloom滤波器发生假阳性 误称,运个概率称为错误检测概率。错误检测概率P满足如下关系:
[0044] 下面对设置Bloom滤波器的位置进行说明:
[0045] Bloom滤波器的设置包括检测位置的设置和总比特数的设置。对于一个字符串进 行周期检测时,将每一位都进行检测是不现实的。为达到上述目的,可W采用其他措施,如 基于概率的方案。
[0046] 在进行分析之前,首先讨论在固定检测概率时所需的内存使用量。由上面的分析 可知,对给定字符串a比特到达之后进行检测,若前a个比特匹配失败,则字符串与给定的信 息肯定是前a比特不匹配的;反之,则运个字符串W-定的概率与给定的信息匹配,称运个 概率为错误检测概率。由此,该技术更加关注于检测时延,定义检测时延为用户在进行数据 访问时,在被禁止访问时,已经访问的数据比特数和用户实际上可W访问的比特数之差,记 为L。很显然,L越小越好。在本发明中,为降低系统复杂性,只将字符串在指定的位置l<ti< ?2<…<tp进行检测。
[0047] 采用Bloom滤波器主要是为了减轻计算开销和内存开销,从而降低整个系统的复 杂性。为分析实现不同的检测概率pj,所需的比特数,先分析在给定错误检测概率为P的情 况下,假设系统中滤波器有m个比特,q个哈希函数,系统中有η个字符串,则使用q个哈希函 数的滤波器的错误检测概率为:
[004引

[0049]需要确定哈希函数的数量q来使得内存开销最小,即m的数值最小。将上式进行转 化,得,
[(K)加] 2)
[0051] 为简化计算,令
则式(2)可表示为:
、' (3)
[0化2]
[0化3] 在式(3)中,11 = 0.5,m最小,此时
[0化4] 当q = l,由式(2)得出
[0055]在上述实施例中,给出了检测时延和检测概率的定义,推算出了给定检测概率条 件下所需的比特数和哈希函数的数目,得出了检测时延L与系统保密性之间的关系,L越大, 则保密性越差。为进一步降低系统复杂度,只将长度1为字符串在指定的位置1含化パ化2<… <化1<<1进行检测。
[0056] 对于字符串S,其长度为1,有如下定义:di = dti,di = dt广dti-1,即,di表示第i次检 ii和第i-1次检测之间的比特数,其中1 = 2,3,。,,4且(11^+1 = 1-化。一般情况下,检测时延1 由开始检测出字符串不匹配的点的位置来决定的。
[0057] 使用0(s,k)表示字符串S在比特k与原有数据不一致地检测时延。0(s,k)是一个 随机变量,所WE(0(s,k))表示S在比特k处不匹配的检测时延的期望值,该期望值的最大 值设为max压(Θ (s,k)),规定期望检测时延的最大值为Ψ,则需ma祉(Θ (s,k)) < Ψ。
[0058] 滤波器在检测位置设定的比特总数决定该处的检测概率。由于在dtk之后,就不再 进行检测,所WE( Θ (S,化k+1)) = dk+i,应小于等于Ψ,为简便运算,取等于,即dk+i = Φ。
[0059] 对于化k-i检测点,在该点之后变为不匹配的检测时延期望为:E(0(s,化k-i+l)) = dkpk+ (1 -pk) (dk+dk+i) = dk+ (1 -pk)Φ,其中,pk为 S在dtk处检测概率。同样使E ( Θ (S, dtk-i+1)) =Ψ,得dk=piJ。继续重复上述步骤,可W得到:
[0060] dj = pj4, j = l,2,...,k (4)
[0061] 上式描述了检测点和检测概率之间的关联。
[0062] 在滤波器位置部署和在给定检测概率P的前提下,每个字符串所需的最小长度和 检测点之间距离的关系。下面介绍如何选择检测位置,才能使系统的内存需求量最小。检测 位置是由字符串的比特数量分布决定。
[0063] 首先讨论数据库内字符串所包含的比特总数相等且都为len的简单场景。假设字 符串的总数为η。抑
与(6.4)式结合,有
[0064]
[0065] 由于所有的字符串等长,即所有的Pj相同,记为Ρ。则代入式(5)中,得到:
[0066]
I所需的比特总数量为
[0067]
[006引由式(6)可知,C是k的递减函数。考虑单一哈希函数,由上述得,
生已知检测时延Ψ的前提下,若要使C的值最小,则将C对k微 分,令导数为0,得
得此时内存量最小为:
[0069]
[0070] 非等长情况下,所需的最小内存量。在上面的讨论中,字符串等长的情况下,即每 次检测的位数为len比特,贿
r于字符串包含的比特数目非一致的情况 下,使用试探方案,让所有检测位置处检测概率等于i即对所有的j,j = l,2,-1,4,有 C η f/'二 7,
[0071] 监测点数k为
则需要的检测比特总数C 是
为数据库中所有字符串的总比 特数,即所有字符串的比特总数。代入得,- 1心整理得, C ,
[0072]
[0073] 上式表示在字符串长度不一致时,需要的内存量。
[0074] 由W上分析可得,字符串长度不一致时将对检测位置影响很大,而检测位置不一 致时,会导致检测的难度增大。假设在数据库中有N(l)个长度超过1比特的字符串,为在1处 得到给定检测概率P,所需的比特数为:
[0075]
[0076] 为降低c(l,P),则NQ)应该变小。如何得到所需的最优比特数,提出一种动态规划 算法,算法代码如下:
[0077] f〇r( i = 1 ; i Umax; i++)/7第一阶段 [007引 f(i)=0;
[0079] f(lmax-W)=〇;
[0080] pQmax-W) =巫;
[0081 ] f〇r( i = lmax-1-Ψ ; i >0; i -) {//第二阶段
[0082]
[008;3] g* = arg f(j);
[0084] p(j)=j+g*;
[0085] }
[00化]j = i;//第s阶段
[0087] dtj = p( 1);
[008引 while(p(dtj)辛巫){
[0089] temp = p(dtj);
[0090] j++;
[0091 ] dtj = temp;
[0092]
[0093]
[0094] 在上述算法中,预先设定,f(j)表示在到j比特检测时所需的最佳比特数量;p(j) 为辅助函数,表示在j比特之后第一个要进行检测的位置。有Ξ个阶段:各阶段任务表示如 下:
[00M]首先,设^^=〇^〇')表示在到^'比特检测时所需的最佳比特数量,先考虑从后向 前,推导f ( j )具体表式。在最后一个检测点,即dtk处,有dk+1 = Ψ = Imax-dtk,即dtk = Imax- dk+1,由于在化k之后就不再检测J,所W设置f(lmax-W)=0且P(lmax-W) =巫。
[0096]然后,计算每个检测到j时,从j开始需要的比特数目,= min, y I,,
巧于前一项当在j+h处进行检测时,两个检测点之间的间隔d/=j+ g-j = g,又d'=p'W,可得= P'表示在j+h处的检测概率,所W该项表示j处放置滤波 器,j+h处所需比特总数。对于第二项表示从j+h开始往后进行检测所需的比特数目。其中,h 不能大于Ψ,否则将导致检测时延的期望大于Ψ。
[0097] 为求得在j之后下一个的最佳检测点,令h ^ = a r g f ( j ) = a r g
11^表示让^如取最小值时11的值。则在別立置之后下一个进行 , 检测的位置是p(j) = j+l·^
[0098] 最后,输出不同文件对应的滤波器设置的位置和所需的比特大小。在滤波器设置 的位置和检测概率一致的情况下,可求出所需的哈希函数的数量和滤波器所需要的比特数 目。令dtj表示第j个检测位置,j = l,2,…,k。
[0099] 步骤S2:根据步骤S1中的初始化结果,设置Bloom滤波器,包括:对云服务器中的车 辆数据进行网络基因提取,将车辆数据的网络基因设置在Bloom滤波器中。
[0100] 下面对网络基因进行说明。
[0101] 利用网络基因标示用户待访问的数据内容,可W唯一表示数据内容;利用Bloom滤 波器的快速检索特点,将网络基因存储在Bloom滤波器中,两者相结合可W提高数据在访问 时的安全性。
[0102] 网络基因,是在现代信息领域中表征个体唯一的身份特征标识,具有全球移动识 别能力,唯一性代表网络终端或者网络实体特性的特点。利用网络基因表征网络内组成部 分具有如下特点:
[0103] 1)客观性。任何网络终端或者网络实体的属性包括个体自身的特征参数,可W提 供的功能种类W及参与通讯时的功能参数等,都是客观存在的,或者在个体产生之时已经 预先定义好的,不受人为控制和更改的。基于运些天然的参数构成的网络基因能够稳定的、 唯一代表个体属性的特征,就像由运些参数构成的向量正交基,是唯一的,客观存在的,只 是系数不同而已。网络基因中包含的各种属性信息元素在物理信息空间中是客观存在的。 因此,网络基因是客观存在的,具有客观性。
[0104] 2)唯一性。每个网络终端或者网络实体的自身特征属性,功能特性和功能参数等 特征属性参数都是唯一确定的,任何两个不同的个体不可能具有相同的特征属性参数,而 网络基因是根据运些特征属性参数进行相关操作提取出来的,所W可W唯一的代表网络中 的每个个体。
[0105] 3)隐私性。网络基因是面向用户体验的。基于运种客观、唯一的同电子身份证一样 的网络基因,只有自身网络基因被目标终端正确识别,才能感知或者执行业务和通讯需求。 非目标终端的网络基因,因而不会被其他用户或业务识别,目标终端有接受和拒绝与该终 端共享服务的权利和自由。
[0106] 4)安全性。网络基因具有类似DNA的客观性、唯一性和隐私性的特征,不同个体具 有不同的网络基因。目标用户或业务能够设别并同步产生该网络基因;对于非目标用户或 业务而言,该网络基因是不可识别的。网络基因的"基因化"结构,基因解密是不可计算NP问 题。因此,基于网络基因式的基因加密无论是对用户还是对业务都是安全的,可W保证用户 信息的安全性。
[0107] 系统进行初始化过程中,根据最优化方法得到第j个检测点的位置dtj为dtw+h*, 其中,^' = 2,3,...,4且扣1 = }1,对所有的化^点处进行网络基因的提取,包括:车辆数据的网 络基于在文件的每预设比特产生一个DGIDi,其中,DGIDi的产生采用32位的CRC校验方法。 [010引为达到设定的L比特检测时延,数据的DGID应该在文件的每L byte产生一个 DGIDi,DGIDi的产生采用32位的CRC。随着文件的增大,DGID的数目不断增大,因为每一个 DGIDi要包括从文件开头到当前位置的所有比特息。具体的实现步骤如下:
[0109] 首先,对车辆数据进行分组,按照化^立置将整个内容分为k+1部分;
[0110] 然后,32位的CRCi是第i部分的校验码,设CRC拟0为种子数,包括文件的第一部分, CRCi+iWCRCi为种子数,计算第i+1部分的校验码,W此类推,计算处所有检测位置处的CRC 校验码。因此,在前i+1部分的数据内容变化,将会导致CRCw部分的校验码变化。
[0111] 在本发明的一个实施例中,设置Bloom滤波器,包括:主要是在滤波器的相应位置 上的值进行设定,W网络基因的形式来唯一的标示数据。对获得的k+1个CRC校验码进行模m 运算,将数值与Bloom滤波器检测位置一一关联,其中,m表示滤波器所包含的比特总数。
[0112] 步骤S3,对车辆数据进行实时检测,包括:对输入的车辆数据进行CRC校验处理,将 车辆数据的对应位置的数值与已设置好的滤波器进行匹配,如果不匹配,则立即停止数据 流的传输;否则数据流继续传输。
[0113] 根据本发明实施例的车联网云数据的防泄漏方法,利用网络基因唯一标示数据信 息的特征和Bloom滤波器的快速检索和较少的内存开销特性,并利用最优规划的方法计算 滤波器的最佳设置,保证预期检测结果的同时,降低了整个系统的内存开销,节约了云平台 中的内存使用。
[0114] 在本说明书的描述中,参考术语"一个实施例"、"一些实施例"、"示例"、"具体示 例"、或"一些示例"等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特 点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不 一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可W在任何 的一个或多个实施例或示例中W合适的方式结合。
[0115] 尽管上面已经示出和描述了本发明的实施例,可W理解的是,上述实施例是示例 性的,不能理解为对本发明的限制,本领域的普通技术人员在不脱离本发明的原理和宗旨 的情况下在本发明的范围内可W对上述实施例进行变化、修改、替换和变型。本发明的范围 由所附权利要求极其等同限定。
【主权项】
1. 一种车联网云数据的防泄漏方法,其特征在于,包括如下步骤: 步骤S1,系统初始化,包括: 车载终端采集车辆的车辆数据,并将所述车辆数据上传至云服务器; 计算Bloom滤波器的最优设置策略,包括:设置所述Bloom滤波器的位置、所需比特和哈 希函数的数量; 步骤S2:根据步骤S1中的初始化结果,设置Bloom滤波器,包括:对所述云服务器中的车 辆数据进行网络基因提取,将车辆数据的网络基因设置在Bloom滤波器中; 步骤S3,对所述车辆数据进行实时检测,包括:对输入的车辆数据进行CRC校验处理,将 车辆数据的对应位置的数值与已设置好的滤波器进行匹配,如果不匹配,则立即停止数据 流的传输;否则数据流继续传输。2. 如权利要求1所述的车联网云数据的防泄漏方法,其特征在于,在所述步骤S1中,所 述车辆数据包括:车辆行驶数据、车体数据、车辆动力数据、车辆安全数据、车辆环境数据。3. 如权利要求1所述的车联网云数据的防泄漏方法,其特征在于,在所述步骤S1中, 首先,设f( j) = 〇,f (j)表示在到j比特检测时所需的最佳比特数量,在最后一个检测 点,即dtk处,有dk+l = Ψ =lmax-dtk,即dtk=lmax-dk+l,由于在dtk之后就不再检测,所以设置f (lmax-Ψ ) =0且P(lmax-W ) = Φ ; 然后,计算每个检测到j时,从j开始需要的比特数目 最后,在滤波器设置的位置和检测概率一致的情况下,可求出所需的哈希函数的数量 和滤波器所需要的比特数目。令dtj表示第j个检测位置,j = l,2,…,k。4. 如权利要求1所述的车联网云数据的防泄漏方法,其特征在于,在所述步骤S2中, 根据最优化方法得到第j个检测点的位置dt」为dtn+h*,其中,j = 2,3,. . .,k且dti = h, 对所有的dk点处进行网络基因的提取,包括:车辆数据的网络基于在文件的每预设比特产 生一个DGIDi,其中,DGIDi的产生采用32位的CRC校验方法。5. 如权利要求4所述的车联网云数据的防泄漏方法,其特征在于,DGIDi的产生,包括如 下步骤: 对车辆数据进行分组,按照dk位置将整个内容分为k+Ι部分; 32位的CRCi是第i部分的校验码,设CRQWO为种子数,包括文件的第一部分,CRCi+1& 〇?(^为种子数,计算第i+1部分的校验码,以此类推,计算处所有检测位置处的CRC校验码。6. 如权利要求5所述的车联网云数据的防泄漏方法,其特征在于,设置Bloom滤波器,包 括:对获得的k+Ι个CRC校验码进行模m运算,将数值与Bloom滤波器检测位置一一关联,其 中,m表示滤波器所包含的比特总数。
【文档编号】H04L1/00GK105871932SQ201610457312
【公开日】2016年8月17日
【申请日】2016年6月22日
【发明人】张钰峰, 程新, 庞立君
【申请人】江苏迪纳数字科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1