基于设备指纹识别的感知数据可信度评估方法及系统

文档序号:30961582发布日期:2022-07-30 13:41阅读:209来源:国知局
基于设备指纹识别的感知数据可信度评估方法及系统

1.本技术涉及感知数据可行度评估技术领域,具体而言,涉及一种基于设备指纹识别的感知数据可信度评估方法及系统。


背景技术:

2.移动群智感知技术能够利用智能设备闲置的感知资源和计算资源,让用户以参与者身份收集感知任务要求的传感器数据,从而解决发布者的数据收集问题。但在实际的移动群智感知过程中,感知数据的质量无法得到保证。恶意攻击者为破坏移动群智感知平台的感知功能,违规用户为快速获取任务激励从而提交重复或者伪造的低质量感知数据。低质量感知数据的提交,将会降低感知任务数据聚合结果的精确性,干扰激励分配的公平性,同时影响感知平台的公信力,所以对感知数据进行可信度分析是保证移动群智感知平台正常运行的重要需求之一。恶意攻击者上传的低质量感知数会干扰数据聚合过程,而可信度评估技术能够对感知数据内容进行一定程度的筛选。越接近现实真相的感知数据可信度越高,而可信度越低数据越可能是低质量或者伪造的数据。
3.现有的感知数据可信度评估研究忽略了当恶意攻击者数量超过参与任务的用户数量一半时产生的可信度评估偏差。


技术实现要素:

4.要解决的技术问题
5.本技术的主要目的在于提供一种基于设备指纹识别的感知数据可信度评估方法及系统,该方法能够在过半感知数据都是在同一设备上提交的低质量伪造数据前提下,提高可信度评估结果精确度。
6.根据本技术实施例一个方面,提供了一种基于设备指纹识别的感知数据可信度评估方法,包括:
7.步骤s1:获取群智任务参与者提交的所有感知报告,所述感知报告包括用户id、用户声望属性值、感知数据以及指纹数据文件;
8.步骤s2:将所述指纹数据文件输入到lstm神经网络中生成设备指纹,进而得到初始信任值;
9.步骤s3:对所述感知数据进行处理得到数据相似度;
10.步骤s4:根据所述数据相似度、所述初始信任值和所述用户声望属性值计算得到所述感知数据的可信度。
11.进一步地,在所述步骤s1中,
12.所述用户id为每份所述感知报告持有者的标识;
13.所述感知数据是用户完成感知手动填写或者提交的数据;
14.所述用户声望属性值为参与者在接受感知任务之前的声望值;
15.所述指纹数据文件是群智应用通过操作系统提供的api直接获取的加速度传感器
和陀螺仪传感器数据,再经过应用处理后打包形成的文件。
16.进一步地,所述步骤s2包括:
17.步骤s21:通过采样的方法,对所述指纹数据文件中的加速度传感器和陀螺仪传感器数据将时间戳对齐;
18.步骤s22:将所述指纹数据文件处理成符合lstm指纹特征提取网络输入格式的15
×
6的数据批次;
19.步骤s23:对设备指纹的特征进行提取,统计具有相同设备类标识符的所述感知报告并计算得到所述初始信任值。
20.进一步地,在所述步骤s23中,所述初始信任值的计算公式为:
[0021][0022]
其中,fp
id
为所述指纹数据文件,q是统计函数,γ为可信度级别的划分因子,σ为统计量的容错因子,itv为所述初始信任值。
[0023]
进一步地,在所述步骤s3中,所述数据相似度的计算公式为:
[0024][0025]
其中,s为所述数据相识度计算函数,x和y代表不同两份所述感知报告,xn和yn表示所述感知报告的数据第n个维度上的值。
[0026]
进一步地,在所述步骤s4中,所述可信度的计算公式为:
[0027][0028]
其中,t为可信度,r为所述用户声望属性值,s是数据相识度计算函数,itv是所述初始可信度值,d为所述感知数据,e为常数,n为设备的类标识符数。
[0029]
根据本技术实施例的另一方面,提供了一种基于设备指纹识别的感知数据可信度评估系统,包括:
[0030]
读取模块,用于获取群智任务参与者提交的所有感知报告,所述感知报告包括用户id、用户声望属性值、感知数据以及指纹数据文件;
[0031]
第一数据处理模块,用于将所述指纹数据文件输入到lstm神经网络中生成设备指纹,进而得到初始信任值;
[0032]
第二数据处理模块,用于对所述感知数据进行处理得到数据相似度;
[0033]
第三数据处理模块,用于根据所述数据相似度、所述初始信任值和所述用户声望属性值计算得到所述感知数据的可信度。
[0034]
进一步地,所述初始信任值的计算公式为:
[0035][0036]
其中,fp
id
为所述指纹数据文件,q是统计函数,γ为可信度级别的划分因子,σ为统计量的容错因子,itv为所述初始信任值。
[0037]
进一步地,所述数据相似度的计算公式为:
[0038][0039]
其中,s为所述数据相识度计算函数,x和y代表不同两份所述感知报告,xn和yn表示所述感知报告的数据第n个维度上的值。
[0040]
进一步地,所述可信度的计算公式为:
[0041][0042]
其中,t为可信度,r为所述用户声望属性值,s是数据相识度计算函数,itv是所述初始可信度值,d为所述感知数据,e为常数,n为设备的类标识符数。
[0043]
相对于现有技术而言,本技术的技术方案至少具备如下技术效果:
[0044]
该方法可以在任务发布者发布感知任务时,利用平台收集指定数量的感知报告。接下来使用“指纹数据文件”输入到lstm神经网络中生成设备指纹,得到初始信任值。然后,将所有用户提交的“感知数据”计算得到数据的相似度。最后根据数据相似度、初始可信度值和用户声望属性值计算得到最终的感知报告可信度。也即是说,该方法能够在过半感知数据都是在同一设备上提交的低质量伪造数据前提下,提高可信度评估结果精确度。
附图说明
[0045]
此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
[0046]
图1为本技术实施例公开的基于设备指纹识别的感知数据可信度评估框架结构图;
[0047]
图2为本技术实施例公开的基于设备指纹识别的感知数据可信度评估方法流程图;
[0048]
图3为本技术实施例公开的结合可信度评估的群智感知任务流程图;
[0049]
图4为本技术公开的感知报告组成图;
[0050]
图5为本技术实施例公开的基于设备指纹识别的感知数据可信度评估系统的示意图。
具体实施方式
[0051]
需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
[0052]
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
[0053]
除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本技术的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明
书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0054]
参见图1和图2所示,根据本技术的实施例,提供了一种基于设备指纹识别的感知数据可信度评估方法,该方法分为两个阶段,“指纹识别阶段”和“可信度评估阶段”。在“指纹识别阶段”,感知报告中附带的“指纹数据文件”在经过步骤处理后会输入到lstm神经网络中生成设备指纹,得到初始信任值。然后进入到“可信度评估阶段”,将所有用户提交的“感知数据”计算得到数据的相似度。最后根据数据相似度、初始可信度值和用户声望属性值计算得到最终的感知报告可信度。
[0055]
如图3所示,表现了一个完整的移动群智感知过程。任务发布者会根据自身的数据收集的需求在群智感知平台上发布一个感知任务。感知任务会被参与者领取并开始进行感知行为。在提交任务时,参与者会将自身感知得到的数据输入,并结合设备特定传感器数据和用户账户信息形成感知报告。
[0056]
该方法的具体步骤如下:
[0057]
步骤s1:获取群智任务参与者提交的所有感知报告,感知报告包括用户id、用户声望属性值、感知数据以及指纹数据文件。
[0058]
参见图4所示,在该步骤中,每份感知报告组成包含四个部分,其中“用户id”唯一地表示每份报告持有者的标识,用以区分报告产生者。“用户声望属性值”表示参与者在接受感知任务之前的声望值,表示之前该用户综合可信赖程度,并将在解决现在的感知任务后由其贡献更新。“感知数据”是用户完成感知手动填写或者提交的数据,是任务要求、需要用户完成相应的感知行为,并最终通过手动输入提交的数据。“指纹数据文件”是群智应用通过操作系统提供的api直接获取的加速度传感器和陀螺仪传感器数据,再经过应用处理后打包形成的文件。感知报告达到任务需求数量后,会开始进入到如图2中的步骤s2中。
[0059]
步骤s2:将指纹数据文件输入到lstm神经网络中生成设备指纹,进而得到初始信任值。
[0060]
该步骤包括步骤s21:通过采样的方法,对指纹数据文件中的加速度传感器和陀螺仪传感器数据将时间戳对齐。
[0061]
该步骤还包括步骤s22:将指纹数据文件处理成符合lstm指纹特征提取网络输入格式的15
×
6的数据批次。
[0062]
还步骤还包括步骤s23:对设备指纹的特征进行提取,统计具有相同设备类标识符的感知报告并计算得到初始信任值。
[0063]
在将“指纹数据文件”输入到lstm指纹特征提取网络中后,本发明将神经网络的最后一个隐藏层,1
×
h向量,作为传感器独特的内在特征。为了将向量转换为设备的唯一标识,使用softmax层将传感器的特征向量映射到n个标签,即设备的类标识符数。标记所有报告后,统计具有相同设备类标识符的感知报告。最后使用初始信任值表示设备指纹阶段的结果,该初始信任值的计算公式为:
[0064]
[0065]
其中,fp
id
为指纹数据文件,q是统计函数,γ为可信度级别的划分因子,σ为统计量的容错因子,itv为初始信任值。
[0066]
步骤s3:对感知数据进行处理得到数据相似度。
[0067]
本发明考虑感知报告提交的数据为离散型数值。对于不同的两份报告,两者的相似度使用闵可夫斯基距离公式计算感知报告的数据相似度。该数据相似度的计算公式为:
[0068][0069]
其中,s为数据相识度计算函数,x和y代表不同两份感知报告,xn和yn表示感知报告的数据第n个维度上的值。
[0070]
步骤s4:根据数据相似度、初始信任值和用户声望属性值计算得到感知数据的可信度。
[0071]
对于一份感知报告,目前步骤中已知该报告上传用户的声望值,与其他感知报告的相似度集合{s
i,j
|i≠j},根据指纹识别得到的初始可信度itv,那么最终感知报告的可信度由下列公式计算得到:
[0072][0073]
其中,t为可信度,r为用户声望属性值,s是数据相识度计算函数,itv是初始可信度值,d为感知数据,e为常数,n为设备的类标识符数。
[0074]
根据以上的描述可以知道,本技术的基于设备指纹识别的数据可信度评估方法可以对设备上传的特定传感器数据进行处理得到的指纹特征进行同类型聚类,以此判断完成感知任务的感知数据是否来自同一设备。然后通过各份感知数据的指纹识别结果确定其初始可信度权重,降低来自同一感知设备的低质量感知数据对感知数据可信度计算过程的影响,提高正常感知数据的可信度,以此增加感知任务聚合结果的准确性。
[0075]
该方法的原理是通过lstm深度神经网络提取设备大都具备的传感器数据的独特特征构建设备唯一的指纹特征数据,再将指纹特征数据输入到聚类算法中。被聚合到同一类型的数据说明指纹一致。统计同类别的数量作为初始可信度权重评估因子。数量越多,越多的感知报告来自同一设备,则其初始可信度评估越低。该方法可以根据由不同用户提交的感知报告之间的相似度计算数据可信度。对于离散型数值数值,数据相似度由闵可夫斯基距离公式计算得到,能够在过半感知数据都是在同一设备上提交的低质量伪造数据前提下,提高可信度评估结果精确度。
[0076]
参见图5所示,根据本技术的另一方面,提供了一种基于设备指纹识别的感知数据可信度评估系统,该系统包括:
[0077]
读取模块10,用于获取群智任务参与者提交的所有感知报告,所述感知报告包括用户id、用户声望属性值、感知数据以及指纹数据文件,其中,每份感知报告组成包含四个部分,其中“用户id”唯一地表示每份报告持有者的标识,用以区分报告产生者。“用户声望属性值”表示参与者在接受感知任务之前的声望值,表示之前该用户综合可信赖程度,并将在解决现在的感知任务后由其贡献更新。“感知数据”是用户完成感知手动填写或者提交的数据,是任务要求、需要用户完成相应的感知行为,并最终通过手动输入提交的数据。“指纹数据文件”是群智应用通过操作系统提供的api直接获取的加速度传感器和陀螺仪传感器
数据,再经过应用处理后打包形成的文件。
[0078]
第一数据处理模块20,用于将所述指纹数据文件输入到lstm神经网络中生成设备指纹,进而得到初始信任值;第一数据处理模块20通过采样的方法,对指纹数据文件中的加速度传感器和陀螺仪传感器数据将时间戳对齐。然后将指纹数据文件处理成符合lstm指纹特征提取网络输入格式的15
×
6的数据批次。最后对设备指纹的特征进行提取,统计具有相同设备类标识符的感知报告并计算得到初始信任值。
[0079]
在将“指纹数据文件”输入到lstm指纹特征提取网络中后,本发明将神经网络的最后一个隐藏层,1
×
h向量,作为传感器独特的内在特征。为了将向量转换为设备的唯一标识,使用softmax层将传感器的特征向量映射到n个标签,即设备的类标识符数。标记所有报告后,统计具有相同设备类标识符的感知报告。最后使用初始信任值表示设备指纹阶段的结果,所述初始信任值的计算公式为:
[0080][0081]
其中,fp
id
为所述指纹数据文件,q是统计函数,γ为可信度级别的划分因子,σ为统计量的容错因子,itv为所述初始信任值。
[0082]
第二数据处理模块30,用于对所述感知数据进行处理得到数据相似度。本发明考虑感知报告提交的数据为离散型数值。对于不同的两份报告,两者的相似度使用闵可夫斯基距离公式计算感知报告的数据相似度。具体地,该数据相似度的计算公式为:
[0083][0084]
其中,s为所述数据相识度计算函数,x和y代表不同两份所述感知报告,xn和yn表示所述感知报告的数据第n个维度上的值。
[0085]
第三数据处理模块40,用于根据所述数据相似度、所述初始信任值和所述用户声望属性值计算得到所述感知数据的可信度。对于一份感知报告,目前步骤中已知该报告上传用户的声望值,与其他感知报告的相似度集合{s
i,j
|i≠j},根据指纹识别得到的初始可信度itv,那么最终感知报告的可信度由下列公式计算得到:
[0086]
所述可信度的计算公式为:
[0087][0088]
其中,t为可信度,r为所述用户声望属性值,s是数据相识度计算函数,itv是所述初始可信度值,d为所述感知数据,e为常数,n为设备的类标识符数。
[0089]
根据以上的描述可以知道,本技术的基于设备指纹识别的数据可信度评估系统可以对设备上传的特定传感器数据进行处理得到的指纹特征进行同类型聚类,以此判断完成感知任务的感知数据是否来自同一设备。然后通过各份感知数据的指纹识别结果确定其初始可信度权重,降低来自同一感知设备的低质量感知数据对感知数据可信度计算过程的影响,提高正常感知数据的可信度,以此增加感知任务聚合结果的准确性。
[0090]
为了便于描述,在这里可以使用空间相对术语,如“在
……
之上”、“在
……
上方”、“在
……
上表面”、“上面的”等,用来描述如在图中所示的一个器件或特征与其他器件或特征的空间位置关系。应当理解的是,空间相对术语旨在包含除了器件在图中所描述的方位
之外的在使用或操作中的不同方位。例如,如果附图中的器件被倒置,则描述为“在其他器件或构造上方”或“在其他器件或构造之上”的器件之后将被定位为“在其他器件或构造下方”或“在其他器件或构造之下”。因而,示例性术语“在
……
上方”可以包括“在
……
上方”和“在
……
下方”两种方位。该器件也可以其他不同方式定位(旋转90度或处于其他方位),并且对这里所使用的空间相对描述作出相应解释。
[0091]
此外,需要说明的是,使用“第一”、“第二”等词语来限定零部件,仅仅是为了便于对相应零部件进行区别,如没有另行声明,上述词语并没有特殊含义,因此不能理解为对本技术保护范围的限制。
[0092]
以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1