一种基于多传感器数据融合的隐式防护方法及系统与流程

文档序号:17089361发布日期:2019-03-13 23:15阅读:130来源:国知局
一种基于多传感器数据融合的隐式防护方法及系统与流程
本发明涉及安全防护
技术领域
,尤其涉及一种基于多传感器数据融合的隐式防护方法及系统。
背景技术
:随着移动互联网的飞速发展,以android手机为代表的移动终端在我们日常生活中占有越来越重要的地位。手机在给人们提供便利的同时,也存储了大量的个人隐私数据如手机通讯录、短信等。更为重要的是,手机还与用户的个人财产紧紧的绑定在了一起,如网银app、支付宝、微信支付等。这就使得一旦手机失控,将会给用户带来隐私泄露、财产损失等巨大风险。手机失控大体可以分为如下三种情形:①手机远程攻击:通过编写木马等恶意app诱骗用户点击下载运行,从而窃取用户的账号等隐私信息;②手机被非授权冒用:手机用户因大意可能导致锁屏密码被人偷窥等,被人拿到手机并解锁后直接冒充用户在微信等app中四处欺骗,或者翻阅窥探私人信息等。③手机丢失:生活中手机可能被盗或者不慎遗失,意图不轨的人得到手机后,虽然无法直接使用手机,但是可以先携带手机离开现场再进行破解密码等侵犯手机合法持有者隐私的行为。以上三种情况除了第一种主要依赖于安全公司提供的杀毒软件进行保护以外,后两种情况几乎没有更加有效的保护手段。而后两种情况对手机所有者的隐私安全、财产安全造成的危害更不容忽视,所以,针对非授权冒用以及手机丢失两种失控状况的安全防护至关重要。传统的防护方法主要为通过密码认证,图案解锁等方式验证用户身份。密码认证存在密钥易泄露、遗忘等问题,同时频繁输入密码会对人机交互的友好性产生影响;图案解锁方便快捷,但是图案锁隐蔽性较差,存在动作特征明显易被窥视等问题。另外,在手机被非法冒用的过程中,传统防护方法无法识别并阻止冒用者。随着手机传感器技术的不断发展,利用用户的生物特性或行为习惯进行身份认证的安全防护手段应运而生。这些身份认证技术利用特定手机传感器采集数据,通过若干算法处理这些数据进而对用户的生物特性或行为习惯进行抽象化以及数字化描述,比如指纹识别、虹膜识别等。该种手段识别用户身份的准确度与数据处理和算法设计密切相关。目前,该类方法的识别准确度易受环境等多方面因素影响,通常需要传统显式认证方法的配合。同时,该类认证防护手段还存在过度依赖特定传感器,适用范围有局限性等问题。可以看出,现有的认证防护手段无法很好地应对多种手机失控情况。因此,研究可以应对多种手机失控情况的用户身份认证方法对手机的安全防护具有重要意义。技术实现要素:针对上述问题,本发明公开一种基于多传感器数据融合的隐式防护方法及系统。可以隐式的识别手机在未经所有者授权下的冒用行为并且及时发现手机被盗失控的状况,面向app收集多种传感器的数据,并根据当前手机的状态以及app运行情况有策略地使用传感器在用户使用手机的过程中持续的进行用户身份识别,从而达到多种失控场景下的安全防护。为了实现上述目的,本发明采用以下技术方案:一种基于多传感器数据融合的隐式防护方法,包括以下步骤:步骤1:面向app通过多个传感器采集用户与手机交互过程中的数据,并根据app类型和手机的状态将所述数据划分为用户触屏操作相关数据、行为动作姿态相关数据及位置信息相关数据;步骤2:分别对用户触屏操作相关数据、行为动作姿态相关数据进行特征提取,对应生成触屏操作特征库及行为动作姿态特征库,并通过提取的特征分别计算用户与手机合法持有者的匹配概率;通过位置信息相关数据构建位置信息库,并通过位置信息库中的数据计算用户的信任系数;步骤3:将得出的所述信任系数及两个所述匹配概率抽象为三个弱匹配器,通过adaboosting算法合成为一个强匹配器,通过所述强匹配器计算用户与手机合法持有者的综合匹配概率;步骤4:根据app类型设置安全匹配阈值,通过所述综合匹配概率与安全匹配阈值进行比较,并根据比较结果进行相应的防护处理。进一步地,在所述步骤1之前还包括:按照app功能的不同,将app划分为不同的类型,并对不同类型的app进行重要程度设置。进一步地,所述步骤2包括:步骤2.1:对用户触屏操作相关数据进行特征提取,生成触屏操作特征库,并通过提取的特征计算用户与手机合法持有者的匹配概率:对采集的用户触屏操作相关数据进行分类,划分为单点击数据、单滑动数据、长按数据、连续操作数据及文本输入数据,分别对应五种触屏操作:单点击、单滑动、长按、连续操作及文本输入,并对分类后的数据进行分组,共得到k组数据;对得到的k组数据进行特征提取,得到k组特征向量,得到触屏操作特征库;采取随机重取样方式,从触屏操作特征库所有特征向量中每次随机有放回地选取1/n,取滑动平均值作为每种触屏操作的基准特征向量,所述基准特征向量的公式为:其中,m=1,2,…,5代表五种操作类型,i为第m种触屏操作下选取特征向量的个数;采用多数投票判决的方式对五种触屏操作进行分类识别:得到五种触屏操作的基准特征向量后,将待判断用户触屏操作相关数据的特征向量分别与五个基准特征向量进行比较,得到五个绝对距离,从而得到五个绝对距离的最小值,并投所述最小值对应的触屏操作一票,对待判决用户触屏操作相关数据的每个元素进行投票判决,将得票最高的触屏操作类别作为判别结果进行输出;设置变量ptoc表示触屏操作匹配概率,初值为1,根据对触屏操作的判决结果改变ptoc值;步骤2.2:对行为动作姿态相关数据进行特征提取,生成行为动作姿态特征库,并通过提取的特征计算用户与手机合法持有者的匹配概率:对采集的行为动作姿态相关数据进行分类,划分为手机姿态数据、行进姿态数据及静止姿态数据,分别对应三种行为动作姿态:手机姿态、行进姿态及静止姿态;对手机姿态数据、行进姿态数据及静止姿态数据进行特征提取,得到手机姿态特征向量、行进姿态特征向量及静止姿态特征向量,得到行为动作姿态特征库;将新采集的行为动作姿态相关数据进行分类和特征提取,将提取的特征和行为动作姿态特征库中的特征进行匹配识别,匹配识别函数为:其中,ai∈a=[a1,a2,a3,l,an],ai为根据新采集的动作姿态相关数据提取的待匹配特征,ci为ai的三元数的向量坐标转换公式;通过匹配识别函数得出新采集的动作姿态相关数据提取的待匹配特征与动作姿态特征库中的特征的匹配概率,得到用户是手机合法持有者的概率;步骤2.3:通过位置信息相关数据构建位置信息库,并通过位置信息库中的数据计算用户的信任系数:在有gps信号情况下操作手机时,收集相应的gps信息,以每分钟收集一条的频率,存入位置信息库;在gps信号无服务或者不可用的情况下操作手机时,收集相应的多wifi源列表,以每分钟收集一条的频率,存入位置信息库;当存在gps信号时,使用gps信息作为匹配依据,将当前的经纬度位置信息与位置信息库中的时间、位置信息匹配,判断是否是在正常时间段、正常地理位置上使用手机及app,如果判断结果在40m范围内,增大用户的信任系数,若超出范围则不产生判定效果;当gps信号弱或者精度不够时,将多wifi源列表作为匹配依据,将当前的wifi列表信息与位置信息库中的时间、wifi的ssid以及信号强度相匹配,判断用户是否在以往的wifi环境中使用对应的手机及app,如果判断结果在此wifi环境,增大用户的信任系数,若超出范围则不产生判定效果。进一步地,所述步骤3包括:步骤3.1:将步骤2.1、步骤2.2得出的匹配概率和步骤2.3得出的信任系数抽象为弱匹配器;步骤3.2:以解锁屏幕作为分界点,若在息屏状态下,通过步骤2.2处理,此时,该弱匹配器就是强匹配器;若在亮屏情况下,通过步骤2.2和步骤2.1进行处理,可以得到两个弱匹配器,计算弱匹配器的权重,然后根据弱匹配器的权重和融合公式进行计算,得到一个强匹配器:首先假设初始化权重为1/2,分别为步骤2.1、步骤2.2得出的匹配概率的比例系数,每次输入一组数据之后对权重进行调整,更新训练样本的权重:其中,n为训练次数;对比例系数进行调整:得到调整后的步骤2.1、步骤2.2的匹配概率的比例系数后,根据步骤2.3得到的信任系数,得到综合匹配概率:其中为步骤2.3得到的信任系数,pt为步骤2.1或步骤2.2的匹配概率。一种基于多传感器数据融合的隐式防护系统,包括:数据采集划分模块,用于面向app通过多个传感器采集用户与手机交互过程中的数据,并根据app类型和手机的状态将所述数据划分为用户触屏操作相关数据、行为动作姿态相关数据及位置信息相关数据;匹配概率及信任系数生成模块,分别对用户触屏操作相关数据、行为动作姿态相关数据进行特征提取,对应生成触屏操作特征库及行为动作姿态特征库,并通过提取的特征分别计算用户与手机合法持有者的匹配概率;通过位置信息相关数据构建位置信息库,并通过位置信息库中的数据计算用户的信任系数;综合匹配概率生成模块,将得出的所述信任系数及两个所述匹配概率抽象为三个弱匹配器,通过adaboosting算法合成为一个强匹配器,通过所述强匹配器计算用户与手机合法持有者的综合匹配概率;比较模块,用于根据app类型设置安全匹配阈值,通过所述综合匹配概率与安全匹配阈值进行比较,并根据比较结果进行相应的防护处理。进一步地,还包括:app划分设置模块,用于按照app功能的不同,将app划分为不同的类型,并对不同类型的app进行重要程度设置。与现有技术相比,本发明具有的有益效果:本发明可以隐式的识别手机在未经所有者授权下的冒用行为并且及时发现手机被盗失控的状况。本发明面向app收集多种传感器的数据,并根据当前手机的状态以及app运行情况有策略地使用传感器在用户使用手机的过程中持续的进行用户身份识别,从而达到多种失控场景下的安全防护。①面向app的精准化数据收集与防护在实时收集数据过程中,充分考虑用户使用不同app时行为特征差异较大的特点,首先获取当前正在前台运行的app类型,并以app类型为索引,建立面向不同app的用户特征库,提高识别准确性。不同app对用户的重要程度不同,通常涉及用户财产以及隐私的app相对来说更为重要。根据app的重要程度以及用户的选择,对不同app启动不同级别的安全防护。充分尊重用户的意愿并增强防护针对性,提高用户身份认证能力的同时降低了资源消耗。②多传感器数据策略化使用对于多传感器采集得到的大量不同类型数据,根据其适用的场景进行分类处理,形成多种类型的用户行为特征库。在不同情况下,使用特征库进行身份识别的策略不同,进而应对不同的手机失控场景。③身份识别的持久化用户无需频繁进行传统的身份认证,所有的数据收集、检测以及认证均在用户使用手机过程中后台完成,极大地提高了用户使用手机过程中的便利性以及友好性。综合来说,本发明通过采集、利用反映用户状态的多种传感器数据,多维度融合构建用户特征画像,达到用户身份隐式识别的效果,实现在不同失控场景下android手机的安全防护。同时本发明面向app以及防护强度可选择等特点,也为身份识别的准确性以及实用性提供了保障。附图说明图1为本发明实施例的一种基于多传感器数据融合的隐式防护方法的基本流程示意图。图2为本发明实施例的样本库建立及动作类型判决流程图。图3为本发明实施例的特征分析与提取流程图。图4为本发明实施例的聚类流程图。图5为本发明实施例的聚类结果示意图。图6为本发明实施例的触屏操作匹配与身份识别流程图。图7为本发明实施例的行为动作姿态相关数据预处理流程图。图8为本发明实施例的多项式拟合示意图。图9为本发明实施例的基准特征向量提取流程图。图10为本发明实施例的行为新的动作姿态相关数据匹配识别流程图。图11为本发明实施例的防护处理流程图。图12为本发明实施例的多wifi定位示意图。图13为本发明实施例的手机合法持有者本人使用时测试结果图。图14为本发明实施例的非手机合法持有者本人使用时测试结果图。图15为本发明实施例的一种基于多传感器数据融合的隐式防护系统的构架图。具体实施方式下面结合附图和具体的实施例对本发明做进一步的解释说明:实施例一:如图1所示,本发明的一种基于多传感器数据融合的隐式防护方法,包括:步骤s101:面向app通过多个传感器采集用户与手机交互过程中的数据,并根据app类型和手机的状态将所述数据划分为用户触屏操作相关数据、行为动作姿态相关数据及位置信息相关数据;包括:1)获取传感器数据现代手机中自带了很多传感器,其灵敏度也在不断地提高。在用户平时使用手机时会产生大量的传感器数据,这些数据能够直接或者间接的体现用户的行为特征。利用这一特性,收集来自于手机与用户交互的传感器数据,实现使用者的身份特征识别。手机主要使用的传感器有:①触摸屏:获取用户的触屏操作数据;②陀螺仪:利用角动量守恒获取手机转动角速度;③加速度传感器:检测手机受到的加速度的大小和方向;④gps:获取手机坐标;⑤重力传感器:利用压电效应计算出水平方向;⑥距离传感器:利用红外led灯发射红外线测定距离;⑦光线传感器:利用光敏三极管感知环境光亮度。作为一种可实施方式,本发明使用的传感器有触摸屏、陀螺仪、加速度传感器及gps;当gps信号较弱时还使用了wifi模块用于获取手机的wifi源列表。2)数据分流与预处理将满足分组条件的一组数据以结构体data的形式保存,并将用户触屏操作相关数据、行为动作姿态相关数据及位置信息相关数据进行分流。在数据预处理阶段,采用java.lang.math中的方法进行均值的计算。步骤s102:分别对用户触屏操作相关数据、行为动作姿态相关数据进行特征提取,对应生成触屏操作特征库及行为动作姿态特征库,并通过提取的特征分别计算用户与手机合法持有者的匹配概率;通过位置信息相关数据构建位置信息库,并通过位置信息库中的数据计算用户的信任系数;包括:步骤s102.1:对用户触屏操作相关数据进行特征提取,生成触屏操作特征库,并通过提取的特征计算用户与手机合法持有者的匹配概率;针对用户触屏操作相关数据,设计基于触屏操作的特征提取与匹配算法进行匹配概率计算,具体包括:对于采集到的用户触屏操作数据,在动作类型未知的情况下是没有意义的。首先对采集到的触屏操作数据的动作类型进行识别并归类训练,进而从不同类型操作对应的训练集中提取特征向量用于对用户触屏操作的识别判断。根据手机使用习惯,设置五种触屏操作类型标签,分别是:单点击,单滑动,长按,连续操作,文本输入。采集大量人群在这五种触屏操作下的触摸屏采集的数据并对每条数据添加类别标签,进行数据分组及处理,生成样本库。通过投票判决对训练期的触屏操作数据进行分类。在各个操作类型对应的训练集中,通过k-means聚类生成更能体现用户特征的二级类,并从中提取用户的高精度基准特征向量用于匹配与识别。不同类型触屏操作的特征呈现方式差别较大,为提高判断准确性,应当分别进行用户特征的提取以及规则库的建立。通过采集大量人群在不同触屏操作下的数据,可以建立样本库识别触屏操作类型,进而对采集的触屏操作进行类型识别。在明确动作类型的前提下,进行相应的高精度用户特征提取与身份识别。1)样本库建立及动作类型判决样本库建立及动作类型判决流程图如图2所示,样本库建立及动作类型判决过程如下:①数据收集与预处理从大量人群中采集五种触屏操作类型的传感器数据。提取变量如下:开始时间、结束时间、起始坐标、结束坐标、周期性采集的中间态坐标集,同时为每条数据添加动作标签。为了刻画连续操作之间的关联性,对于同一时间序列下的样本数据,根据单个操作之间时间间隔的波动情况,将数据分为多组。②样本数据特征向量提取对经过预处理的各组数据分别求取每列的标准差,得到五种触屏操作对应的一维向量dm,每个向量中的元素对应每组数据对应列的标准差,反映数据的波动程度。结合每组动作预处理得到的4维特征向量,并去掉时间戳,得到了具有14个元素的一维特征向量dm。③基准特征向量生成对于5种触屏操作,此时已经得到了k组一维向量,采取随机重取样方式,从所有特征向量中每次随机有放回地选取1/n,取滑动平均值作为每种触屏操作的基准特征向量。求滑动平均值得到基准特征向量的公式:其中,m=1,2,…,5代表五种操作类型,i为第m种模式下选取特征向量的个数。④投票判决识别操作类型采用多数投票判决的方式对5种触屏操作进行分类识别。得到5种触屏操作的基准特征向量后,将待判断数据的每个元素分别与五个基准特征向量进行比较,得到二者绝对距离。通过比较,得到五个最小距离的最小值,并投最小值对应的操作一票。依此原理,对待判决数据的每个元素进行投票判决,将得票最高的模式作为判别结果输出。2)用户触屏操作特征库建立在用户触屏操作特征库建立阶段,需要利用更多的高精度传感器数据对用户的操作特征进行刻画。因此,在收集用户触屏操作相关数据时,还需要收集陀螺仪、加速度传感器对应的x、y、z三轴角速度以及加速度,手指接触屏幕的面积等共同构成原始数据流,并进行缓存。当识别用户的触屏操作类型之后,将缓存数据全部取出,根据识别结果,对该组数据进行处理并加入相应规则库。进行特征分析与提取流程图如图3所示。3)k-means聚类生成用户特征二级类通过对五种触屏操作的分析,得到了维数不同的五种特征向量。原始数据经过类型识别以及特征提取,构成了结构清晰的触屏操作特征库。接下来对五种触屏操作的触屏操作特征库分别进行聚类,将相似度高的动作聚为一类并提取聚类中心作为类特征。常见的聚类方法有k-means、层次聚类、som、fcm这四种。考虑到特征向量维数较低以及对执行速度的要求,采用k-means聚类的方法。聚类流程图如图4所示,过程如下:①根据特征向量维数以及仿真情况选择ki值(i=1,2,3,4,5,对应五种触屏操作类型),确定簇的总数;②在各个特征库中选择数量为ki的数据,作为初始聚类中心c1,c2,…,cki;③对各特征库的所有特征向量x计算到各簇聚类中心的欧式距离d,找到最近距离并将数据归入该类;④重新计算聚类中心,并返回第③步;⑤聚类完毕后,计算各簇的方差以及极大偏移向量差描述该簇的特征;对于数据收集过程中根据时间间隔得到的动作分组以及热度分布等统计信息不进行聚类处理,作为独立的特征保存。在训练期,得到了五种触屏操作对应的用户特征二级类,聚类情况如图5所示。4)触屏操作匹配与身份识别在监测防护期,考虑到实时效率等要求,处理流程如图6所示,过程如下:①采集原始数据并缓存对于每个触屏操作,同时收集多个传感器的数据,并进行缓存。为了及时处理数据,限制缓存数据的数量以及缓存时间,当两动作之间时间间隔明显增大、缓存数据数量超过n或单次缓存时间超过t时,提取缓存数据,作为一组动作进行处理。②动作类型识别将一组原始缓存数据进行处理,并通过投票判决识别该组动作的类型。根据动作类型选用不同的特征库。③动作匹配程度判断设置变量ptoc表示触屏操作匹配程度,初值为1,根据对动作的判断结果改变p值。一组数据包含多个操作数据向量,可构成一组动作的触屏操作元素矩阵。首先考察一组动作的连续特性,包括相邻点击时间间隔、动作序列匹配程度等是否符合用户特征。然后,计算单个动作与所选特征库各簇聚类中心的欧式距离d,并得到欧式距离最小值dmin。同时,计算待判断数据向量与特征向量各元素的方差d,用于刻画数据波动情况:经过判断,可得:设定阈值p0,若ptoc>p0,则信任当前操作者,否则,进行相应处理。其中,p1′、p2′、p3′分别为触摸屏、陀螺仪、加速度传感器的匹配概率;步骤s102.2:对行为动作姿态相关数据进行特征提取,生成行为动作姿态特征库,并通过提取的特征计算用户与手机合法持有者的匹配概率;针对行为动作姿态相关数据,设计基于用户姿态的身份识别算法进行匹配概率计算,具体包括:在已确定手机当前正在使用的应用的情况下,可以通过采集和分析陀螺仪、加速度传感器等传感器数据,从手机使用人的行为动作判断使用人身份。首先根据人的行为动作,确定将行进姿态特征,静止姿态特征,手机姿态特称作为该算法的评判依据,分别建立子算法提取对应的特征向量。为了准确刻画这些特征,选取android手机的陀螺仪,加速度传感器等监控运动的传感器,收集这些传感器的数据。对大量数据通过分类进行数据预处理,为模型的建立和训练提供数据支撑。在已有基准特征向量的基础上,为了对未知混杂数据进行判断,我们设计了匹配识别算法,用于计算当前操作者为手机所有者的概率。1)数据预处理在此算法下收集的数据有,陀螺仪、加速度传感器传感器数据。变量名如下:表1传感器数据变量名变量名符号变量名符号陀螺仪x轴gys_x加速度传感器x轴grv_x陀螺仪y轴gys_y加速度传感器y轴grv_y陀螺仪z轴gys_z加速度传感器z轴grv_z数据预处理的流程图如图7所示,数据预处理的过程如下:(1)已知动作下的行为动作姿态相关数据收集为了实现在某一动作下的身份识别,首先对已知姿态状态下的手机陀螺仪、加速度传感器数据进行收集。将收集的行为动作姿态相关数据加上时间与动作标签录入数据库,并进行特征提取。图8是在行进与静止状态下的加速器y轴与x轴数值通过n次多项式的拟合绘制的。可以发现两个状态下的数据有着明显的特征,我们利用这些特征对传感器收集的混杂的数据进行归类,分为手机姿态、行进姿态及静止姿态三类。在数据预处理的过程中重点是数据特征的提取,接下来详细叙述特征提取过程。(2)行为动作姿态特征库建立数据采样时考虑到了人的行进时步频(120~160步/分),根据奈奎斯特采样定理采样频率大于步频的2倍时其数据才具有计算意义,在此我们采样设置为10倍步频。为了提取合适的数据信息特征值,我们将n个采样值分别计算数学期望方差均值形成基准动作特征向量。接下来,收集混杂数据并根据特征向量精准的判断,此时的人体动作状态。(3)未知混杂数据分类根据行为动作姿态特征库的动作特征将混杂的用户数据进行特征分类,以区分出手机姿态、行进姿态及静止姿态三类数据。具体规则如下:每采样10个数据(根据前面的采样频率,每组数据收集时间大约为0.5秒)进行一次动作匹配。将匹配过后的一组数据添加动作标签,方便下一步更加精准的身份识别。首先将10个数据利用特征值分别进行动作匹配。匹配公式如下:其中,di为采集的10个数据中的任一数据,sd(di)为采集的10个数据的均值。至此数据预处理部分结束,一组数据通过最后找到最小的距离差即可判断当前组数据的动作状态,接下来分别对不同动作状态下的特征识别算法进行设计。2)基准特征向量提取基准特征向量可以从下述三个角度进行提取,每个方面由于所用的数据有所不同,所以提取方法不尽相同,基准特征向量提取算法的流程图如图9所示,包括:(1)手机姿态特征提取对于不同的手机使用者来说,在使用相同的app时,手机有不同的姿态,可以在根据前台运行的app,设计手机姿态特征识别算法,对手机使用人身份进行判断:①建立坐标系和定义手机姿态手机姿态,是一个基于坐标系的概念,表示手机相对于坐标系的朝向关系,所以首先需要建立一个统一的坐标系w。根据上述对手机姿态的定义,为了表示这种朝向的相对关系,需要建立两种坐标系,包括世界坐标系w1和手机坐标系w2。在世界坐标系中,手机可以被抽象为一个质点,只有位置概念,可以通过位置向量vvz来表示;手机自然坐标系随手机旋转而旋转,坐标系的朝向是不确定的。但是,世界坐标系是确定不变的,所以,在手机姿态发生改变的时候,手机坐标系的世界坐标系的三轴就会产生三个夹角,记为α,β,γ。在算法中,我们使用三个角度组成的向量表示手机的姿态。②建立向量提取公式在前期数据预处理过程中,我们将陀螺仪,加速度传感器的数据通过动作匹配公式得到了带动作标签的数据组。在本算法中,我们需要建立特征向量计算模型,使用前期所得到的数据,对模型进行训练,提取手机使用人手机姿态的基准特征向量vjz。设手机在世界坐标系w的位置向量在手机坐标系中的向量可以通过陀螺仪参数获取,朝向向量采取随机重取样方式,从所有特征向量中每次有放回地随机选取n。从而,得到三元数的向量坐标转换公式:(2)行进姿态提取与识别不同的人进行步伐有很大的区别,所以手机行进姿态是从行为动作角度判断使用人身份的重要依据。在已经收集数据并对数据进行预处理的基础上,可以提取使用人进行姿态的基准特征向量。依据基准特征向量,可以对手机使用人的身份进行判断。①行进姿态定义从运动感知的角度来讲,行进姿态区别于静止姿态,人体在世界坐标系存在相对运动现象,我们就将之归结于行进姿态。所以,这里的行进姿态包括但不限于步伐姿态,跳跃姿态等。整个人体有非常复杂的行进姿态控制机制,需要下身关节的肌肉的协调配合,也需要上身保持平衡和中枢神经系统的配合。同时,行进姿态还受到生活习惯,地域风俗,人体伤病的影响,所以,不同的人的行进姿态有很大差别。但是由于android手机的传感器精度影响,不足以准确刻画当前行进动作姿态,所以采用多传感器融合算法,得到一个无量纲的阈值,作为基准特征向量。②建立向量提取公式前期数据提取和预处理部分中,我们已经得到了带动作标签的数据组。这为算法的建立提供了数据支撑,随机抽取n数组用于测试。(3)静止姿态特征识别数据收据的过程中我们发现,在躺、坐、站立等静止姿态下也存在细微的数据差别,其主要原因与人的不同特征例如肌肉紧张程度、使用手机的习惯等有关。因此通过对静止姿态下的特征提取,可以有效的判断手机使用者的身份,达到安全保护的目的。3)匹配识别在得到了使用人行为动作的基准特征向量的基础上,为了判别新的行为动作姿态相关数据是否匹配已有基准特征向量,建立匹配识别算法。算法流程图如图10所示。对于在判别过程中产生的新的未知数据,通过数据分组和动作匹配公式处理之后,得到带动作标签的数据组,在其中抽取识别算法所需的数据a=[a1,a2,a3,…,an]。计算各个分量的权重,以数学期望作为权重判别的因素:其中,ci由上述可知,为ai的三元数的坐标转换公式。接着根据权重,可以给出匹配识别函数最后,带入抽取的数据,可以得到是否是合法使用人的概率。其中,ai∈a=[a1,a2,a3,…,an],ai为根据新采集的动作姿态相关数据提取的待匹配特征。步骤s102.3:通过位置信息相关数据构建位置信息库,并通过位置信息库中的数据计算用户的信任系数;针对位置信息相关数据,设计基于用户姿态的身份识别算法进行匹配概率计算,具体包括:通过分析使用者在操作手机时对应的地理位置信息,判断是否是在用户本人经常出现的区域使用手机及应用,从而提高判断准确性,如果匹配成功则会增加信任概率,反之无影响。在用户平时操作手机时,将用户的相关位置存入位置信息库,作为匹配是否是用户本人操作的基础数据。当存在gps信号时(多为室外环境),使用gps信息作为匹配依据。将当前的经纬度位置信息与位置信息库中的时间、位置信息匹配,判断是否是在正常时间段、正常地理位置上使用手机及app,如果判断结果在40m范围内,为操作者增加信任系数,若超出范围则不产生判定效果。当gps信号弱或者精度不够时(多为室内环境),将多wifi源列表作为匹配依据。将当前的wifi列表信息与位置信息库中的时间、wifi的ssid以及信号强度相匹配,判断用户是否在以往的wifi环境中使用对应的手机及app,如果判断结果在此wifi环境,为操作者增加信任系数,若超出范围则不产生判定效果。wifi源的名称用ssid表示,wifi源与用户的距离可以转化为wifi信号强度:level。一个wifi源与用户的距离远近可以用wifi信号强度level表示,并且wifi源是固定不动的,多wifi源与用户的wifi信号强度关系,可以用以定位用户的相对位置。如用户扫描的wifi列表中,wifi-a信号强、wifi-b信号中度、wifi-c信号弱,且wifi信号源位置固定。那么如图11所示可以大致判断出用户所处的相对位置。1)设计手机位置信息库在有gps信号情况下操作手机时,收集相应的gps信息。表2gps信息格式表以每分钟收集一条的频率,存入位置信息库。在gps信号无服务或者不可用的情况下操作手机时,收集相应的多wifi源列表。即wifi识别名ssid和wifi接收信号强度level。表3wifi信息格式表以每分钟收集一条的频率,存入位置信息库。2)gps信息匹配判断用户身份在室外环境时,gps信号清晰、服务质量高,这时使用gps信息作为地理信息判断的依据较为可靠。根据当前的时间信息匹配位置信息库中的数据。其中,计算得到当前时间前后30分钟这一时间段,根据这一时间段匹配位置信息库中对应的数据。比如用户在15:00使用手机,那么将会获取14:30~15:30期间的gps信息数据。当前gps传感器获取的gps信息与从位置信息库中获取的若干过往数据相匹配,如果当前位置和过往的至少5组数据位置相距在40米范围内,即判断这是用户本人在正常的时间段、正常的位置对app进行的操作,即为该操作者提高信任系数。3)多wifi源相对定位判断用户身份在室内环境时,gps信号不清晰、服务质量较差,这时候不能使用gps信息作为地理信息判断的依据。此时我们采用多wifi源相对定位方法,用以确定用户的地理位置。根据当前的时间信息匹配位置信息库中的数据。其中,计算得到当前时间前后30分钟这一时间段,根据这一时间段匹配位置信息库中对应的数据。当前多wifi源列表与从位置信息库中获取的若干过往多wifi源列表数据相匹配,如果当前多wifi源列表和过往的至少5组数据的相似度超过80%,即判断这是用户本人在正常的时间段、正常的位置操作手机,即为该操作者提高信任系数。具体规则举例如下:当前多wifi源列表计为表4,其中包含手机搜索到的4个wifi源及的信号强度。表4当前多wifi源格式列表从位置信息库中取得历史的多wifi源列表计为表5。表5历史多wifi源格式列表从位置信息库中取得的历史多wifi源列表计为表6。表6历史多wifi源格式列表对比表5和表6,可以看到表5中的ssid-1、ssid-3、ssid-4包含在表6中,但是两者ssid-4的level不匹配,所以表5只有2个ssid及其对应的level与表6匹配,即相似度50%。只有至少5次匹配的相似度大于80%,才为该操作者提高信任系数。步骤s103:将得出的所述信任系数及两个所述匹配概率抽象为三个弱匹配器,通过adaboosting算法合成为一个强匹配器,通过所述强匹配器计算用户与手机合法持有者的综合匹配概率;包括:在以上的分析中,从不同角度构建了三个身份识别算法,并得到了对应的使用人身份的匹配概率和信任系数。在该部分中,基于adaboosting算法思想构建多传感器数据融合算法,加强身份识别的准确性和普适性。虽然在前面的工作中从不同角度得到了判断手机使用人身份的匹配概率,但是这些概率是片面和不够准确的。可以将单个算法得出的匹配概率或信任系数抽象为一个弱匹配器,通过adaboosting算法思想合成为一个强匹配器。算法以解锁屏幕作为分界点,若在息屏状态下,通过步骤s103.2处理,此时,该弱匹配器就是强匹配器;若在亮屏情况下,通过步骤s103.2和步骤s103.1进行处理,可以得到两个弱匹配器,然后根据融合公式根据权重进行解算,得到一个强匹配器。在得到强匹配器的基础上,根据步骤s103.3得到的信任系数可以得到最终的匹配概率p。训练的循环过程,加重被错误分类的样本的权重是一种有效的加速训练的方法。由于训练中正确率高的弱匹配器权重较大,新一轮的训练中正确分类的样本会越来越多,权重较小的训练样本对新一轮的训练起作用较小。也就是说,每一轮新的训练都着重训练被错误分类的样本,即反馈的那一部分数据。最后得到最佳的比例系数,实现强匹配器的效果。首先假设步骤s102.1、步骤s102.2得出的匹配概率的比例系数为根据步骤s102.1、步骤s102.2得出的得到匹配概率分别为p1、p2,p2即为ptoc,最终的匹配概率为为信任系数。结合每次算法判断与用户主观判断进行训练,当进行误判时可以将错误数据进行标记,提高训练效果。假设初始化权重为1/2。每次输入一组数据之后对权重进行调整,更新训练样本的权重。对最开始的1/2比例系数进行精确调整:得到比例系数后,配合比例系数得到综合匹配概率:步骤s104:根据app类型设置安全匹配阈值,通过所述综合匹配概率与安全匹配阈值进行比较,并根据比较结果进行相应的防护处理。在得到综合匹配概率后,将该值与安全匹配阈值进行比较并进行相应的防护处理,处理流程图如图12所示,包括:为了实现安全防护,设计并实现以下函数与封装类。①阈值比较函数thresholdcmp():比较综合匹配概率与安全匹配阈值,并进入相应的处理函数;②反馈函数publicvoidfeedback():将有价值的手机合法持有者操作数据分流为3个规则数据库所需的训练数据,分别存入相应的训练集,动态训练规则库;③匹配失败处理类notmatchhandle.class。该类的结构如下表所示:表7notmatchhandle算法类数据库成员变量及函数为了实现锁定屏幕、发送警告短信以及关机操作,需要申请权限。值得说明的是,在步骤s101之前,还包括:按照app功能的不同,将app划分为不同的类型,并对不同类型的app进行重要程度设置。由于不同的app的功能不同,其重要性亦不相同,通常涉及用户财产以及隐私的app相对来说更为重要,如手机内现有的支付软件,其由于涉及到个人财产安全,所以重要程度较大。根据app的重要程度以及用户的选择,对不同app启动不同级别的安全防护。在实时收集数据过程中,充分考虑用户使用不同app时行为特征差异较大的特点,首先获取当前正在前台运行的app,并以app为索引,建立面向不同app的用户特征库,提高识别准确性。充分尊重用户的意愿并增强防护针对性,提高用户身份认证能力的同时降低了资源消耗。为了验证本发明所提方法的有效性,进行以下实验:1)手机合法持有者本人使用时在已经进行充分训练的基础上,手机合法持有者的基准特征向量库已经趋于稳定,基准特征向量库包括触屏操作特征库、行为动作姿态特征库及位置信息库。当手机使用者本人继续操作时,定义tts为单位时间内产生错报的次数。该值越低,说明对手机使用人识别越精准。本实验选取100名测试者,实验时间为24小时(6:00至次日6:00)。定义横坐标为测试者号码,纵坐标为错误次数ccb,绘制二维散点图,测试结果如图13所示。对上述结果进行统计,在24小时的使用中,错误5次以下的占66%,错误5次以上10次以下的占32%,错误10次以上的仅占2%,大部分错误此时小于5次。从测试结果来看,较好的满足了日常使用。并且,由于特征库是动态变化的,随着使用时间增加,识别错误率将会越来越低。2)非手机合法持有者本人使用时实验条件依旧是在已经进行充分训练的基础上,手机使用者本人手机合法持有者的基准特征向量库已经趋于稳定。此时非手机合法持有者对手机进行操作时,定义tts为发出报警信息的时间。该值越小,说明对非法使用的识别速度快。本实验选取100名测试者,实验时间为全部发出报警信息的时间。定义横坐标为测试者号码,纵坐标为发出报警信息的时间tts,绘制散点图,测试结果如图14所示;对测试结果进行统计,对结果进行分析,其中第一次发出警报时间小于50s的占75%,50s以上75s以下的占22%,75s以上的仅占3%共3人。这样的警报时间在完全满足日常使用。随着使用时间的增加,识别速度将会越来越快。综上,本发明可以带来以下有益效果:可以隐式的识别手机在未经所有者授权下的冒用行为并且及时发现手机被盗失控的状况。本发明面向app收集多种传感器的数据,并根据当前手机的状态以及app运行情况有策略地使用传感器在用户使用手机的过程中持续的进行用户身份识别,从而达到多种失控场景下的安全防护。①面向app的精准化数据收集与防护在实时收集数据过程中,充分考虑用户使用不同app时行为特征差异较大的特点,首先获取当前正在前台运行的app,并以app为索引,建立面向不同app的用户特征库,提高识别准确性。不同app对用户的重要程度不同,通常涉及用户财产以及隐私的app相对来说更为重要。本发明根据app的重要程度以及用户的选择,对不同app启动不同级别的安全防护。充分尊重用户的意愿并增强防护针对性,提高用户身份认证能力的同时降低了资源消耗。②多传感器数据策略化使用对于多传感器采集得到的大量不同类型数据,根据其适用的场景进行分类处理,形成多种类型的用户行为特征库。在不同情况下,使用特征库进行身份识别的策略不同,进而应对不同的手机失控场景。③身份识别的持久化用户无需频繁进行传统的身份认证,所有的数据收集、检测以及认证均在用户使用手机过程中后台完成,极大地提高了用户使用手机过程中的便利性以及友好性。④信息反馈与精确身份识别当检测到符合用户特征的操作数据时,在身份验证通过的同时会将该次数据作为训练数据加入训练集,同时,当发生误报时,被误报的正常用户数据也会反馈进入训练集。利用反馈机制,可以不断增强特征库的完备性,进而实现精确度不断提高的身份识别。综合来说,本发明通过采集、利用反映用户状态的多种传感器数据,多维度融合构建用户特征画像,达到用户身份隐式识别的效果,实现在不同失控场景下android手机的安全防护。同时本发明面向app以及防护强度可选择等特点,也为身份识别的准确性以及实用性提供了保障。值得说明的是,随着android手机的不断发展,传感器类型与精度的不断完善,本发明能够具有更强的识别准确性与防护能力。并且本发明实现的隐式防护方法可以做到防护于无形之中,能够满足用户对手机使用友好性需求的不断提高。本发明的设计思想不只限于android手机,可以应用于其他具有传感器的设备中,用于识别用户的行为特征并认证身份,比如当前不断发展的智能家居、可穿戴设备等。在手机安全防护薄弱的背景下,本发明可以精确识别用户身份,做到隐式防护,同时安装便利,可定制性强,适用于多种手机失控场景,因而具有广阔的应用前景。实施例二:如图15所示,本发明的一种基于多传感器数据融合的隐式防护系统,包括:数据采集划分模块,用于面向app通过多个传感器采集用户与手机交互过程中的数据,并根据app类型和手机的状态将所述数据划分为用户触屏操作相关数据、行为动作姿态相关数据及位置信息相关数据;匹配概率及信任系数生成模块,分别对用户触屏操作相关数据、行为动作姿态相关数据进行特征提取,对应生成触屏操作特征库及行为动作姿态特征库,并通过提取的特征分别计算用户与手机合法持有者的匹配概率;通过位置信息相关数据构建位置信息库,并通过位置信息库中的数据计算用户的信任系数;综合匹配概率生成模块,将得出的所述信任系数及两个所述匹配概率抽象为三个弱匹配器,通过adaboosting算法合成为一个强匹配器,通过所述强匹配器计算用户与手机合法持有者的综合匹配概率;比较模块,用于根据app类型设置安全匹配阈值,通过所述综合匹配概率与安全匹配阈值进行比较,并根据比较结果进行相应的防护处理。还包括:app划分设置模块,用于按照app功能的不同,将app划分为不同的类型,并对不同类型的app进行重要程度设置。以上所示仅是本发明的优选实施方式,应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1