基于步态的可穿戴设备用户识别方法及系统与流程

文档序号:11432480阅读:245来源:国知局
基于步态的可穿戴设备用户识别方法及系统与流程

本发明属于用户识别技术领域,具体涉及一种基于步态的能量高效的可穿戴设备用户识别方法及系统。



背景技术:

可穿戴设备越来越流行。一方面,可穿戴设备可以收集穿戴者数据并能够帮助改善穿戴者的生活质量;另一方面,可穿戴设备收集的穿戴者数据暴露可能损害穿戴者的日常生活。理想状态下,用户希望使用可穿戴设备,但不用担心个人隐私信息的泄露。研究近期的解决方案或者忽略了用户识别系统带着的能量消耗,或者添加了昂贵的硬件设备,或者需要用户执行特定的运动过程来完成数据建模。



技术实现要素:

为解决上述问题,本发明基于研究中已得出的“每个人的步态特征具有唯一性”的结论,将用户走路时的步态特征作为用户身份的识别特征,提出一种通过加速度传感器收集步态数据,对用户步态建模和分析,通过与分类模型输出值来识别当前用户身份的方法和系统,降低用户识别系统的能量消耗,增强对用户隐私和安全的保护。

在本发明所公开的基于步态的可穿戴设备用户识别方法如下:

将加速度传感器自动收集用户数据进行预处理并得到用户步态数据,提取用户步态数据的特征值并输入至用户分类器,根据用户分类器的输出结果即可判断用户是否为可穿戴设备拥有者。

进一步的,用户分类器的建立包括以下步骤:

s1、加速度传感器自动收集用户的动态数据;

s2、对收集的动态数据进行预处理,即采用数据平滑法过滤掉用户的非步态数据;

s3、对预处理后的步态数据提取特征值,并形成由多个特征值组成的用户步态数据特征向量;

s4、将多个特征向量作为一类支持向量机方法的训练数据,对步态特征训练并形成用户分类器;

进一步的,在后续使用中,系统将经过步骤s1至s3得到的用户步态数据特征向量作为分类器的输入,分类器根据用户步态数据特征向量进行数据分类,判定用户是否为可穿戴设备拥有者。

进一步的,分类器判断是可穿戴设备拥有者时,可穿戴设备会正常解锁让用户使用,否则,可穿戴设备被锁定不被用户使用。

进一步的,加速度传感器为可穿戴设备自带的(内置的)三向加速度传感器。

进一步的,s1中通过动态数据收集方法收集用户的动态数据,即将数据收集时间划分为多个时间片,加速度传感器在每个时间片中随机选取一个时刻收集数据,若当前时刻加速度传感器收集到是动态数据,则继续在当前时间片收集,若当前时刻收集到是静态数据,则放弃在该时间片的数据收集,加速度传感器会进入休眠状态,直到下一个时间片被唤醒。

进一步的,通过傅立叶变换计算收集数据的频率大小并判断当前数据是静态数据还是动态数据。

进一步的,s2中,利用快速傅里叶变换对收集的动态数据进行分析,得到动态数据的频率分布,对傅里叶系数峰值点对应的频率不符合特定频段的动态数据认为是非步态数据,并直接选择丢弃。

进一步的,s3中的用户步态数据特征值至少包括步态数据的均值、标准差、方差、平均绝对偏差、四分位距、功率和能量中的两种。

进一步的,加速度传感器为三向加速度传感器,对三向加速度传感器采集的三个方向上的加速度进行合成得到加速度mi,将n个合成后的加速度mi放入一个窗口中用于一组特征值数据的提取,并得到一个对应的用户步态数据特征向量,即一条一类支持向量机方法的训练数据,其中,

式中,xi,yi,zi是在i时刻三个轴上的加速度。

进一步的,s4中所述的一类支持向量机方法如下:

使用核函数将得到的步态数据特征值转换到高维的特征空间,并在这个特征空间内建立一个用于数据区分的最大间隔超平面,即分类器;最大间隔超平面的建立是通过计算所有训练样本的最小距离距离,即:

(ω·φ(xi))≥ρ-ξi(i=1,2...,lξi≥0)

式中,ω和ρ都是超平面参数,φ是从输入空间到特征空间的映射函数,v是允许的异常值的渐近分数,l是训练集合的数量,ρ是一个松弛变量;

决策函数用于输出最终数据区分结果,在后续使用时,用户数据输入分类器后,通过决策函数输出值即可用于识别用户,决策函数f(x)的计算公式为:

f(x)=sgn(ω·φ(x)-ρ)

其中,sgn为符号函数;

事实上,通过核函数转换数据七个特征值后,一类支持向量机改变原始数据集为第二分类的唯一成员,使用松弛参数分离数据集中的一个类,然后使用标准的二分类支持向量机;一类支持向量机算法返回一个函数f在小区域中取值为+1,在其他区域中取值为-1,即决策函数f取值为“+1”时为可穿戴设备拥有者,否则取值为“-1”。

进一步的,使用的核函数是高斯核函数。

本发明还公开一种基于步态的可穿戴设备用户识别系统,采用上述用户识别方法的进行可穿戴设备的用户识别,具体可包括数据采集模块、预处理模块、步态数据特征值提取模块、分类器训练模块及用户识别模块。

本发明与现有技术相比,在能量高效、降低噪点和减少用户干预三个方面均具有较大的改进,具体有益效果如下:

(1)能够通过可穿戴设备的内置传感器收集步态数据,并建立用户分类模型(分类器),无需用户单独再执行特定的运动过程,减少了对设备拥有者的干预,能自动的使用当前获取的可穿戴设备拥有者数据,提取步态特征值,并建立分类模型,明显降低了可穿戴设备识别的能量消耗。

(2)能够准确识别当前用户身份,增加了可穿戴设备拥有者的隐私性和安全性。

(3)采用动态收集算法收集数据,减少不必要的数据收集时间段,降低能量的消耗。

(4)利用快速傅里叶变换更加精准的收集步态数据,去除噪点数据,提供用户身份预测的精度。

(5)使用一类数据挖掘分类方法中的一类支持向量机算法,通过使用无干扰的数据进行数据分类模型的训练,极大地减少了对用户的干预,也进一步降低用户识别系统的能量消耗。

附图说明

图1可穿戴设备用户识别方法流程图;

图2中,(a)为行走时采集的数据图谱,(b)为上下楼采集的数据图谱。

具体实施方式

下面结合附图和具体实施例,对本发明作进一步说明。

如图1所示,本发明所公开的基于步态的能量高效的可穿戴设备用户识别方法,主要分为两大阶段,即分类器建立阶段和通过分类器实现可穿戴设备用户识别阶段。具体包括以下5个步骤:

步骤1:动态数据收集

通常采用加速度传感器来收集用户的步态数据,实施例中可直接使用可穿戴设备自带的三向加速度传感器收集用户步态数据,无需额外增加硬件,节约成本,减少能耗。

收集数据会产生很多冗余数据并且会对可穿戴设备消耗更多的能量,而一个小的精准的步态数据集既能够减少能量消耗,又能够提高预测准确度。为了能够更加准确地收集数据集和节约能量,本发明设计了动态数据收集方法,通过傅立叶变换计算收集到的数据的频率,通过频率的大小判断当前数据是静态数据(频率为0或近似为0)还是动态数据。使可穿戴设备内置的加速度传感器在用户动态(即通常认为的走路、跑步、上下楼、爬山等运动状态)时收集用户数据,在检测到用户的静态(即通常认为的睡觉、静坐、日常电脑前办公等静止状态)数据时,加速度传感器进入休眠状态。具体方法如下:

我们将数据收集时间划分为多个时间片,其中数据收集时间被定义为用户穿戴可穿戴设备的所有时间。加速度传感器在每个时间片中随机选取一个时刻收集数据。如果当前时刻加速度传感器收集到运动数据,则可穿戴设备用户识别系统会继续在当前时间片收集数据,如果当前时刻收集到用户静止数据,则放弃在该时间片的数据收集。将数据收集时间定义为t,分成n个时间片,每个时间片的时间为θ。每个加速度传感器在时间片[0,θ]维持一个计数器c,一个阈值k,和计时器t。k表示在一个时间片内系统数据收集次数,是一个比较小的整数,如1,2,3。θ是一个时间常量,θ的取值范围可设置为30s。计时器t为[0,θ]范围内的随机值,用于在[0,θ]范围内随机选取一个时刻进行数据收集。

当加速度传感器在一个时间片内开始收集数据,并检测到当前用户数据是动态数据,加速度传感器会给c加1。在t时刻内,如果c<k且用户正在运动,则持续收集数据直至时间片结束;否则,加速度传感器会进入休眠状态,直到下一个时间片被唤醒。当一个时间片的数据收集工作完成,c的值会被重置为0,t的值会被重置为[0,θ]范围内的随机值。

可见,本发明采用动态数据收集方法来减少硬件设备的能量消耗,不需要用户进行特定的步行数据收集阶段。可穿戴设备内置的加速度传感器在用户步行时收集用户数据,在检测到用户的其他的步态时,加速度传感器进入休眠状态。这种动态数据收集方法能大大减少硬件设备的能量消耗,达到能量高效。

步骤2:动态数据平滑处理

步态,即正常走路时所表现的姿态。用户的日常运动状态中包含多种,如走路、跑步、上下楼等,对应的动态数据也包含走路数据、跑步数据、上下楼数据等,而用于本发明模型的训练的数据仅限于正常走路数据,即,步态数据(注,本发明中所述的步态(数据)、走路(数据)、行走(数据)和步行(数据)指的是同一个意思)。本发明发现使用加速度传感器收集到的原始动态数据几乎不能用于模型的训练,其中包含太多的非正常步态噪点数据,因此需要进行预处理。

为了过滤非步行噪点数据,在数据收集过程中,同时结合数据平滑方法,减少其中非走路步态的噪点数据。众所周知,人在各种行走状态有不同的频率,如,跑步的频率、上下楼的频率是和行走的频率完全不同的。如图2所示,x轴代表活动频率,y轴表示傅里叶系数,找到系数的峰值,然后其对应的横坐标即为当前数据活动频率。从图2中可以观察到上下楼的周期与行走的周期完全不同。故,可通过各种运动状态的傅里叶系数峰值点对应的横坐标获取运动状态的活动频率,从而对不同的运动状态进行区分和过滤。具体可结合快速傅里叶变换实现数据平滑方法,即,利用快速傅里叶变换对动态数据的进行分析,得到各类运动状态对应的动态数据的频率分布,当发现当前动态数据的傅里叶系数峰值点对应频率不符合特定频段的,则认为该数据不是步行数据,直接选择丢弃,以此过滤掉收集的动态数据中非步态数据,即噪点数据。其中,特定频段指的根据经验值得到的用户步态数据的频率分布范围。可见,通过数据平滑处理,可降低噪点,减少用户干预,更加精准的收集步态数据,提升用户身份预测的精度。

步骤3:步态数据特征提取

许多流行的智能可穿戴设备,如:applewatch,samsunggears2和华为手表都是内置加速度传感器的。实施例中同样使用的是3向(x,y,z)加速度传感器进行数据采集,其中,xi,yi,zi分别代表i时刻该方向上的加速度。考虑到加速度传感器每次可能被放置在不同的位置,而传感器的位置会影响三个方向的加速度大小,故通过计算三个方向上合成后的加速度的大小来消除方向对加速度测量的影响:其中,xi,yi,zi是在i时刻三个轴上的加速度。

将n个加速度数据放入一个窗口(相当于多个数据的集合)中{min,...,min+n-1}(i=0,1,2,...),通过将多个加速度数据放在一个窗口,作为后续分析计算的基础(即用于提取特征值数据),可以减少数据冗余,提高用户识别的准确度。

实施例中,将一个窗口中经过平滑处理后的步态数据提取均值、标准差、方差、平均绝对偏差、四分位距、功率和能耗七个值作为用户步态数据的特征值,通过对n个加速度数据提取七个特征值来提高用户识别的准确度,各特征提取公式如下:

均值:

标准差:

方差:

平均绝对误差:

四分位距:iqr=q3-q1

功率:

能耗:

以上公式中,表示在i时刻xi,yi,zi三个轴方向上合成后的加速度,q1和q3分别表示一个窗口中的上中位数和下中位数。

在分类器建立阶段,可将得提取的七个用户步态数据特征值组成一个特征向量,每一个特征向量可作为分类器作为训练集中一个训练样本。在分类器建成,用户识别阶段,形成的特征向量作为分类器的输入进行用户识别。

步骤4:当前数据分析

传统上,机器学习应用是使用训练数据训练分类器,并生成分类模型(本文中分类器、分类模型、数据模型指的是一个意思),然后通过执行分类模型对测试数据进行分类。

在多分类或者多分类场景中,已经很多分类方法被提出。但是,本发明考虑训练数据集只来自一个可穿戴设备拥有者的情况。在获得更多陌生人的数据集时,我们希望能够区别可穿戴设备拥有者和陌生人的身份,这种情况称为一类分类。可以想象一种场景,当一个小偷窃取了可穿戴设备,设备拥有者希望设备可以识别当前穿戴该设备的用户是否为设备拥有者。在这种场景中,提前收集小偷的数据作为测试数据是不现实的。如果我们使用监督性数据学习方法来训练分类器,对于这种情况,数据模型没有办法来对小偷的数据做身份预测。但如果只有一类训练数据,能否将测试数据进行正确的分类呢?在机器学习中,支持向量机(svm)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。本发明使用一类支持向量机(one-classsvm)方法来对唯一用户数据集进行用户身份分配。使用可穿戴设备拥有者的训练数据创建数据模型,如果新收集的数据与数据模型相差太多,模型可以根据一些方法标记新收集的数据为非设备拥有者数据,使得设备可以识别出当前用户不是设备拥有者。

传统的支持向量机(svm)通过一个非线性函数将数据投影到一个非线性决策边界中。一类支持向量机中,使用核函数将得到的步态数据特征值转换到高维的特征空间,在这个空间建立一个最大间隔超平面用于数据区分。最大间隔超平面即为分类器,超平面的建立是通过计算所有训练样本(即特征向量)的最小距离距离,即:

(ω·φ(xi))≥ρ-ξi(i=1,2...,lξi≥0)

式中,ω和ρ都是超平面参数,φ是从输入空间到特征空间的映射函数,v是允许的异常值的渐近分数,l是训练集合的数量,ρ是一个松弛变量。

决策函数用于输出最终数据区分结果,决策函数f(x)的计算公式为:

f(x)=sgn(ω·φ(x)-ρ)

其中,sgn为符号函数:

事实上,通过核函数转换数据七个特征值后,一类支持向量机改变原始数据集为第二分类的唯一成员,使用松弛参数分离数据集中的一个类,然后使用标准的二分类支持向量机。一类支持向量机算法返回一个决策函数f在小区域中取值为+1,在其他区域中取值为-1,从而完成数据的分类。

实施例中,使用可穿戴设备穿戴者步行特征作为训练集,即通过步骤1至3获得的多个由七个步态数据特征值组成的特征向量,使用高斯核函数(rbf,)作为核函数转换训练集到高维空间(数据在二维空间中不可划分,而在三维空间中则可以划分)。其中,核函数是为了让二维数据转化为多维数据,方便数据区分,而选择高斯核函数是因为相对简单并且计算更快。

值得注意的是,分类模型成型后,还可对后续收集的步态数据再训练,实现更新分类,以进一步提高用户识别的准确度。故分类模型可包括初始成型和实时更新两个子步骤,即:

初始成型:将第一时间段收集的所有步态数据经过数据平滑处理,计算出特征向量后作为一类支持向量机方法的训练数据,得到的数据模型,即初始模型;

实时更新:将上一时间段收集的所有步态数据再作为一类支持向量机方法的训练数据,并对上一时间段形成的训练模型进行实时更新,更新后的训练模型作为本时间段的分类评价模型,而本时间段的步态数据又将作为模型更新的训练数据,更新后的训练模型又成为下一上一的分类评价模型,并以此循环,作到实时更新训练模型,保证模型的精准性。

但根据经验得知,用户的步态数据特征在一定时间内是比较稳定的,实施例中通过可穿戴设备拥有者的步态数据形成的初始分类器即可满足识别用户的需求。

步骤5:用户身份识别

通过第一阶段(即通过上述步骤1至步骤4)形成用户分类器后,后续用户在使用可穿戴设备时通过分类器的输出值判断即可实现用户自动识别。具体的,系统将自动收集用户数据,经过步骤1至步骤3处理后得到的用户步态数据的特征向量,并输入用户分类器,然后根据分类器的输出值进行数据分类,判断该用户是否为可穿戴设备拥有者。即,当数据与分类器(数据模型)训练集相似时,分类器输出“1”,可穿戴设备会正常解锁让用户使用,当数据与分类器训练集不同时,分类器输出“-1”,可穿戴设备被锁定不被用户使用。以此保证可穿戴设备拥有者的隐私性和安全性。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1