一种基于移动设备的人体行为识别方法_3

文档序号:9911587阅读:来源:国知局
频率设置为50Hz。数据采集 时,对设备放置方向和行为的具体实现方式等因素未做要求。每个采样点的采集到的数据 格式为Xi=[xi,x2,.. .,xp]eRp,P = 9,le{l,2,. ·.,L},L为传感器数据总的采样长度,L = 485050。该九维传感器原始数据包括三维的加速度数据、三维的陀螺仪数据、一维的气压传 感器数据、一维的光线传感器数据和一维的距离传感器数据。
[0076] 本实施例使用该小米4手机设备采集传感器原始数据,用于设备位置分类模型和 行为分类模型的训练和评估。参与数据采样的人数为10人,其中包括3名女性和7名男性;采 集的行为包括坐、站、走、跑、上楼、下楼6种类别。上述6种行为类别分别记为 ai,a2, ...,a6, 构成行为集合六={&1,&2,..., &6}。采集的移动设备位置包括裤口袋中、上衣口袋中、双肩包 中、单肩包中、手持于体侧、放置在耳边、手持于胸前、放置在桌面上8种类别。上述8种设备 位置分别记为口1,口2,...,口8,构成设备位置集合?={口1,口2,...,口8}。
[0077]如图2所示,在分类模型的训练流程中,由移动设备采集到的多种传感器原始数据 需要经过进一步的预处理操作。这些操作包括对加速度数据的校正,对加速度传感器、陀螺 仪和气压传感器数据的滤波去噪,根据校正和滤波后的数据计算生成数据、对连续数据的 数据分割。
[0078] 其中,生成数据包括三维的重力加速度数据、三维的线性加速度数据和一维的加 速度幅值数据。具体实现包括对三维加速度数据进行低通滤波,低通滤波计算如式:
[0079] af iltered ( 1 ) - elf iltered ( 1 -1 ) +〇 X ( Sunf iltered ( 1 ) -Sf iltered ( 1 -1 ) ) ( 1 )
[0080] 其中1表示当前采样点,afiit_d(l)是滤波后的加速度值,aunfii t_d(l)是滤波前的 加速度值,系数α为截止频率,设置为0.05Hz。
[0081] 通过低通滤波器后获得的数据为三维重力加速度数据,剩下的高频部分,即ahlgh (l)=a(l)-afiitered(l)为线性加速度数据。
[0082] 生成数据还包括一维加速度幅值数据的计算,S丨
lx、ay、 az为当前采样点处的三轴加速度数据。因此,生成数据的形式为.. .,yQ]eR?,Q =7。由校正、滤波后的传感器采集数据和生成数据合并,获得每个采样点上的数据 [X1,Y1]ER p+Q,P+Q=16,le{l,2,· · ·,L}。
[0083] 数据分割是对传感器数据集各个维度上的连续数据使用滑动窗口法进行处理,采 用长度为2秒,即包含数据采样点数为100的滑动窗口,相邻的两个窗口间设置为50%的覆 盖。该滑动窗口法将采集到的连续数据分割为fl 〇〇r(T/50-l)数目的数据段,其中floorO 为向下取整函数。分割获得总数据段数目K = 9551。
[0084] 特征集F由均值、标准差、方差、偏度、峰度、最大值、最小值、均方差、四分位差、平 均绝对离差、覆盖范围11类特征构成,每类特征对数据段的P+Q=16个数据轴各产生16项特 征,因此共生成N= 11 X 16 = 176项特征。
[0085] 经过预处理后的数据进入特征提取流程。特征提取即对数据段所含数据的特征计 算。对上述获得的每个数据段,分别计算特征集F中的N项特征,获得每个数据段计算特征向 量Vk= [VI,V2,. . .,VN] eRN,ke {1,2,. . .,K}。所有获得的特征向量组成样本集S = [Vi; V2; . . . ; Vk]ο
[0086] 将上述样本集S中的每个特征向量V k与位置标记ρ i组成训练向量
,Plep。由训练向量f沟成训练集
用于 设备位置分类模型的训练。
[0087]训练设备位置分类模型采用C4.5方法原理训练决策树分类模型。在训练时,每个 分裂节点选择信息增益率最高的特征作为分裂条件。信息增益率的计算方式如下:
[0088]
[0089] ⑵
[0090]上式中,分子表示由训练集分裂带来的信息增益,即信息熵的减少,Entropy(T)表 示分裂前集合的信息熵
I表示分裂后集合的。其中Entropy是集 合的信息熵,?1是训练集T中属于类别i的比例,m为目标类别的数目;V(f)是特征f可能的所 有取值集合,v是其中满足分裂条件的取值集合;Τν是训练集T中特征值满足分裂条件的子 集,¥是τν中特征向量数目与原集合T中的特征向量数目的比值.分母项表示分裂信息度, |Τ·Ι 其中;Ti是目标类别i对应的特征向量集合,g是目标类别i对应的特征向量数目与原集合 T中的特征向量数目的比值。
[0091] 根据上述方法原理,训练形成决策树分类模型,该决策树的大小为137,使用特征 数目为69个,约为特征集F中特征数目的上述的69个特征组成特征集,该特征集即用于 3 设备位置识别的特征集&,如图3所示。
[0092] 使用训练集对训练得到的设备分类模型进行评估。评估使用了十折交叉验证法, 得到的设备位置的平均识别准确率为97.2%。
[0093] 将上述样本集S中的每个特征向量V与行为类别标记^组成训练向里
ajEA,对应数据采集时的6种人体行为类别。由训练向量构成 训练集Τβ = ,用于特征选择。特征选择包括过滤和封装两步过程。过滤 对特征集F中的每一项特征计算信息增益率,信息增益率如式(2)所述,根据信息增益率大 小进行排序,选择排序靠前的Μ项特征,取Μ=100。随后,结合支持向量机模型进行封装过 程,对过滤后的特征集进行进一步筛选。封装过程综合考虑分类的准确率和召回率,采用支 持向量机分类结果的F-Measure作为评价标准,计算方式如下:
[0094]
(3)
[0095] 其中P表示分类模型输出的精确率,R表示分类模型输出召回率。过滤后的全部特 征输入支持向量机时得到的F-Measure为93.12%。通过前向顺序搜索策略逐步搜索过滤后 的特征集,当分类模型的输出满足设置的阈值,即F-Measure超过88.46%时,输出特征搜索 结果,该结果包含49项特征。这些特征构成用于人体行为识别的特征集F a。
[0096] 对样本集S,筛选位置类别为?1的特征向量,组成样本子集51,满足馬C S,ie{l, 2,...,8}。对样本子集51中的每个特征向量^^,标记数据采集时的行为类别%,&卢六,获得 行为训练向量1^ = [^^,^^,、^{^,...,^:^标记后的所有训练向量构成行为训练集
为该行为训练集中特征向量数目。利用行为训练集7;%川 练分类模型,获得行为分类模型ca1(3训练行为分类模型cm采用支持向量机方法实现。
[0097]该支持向量机模型目标类别为人体行为,包括6种目标类别,采用一对一的多类别 分类策略,对应函数《g(x) = 因此需要训练15个支持向量机构成完整的多分类模 型。每个支持向量机选择两种行为类别对应的数据,根据输入的训练数据计算支持向量及 参数,构造最大间隔分类超平面,该分类超平面由式/(X) = ΣΓ=?α?>^ +办定 义,其中χ是输入的特征向量,其中χ是输入的特征向量,Xl是支持向量,yi是支持向量对应的 结果标签,yi取值满足yiG {-1,1},n为支持向量数目,ai和b为计算得到的支持向量参数,K (X,Xl)是用于将输入的非线性低维特征向量映射到高维空间实现线性可分的核函数;核函 数采用径向基核函数,由式_定义,其中X。为核函数中心,σ为函数的宽 度参数,取σ = 1。
[0098] 对上述支持向量机模型分别取i = l,2, ...,8,依次重复,进而训练得到8种不同位 置类别情况下的行为分类模型cm,Ca2,...,ca 8。使用训练集对训练得到的基于不同位置的 行为分类模型评估,结果如表1:
[0099]
[0100] ~表1基于不同位置的行为分类模型评估 ' '
[0101] 利用训练集对位置不加区分的行为分类方法和本发明提供的行为分类方法进行 评估,如表2,可以看到本发明提供的分层行为分类方法对行为识别准确率有较大提升。
[0102]
[0103] 表2是否区分设备位置的两种分类方法准确率对比
[0104] 如图1所示,上述训练好的设备位置分类模型和基于不同设备位置的行为分类模 型构建起了分层的行为识别模型。在实时的识别过程中,具体包含实时数据采集、数据预处 理、特征提取,以及设备位置识别和行为识别过程。
[0105] 在任意位置下,通过移动设备内置的加速度传感器、陀螺仪、气压计、光线传感器 和距离传感器以50Hz的频率采集实时数据。
[0106] 获取的数据经过数据校正、滤波、生成数据计算,当采样的数据点数满足预先设定 的窗口条件时,即满足新的采样点数目达到50时,连同该窗口之前的50个采样点组成采样 长度为1〇〇的窗口,形成当前
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1