一种人类活动识别的方法与流程

文档序号:13983327阅读:544来源:国知局

本发明涉及预测技术,具体是一种人类活动识别的方法。



背景技术:

人类活动识别旨在识别一个人对他/她自己和周围环境的一系列观察所进行的行动。可以通过利用身体佩戴的传感器来源获取的信息。这是一个热门的的研究领域,主要目的是提取传感器中的数据知识。特别是医疗领域,军事和安全应用(zengd,chenh,luschr,lis-h.socialmediaanalyticsandintelligence.ieeeintelligentsystems2010,25:13-16.)。例如,糖尿病患者、肥胖人群、心脏病患者他们治疗就包括了良好的运动锻炼习惯。因此,识别活动,如散步,跑步,或骑自行车就变得非常有用,提供反馈照顾病人的行为或建议。同样,还可以监视痴呆症和其他精神疾病检测异常活动,从而防止不良后果。在军事上,为士兵提供精确的位置信息和实时了解士兵的生命体征信息能够更好的保障他们作战和生命安全(anguitad,ghioa,onetol,parrax,reyes-ortizjl.humanactivityrecognitiononsmartphonesusingamulticlasshardware-friendlysupportvectormachine.in:internationalworkshoponambientassistedliving:springer;2012.pp.216-223.)。此外智能环境辅助生活、普适计算等领域中,日常生活活动的自动监护和识别都是一个关键挑战。这都表明活动识别研究成果对相关领域研究和应用都有益处,对相关领域专家也有借鉴之处。因此这就迫切需要研究一种新方法和新手段来解决低级传感器数据和高级活动识别概念之间的对应关系问题。在智能健康监护和老年人护理等许多领域,基于多源多维传感器数据的自动活动识别是非常重要的研究方向(bringmannb,berlingeriom,bonchif,gionisa.learningandpredictingtheevolutionofsocialnetworks.ieeeintelligentsystems2010,25:26-35.)。

活动识别最早研究可以追溯到上世纪90年代。最近几年,通过各种传感器数据进行识别简单活动如休息、散步和跑步等的研究已经取得了成功。而复杂活动涉及到简单活动的组合,识别率仍然较低,复杂活动研究仍然具有挑战性(zhangd,maow,zhanj,zengd.editorial:specialissueon“socialcomputingande-business”.informationsystemsande-businessmanagement2012,10:161-163.)。



技术实现要素:

本发明的目的是针对现有技术的不足,而提供一种人类活动识别的方法。这种方法实验数据收集简单、识别人类活动快速准确。

实现本发明目的的技术方案是:

一种人类活动识别的方法,包括如下步骤:

1)模型定义:活动识别系统预定义活动类别,机器学习模型定义如下:

假设活动类别定义为集合a={a0,···,ac-1},m个活动采集的等长时间窗数据集合记为{w0,w1,···,wm-1},每个时间窗数据包括k个传感器的一段时间的测量值,m个活动对应的类别记为{y0,y1,···,ym-1},yi是a中的一个元素,活动识别的目的是基于上述训练数据找到数学模型f:wi→a,使得f(wi)和对应的活动类别yi相同;

2)执行动作并记录数据:让佩戴传感器的人执行2组选定的站立、坐下、躺下、步行、上楼和下楼六个人类活动动作,每一个动作执行完成与开始执行下一个动作之间间隔5秒,6个动作执行完毕为一组,然后将传感器的数据记录下来;

3)整理数据并上标签:将步骤2)中记录的传感器的数据,按照每组数据的真实活动贴上标签,标签不做具体限定;

4)构造预测模型:采用adaboost(adaptiveboosting,自适应增强)算法和决策树构造预测模型,给定一个训练集样本t={(x1,y1),(x2,y2),…,(xn,yn)},其中x∈χ,空间yi是标签集合{1,2,3,4,5,6},n是训练样本的数量,初始化训练样本的权值分布,每一个样本都被赋予相同的权重1/n,即如公式(1):

选用决策树作为弱分类器,对训练样本进行训练,得到一个弱分类器gm(x),对训练样本训练结束以后会得到一组预测值,也就是活动标签,将预测到的活动标签与给定的训练标签进行比对就可以计算gm(x)在训练样本上的分类错误率em,如公式(2):

由公式(2)可知,gm(x)在训练样本中的错误率em就是被gm(x)错误分类样本的权值之和,

计算gm(x)的权重系数αm,它表示gm(x)在最终的分类器中的重要程度,换句话说,也就是最终的模型是由带有权重系数的弱分类器集成的,权重系数αm,表示为公式(3):

当em≤1/2时,αm≥0,并且αm会随着em的减小而增大,这就意味着分类误差率越小的弱分类器在最终的分类器中所起的作用就越大,最重要的一点就是如何让被错误分类的样本在下一轮迭代中能被重点对待,给所有的训练样本做编号,并且记录了被错误分类样本的编号,每个样本都有一个权值与之一一对应,可以更新训练样本的权值分布如公式(4):

其中zm是使得dm+1成为一个概率分布的规范化因子,它可以如公式(5)表示:

这样做的目的是为了使被弱分类器gm(x)错误分类样本的权值增大,而被正确分类样本的权值减小,进而在下一个迭代过程中,弱分类器会更关心被错误分类的样本,这里需要注意的是,迭代过程中,训练样本永远是唯一的,始终是最初的那个训练样本,只不过我们给这个训练样本加上了一个权重,然后再重复以上过程,直至达到预先给定的目标,

根据弱分类器以及各自对应的权重因子,将它们一一对应得到公式(6):

从而得到最终的模型g(x),如公式(7):

5)识别:佩戴传感器的人再次执行步骤2)中的任意一种人类活动动作,将传感器中的数据输入到步骤4)构造好的模型中,该模型就会输出一个活动标签,活动标签所对应的人类活动即为我们的预测结果。

步骤1)中所述传感器为陀螺仪传感器,目的就是为了识别六种不同的人类活动即站立、坐下、躺下、步行、上楼和下楼,陀螺仪传感器能够收集三轴线性加速度和角速度信号数据。

这种方法实验数据收集简单、识别人类活动快速准确。

附图说明

图1为实施例的方法流程示意图。

具体实施方式

下面结合附图和实施例对本发明内容做进一步的阐述,但不是对本发明的限定。

实施例:

参照图1,一种人类活动识别的方法,包括如下步骤:

1)模型定义:活动识别系统预定义活动类别,机器学习模型定义如下:

假设活动类别定义为集合a={a0,···,ac-1},m个活动采集的等长时间窗数据集合记为{w0,w1,···,wm-1},每个时间窗数据包括k个传感器的一段时间的测量值,m个活动对应的类别记为{y0,y1,···,ym-1},yi是a中的一个元素,活动识别的目的是基于上述训练数据找到数学模型f:wi→a,使得f(wi)和对应的活动类别yi相同;

2)执行动作并记录数据:让佩戴传感器的人执行2组选定的站立、坐下、躺下、步行、上楼和下楼六个人类活动动作,每一个动作执行完成与开始执行下一个动作之间间隔5秒,6个动作执行完毕为一组;

3)整理数据并上标签:将步骤2)中记录的传感器的数据,按照每组数据的真实活动贴上标签,标签不做具体限定,本例规定站立、坐下、躺下、步行、上楼和下楼分别用1、2、3、4、5、6作为数据标签;

4)构造预测模型:采用adaboost算法和决策树构造预测模型,给定一个训练集样本t={(x1,y1),(x2,y2),…,(xn,yn)},其中x∈χ,空间yi是标签集合{1,2,3,4,5,6},n是训练样本的数量,初始化训练样本的权值分布,每一个样本都被赋予相同的权重1/n,即如公式(1):

选用决策树作为弱分类器,对训练样本进行训练,得到一个弱分类器gm(x),对训练样本训练结束以后会得到一组预测值,也就是活动标签,将预测到的活动标签与给定的训练标签进行比对就可以计算gm(x)在训练样本上的分类错误率em,如公式(2):

gm(x)在训练样本中的错误率em就是被gm(x)错误分类样本的权值之和。

计算gm(x)的权重系数αm,它表示gm(x)在最终的分类器中的重要程度,换句话说,也就是最终的模型是由带有权重系数的弱分类器集成的,权重系数αm,表示为公式(3):

当em≤1/2时,αm≥0,并且αm会随着em的减小而增大,这就意味着分类误差率越小的弱分类器在最终的分类器中所起的作用就越大,最重要的一点就是如何让被错误分类的样本在下一轮迭代中能被重点对待,给所有的训练样本做编号,并且记录了被错误分类样本的编号,每个样本都有一个权值与之一一对应,可以更新训练样本的权值分布如公式(4):

其中zm是使得dm+1成为一个概率分布的规范化因子,它可以如公式(5)表示:

这样做的目的是为了使被弱分类器gm(x)错误分类样本的权值增大,而被正确分类样本的权值减小,进而在下一个迭代过程中,弱分类器会更关心被错误分类的样本,这里需要注意的是,迭代过程中,训练样本永远是唯一的,始终是最初的那个训练样本,只不过我们给这个训练样本加上了一个权重,然后再重复以上过程,直至达到预先给定的目标,

根据弱分类器以及各自对应的权重因子,将它们一一对应得到公式(6):

从而得到最终的模型g(x),如公式(7):

5)识别:佩戴传感器的人再次执行步骤2)中的任意一种人类活动动作,将传感器中的数据输入到步骤4)构造好的模型中,该模型就会输出一个活动标签,活动标签所对应的人类活动即为我们的预测结果。

步骤1)中所述传感器为陀螺仪传感器,目的就是为了识别六种不同的人类活动(站立,坐下,躺下,步行,上楼和下楼),陀螺仪传感器能够收集三轴线性加速度和角速度信号数据。

实验例:

使用本实施例的方法得到的识别准确率与文章(2013-apublicdomaindatasetforhumanactivityrecognitionusingsmartphones)进行了对比,结果如表1所示:

表1实验对比结果

由表1可以看出,使用本实施例的方法得到的识别准确率对人类活动识别的准确率较高。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1