基于机器学习的无线感知动作识别方法与流程

文档序号:11134635阅读:1373来源:国知局
本发明属于人工智能技术的领域,具体涉及一种基于机器学习的无线感知行为识别方法。
背景技术
:当今社会,随着信息技术的不断发展,作为人工智能技术中的一个重要研究领域,人体行为识别技术的发展已经成为促进如健康医疗、智能家居、健康状态追踪等领域进步的关键技术,具有十分重要的地位。传统的人体动作识别技术主要是使用摄像设备、雷达或者一些可穿戴传感器设备。然而基于视觉的方法,受限于用户隐私及光线条件。用雷达的操作方式受限于其操作距离区间。而可穿戴的一些传感器设备又不够便携,用起来不方便。同时随着社会的发展与无线网络/移动终端的日益普及,基于WIFI信号的各种应用层出不穷,如基于WIFI信号的目标跟踪技术、基于WIFI信号的室内定位技术、基于WIFI信号的人体行为识别等。在基于WIFI信号的人体行为识别技术中,通常是通过观察不同人体活动会导致的不同的多径信道变化的现象,从而建立人类活动与WIFI信号之间的关系。比如WiSee,E-eyes和WiHear这些方法都提出WiSee使用通用软件无线电外设去捕捉OFDM信号并通过人类身体的九种手势测量被反射信号中的多普勒频移,其中E-eyes使用信道状态信息直方图,如指纹库一样,来识别人们的日常活动;WiHear使用特殊的矢量天线,来获取由于人们嘴唇挪动造成的CSI(信道状态信息)变化。上述基于WIFI信号的方法比基于摄像设备和传感器的方法更好,因为它们对光线没有要求,而且这些方法相比传统动作识别方法提供了更大的覆盖范围并且可以穿墙操作,不要求用户携带任何设备也保护了用户的隐私,只需要利用人体对WIFI信号的反射作用。所谓的CSI即一组采样版本的CFR,具体而言,利用兼容IEEE802.11a/g/n的无线网卡即可从每个接收数据包中获取一组CSI,每组CSI代表一个正交频分复用子载波的幅度和相位。相较于传统的使用RSSI做无线感知,CSI带来的不仅是信道信息容量的扩充,通过综合应用信号处理和机器学习技术,可以从CSI中合理提取更为精细且鲁棒的信号特征从而在时域和频域上感知更细微或更大范围内的环境信息,提升WIFI信号对环境的感知能力。但目前的基于WIFI进行人体行为识别的工作大多是通过直观的利用CSI值,观察在不同动作下CSI数据的变化情况。而没有提出一种定量化的特征来描述CSI数据及不同人体动作之间的联系,使得所设计的动作识别模型在不同的环境下体现出良好的鲁棒性。而且目前大多数研究中所使用的传统的低通滤波器、中通滤波器来对采集到的CSI数据去噪,去噪效果不是特别理想,需要采用更好的去噪技术。技术实现要素:本发明的发明目的在于:针对上述存在的问题,提供一种具有高识别精度并对环境变化体现出良好鲁棒性的人体行为识别方法。本发明的基于机器学习的无线感知动作识别方法主要分为四个部分,分别为数据采集、预处理、特征提取及训练识别,如图1所示。数据采集是通过CSI采集平台从接收数据包中获取一组CSI,采集平台中采样率和频段的选择也十分重要,采样率如果取得过低则会导致信号失真,一般考虑到室内人体动作的移动速度一般在7.7m/s以下,有对应CSI上限波动频率f表达式:f=(15.4*K)/c,其中K表示WiFi频段,c为光速,结合奈奎斯特采样定理,采样率取2fHz以上比较合适。而WiFi频段一般有两种选择,即2.4GHz或者5GHz,由于5GHz频段的波长更小,则人类室内活动上限速度对应的CSI波动频率值会更大,因而导致能有更好的速度分辨率,所以5GHz频段会是一个更好的选择。预处理的工作主要是因为环境中的噪声影响,使得画出的CSIvalue波形难以提取特征。并且考虑到在每个时间点上的CSI矩阵数据量过大,有很多信息其实都是冗余的。若能最大程度的提取有用信息去掉冗余信息,则能很大程度的提高系统的工作效率。而PCA技术就是通过一种对目标数据做方差最大化处理的思想,来减小不同维度数据之间的相关性,从而做最大化保留信息的降维处理,对数据起到一个去噪去除冗余信息的作用。综合以上考虑,预处理部分将主要利用PCA技术对CSI数据流进行去噪并提取主特征,与以往PCA处理不同的是,由于考虑到第一主特征还是带有许多噪声干扰,而第二主特征所携带的噪声干扰更小并且也具备CSI数据的主要特征信息,所以本发明取第二主特征向量为投影空间。最终得出一个较理想的波形来代表在对应动作下CSIvalue值随时间变化的状态。图2为一个walk动作下未经处理的CSIvalue的波动情况。图3为经PCA去噪后得出的CSIvalue波动情况。从结果中可以看出使用PCA去噪后明显波形更加的平滑,而且PCA过程在本发明中是综合考虑了Nr×Nt条信道下,每30个子载波的携带特征情况,最终求出主特征向量映射出一条去除大部分噪声影响且携带主要特征信息的CSIvalue曲线。特征提取是本发明最关键的一个部分。考虑到移动物体的运动速度与CSIvalue波动频率之间的关系:在室内条件下,当多传播路径的路径长度发生改变时,CFR功率会根据路径长度的不同而改变。为了保证在不同环境下能体现出良好的鲁棒性,本发明选用CSIvalue波动频率及速度信息作为主要特征。因离散小波变换能够做到高频处时间细分,低频处频率细分的效果,能够自动适应时频信号分析的要求。本发明的特征提取方式为离散小波变换,将待处理信号按所选择的某一小波函数簇展开,即将信号表示为一系列不同尺度和不同时移的小波函数的线性组合,其中每一项的系数称为小波系数,小波系数可以表示在该尺度下信号与小波函数的相似程度。按照小波级数分级的规律,不同的小波级数代表一个频段。比如当采样频率为CHz,则Level1代表CHz~C/2Hz,Level2代表C/2Hz~C/4Hz依次类推。由于室内人体动作的移动速度一般在7.7m/s以下,故所提取的特征为小波级数对应上限CSI波动频率fHz左右到0Hz左右之间的小波级数对应的离散小波细节系数。除此之外还可运用percentile方法对运动的中心速度及上限速度进行的一个估计来作为辅助特征。本发明中的训练识别部分以改进过的SVM算法为主。简单来说在分类问题中,SVM是一种通过在训练样本构造的特征空间寻找最优分隔面,然后根据最优分隔面构造决策函数来对样本进行分类的一种算法。在针对小容量样本的分类问题及应用情况下,SVM算法的提出与应用通过广泛的验证都取得了良好的效果,而且由于引入了正则项,SVM算法的泛化能力与其他算法相比有很大的优势,这对提高系统的环境鲁棒性很有帮助。SVM所构造的分类面更加的简单合理、不受权值初值影响,具备良好的稳定性。但面对时间序列,由于时间序列读取出来是矩阵的形式而不是SVM所擅长处理的向量形式,而且连续的时间序列之间的隐状态是SVM无法顾及到的。因此传统的SVM模型处理起时间序列十分不便并且效果不理想,所以本发明中将引入Kmeans聚类算法来解决此问题,主要原理是在预处理阶段以一帧为单位将所有动作训练样本集的时间序列数据利用Kmeans算法进行聚类,形成K个词袋,不同的词袋代表了不同的小波系数及预测速度取值,因此不同的动作将会拥有不同的词袋特征向量,在理论上也保证了不同动作之间的区分度。在基于Kmeans聚类算法进行聚类时,本发明提出一种估算Kmeans的初始聚类中心及聚类簇数K的确定方法,即将所有动作的特征序列样本值集合在一起,以upperspeed为标准,对每个动作下高、中、低三个级别的速度都分别挑选N组对应的特征向量出来,并加入初始聚类中心集合I。最终集合I中特征向量数n即为聚类簇数,通过实验验证效果良好,这是因为速度信息也是通过小波系数估算得到,依据速度信息来选取聚类中心正是能够模糊代表每个时间片上的特征信息。而对于词袋而言,在一定范围内词袋数越多则表示与所有动作训练样本集作匹配的特征模板越多,也就说明对于特征的划分更加的细粒化,更加便于找到不同动作之间的区分度。在训练及识处理时,将实时输入的时间序列通过计算欧氏距离来进行分类,用投票的方式将时间序列数据处理成一个带有词袋统计信息的特征向量,这种方式通俗来说是一种二维转一维的方法,但这种转换方法不是盲目的转换而是立足于对于每个时间片上的小波系数特征及预测速度特征来先聚类再转换,充分保留了其特征信息,总的来说这样的处理可以巧妙的避开直接处理时间序列这个问题但又同时兼顾了一个时间序列特征的分布情况使不同动作间有一定区分度。最后再将此特征向量输入SVM模型来进行训练及分类。本发明具体包括下列步骤:步骤1:采集训练样本:101:对不同类别的动作,通过采集设备采集关于WIFI信号的信道状态信息CSI,采样率设置为2f,其中f表示CSI上限波动频率,将每个采样点上采集到的一组CSI数据取绝对值且读取成一个30×Nr×Nt的矩阵形式,得到一条CSI数据流,其中Nr表示采集设备的接收天线数,Nt表示发射WIFI信号的设备的发送天线数;步骤102:提取T条CSI数据流,并依采样时间排列成T×(30×Nr×Nt)的CSI数据流时间序列矩阵Z,每个类别的动作分别对应一个矩阵Z,由不同类别的动作的矩阵Z得到训练样本集,即每个训练样本对应一个矩阵Z;步骤2:对训练样本进行数据去噪处理,所述数据去噪处理包括下列步骤:(a)对矩阵Z进行低通滤波后得到矩阵Z';(b)对矩阵Z'进行PCA去噪:对矩阵Z'按时间序列计算平均CSI数据流,并将平均CSI数据流复制T次排列成T×(30×Nr×Nt)的平均CSI数据流矩阵AVE,将矩阵Z'与矩阵AVE的差记为矩阵H;(c)计算协方差矩阵W=HT×H,并对协方差矩阵W进行特征分解得到特征值与特征向量,基于第二大特征值对应的特征向量q得到数据去噪处理结果S=W×q;步骤3:对数据去噪处理后的训练样本进行特征提取,得到训练样本的特征向量;所述特征提取为:对待提取对象进行R(经验值,通常可设置为12-14)级离散小波变换得到小波系数矩阵,并对小波系数矩阵的每一行进行归一化处理,得到T×R的矩阵D;从矩阵D中每间隔h(经验值,通常可设置为6~10)行取一行,得到查找范围;基于R个小波级数的频段,从查找范围中查找与CSI上限波动频率f匹配的频段的小波级数M;将矩阵D中的前M维作为待提取对象的初始特征向量;设置M个标签用于区分M个小波级数,基于初始特征向量得到T×M的矩阵标签矩阵CFD,从矩阵CFD的第M维开始间隔遍历,若遍历到一个标签大于阈值的元素,则计数值vote的值加1,其中vote的初始值为0;当vote/M≥50%时,记录当前小波级数为mid;当vote/M≥0.95%时,记录当前小波级数为upper;其中,关于mid和upper具体可参考percentiles算法。根据公式得到中级速度midspeed、高级速度upperspeed,其中fmid表示小波级数mid的频段的中心频率,其中fupper表示小波级数upper的频段的中心频率,c表示光速、K表示WIFI频段;将midspeed和upperspeed增加到待提取对象的初始特征向量的最后两维,得到待提取对象的特征向量,即T×(M+2)的矩阵;步骤4:对特征提取后的训练样本集,进行Kmeans聚类处理:401:设置初始聚类中心集、聚类簇数:将同一类别的动作下的所有训练样本,基于特征向量中的upperspeed分为高速、中速、低速三种;对每个类别的动作,分别从高速、中速、低速中随机挑选N组特征向量并加入初始聚类中心集,并将初始聚类中心集的特征向量数n作为聚类簇数;402:基于步骤401设置的初始聚类中心集、聚类簇数进行Kmeans聚类处理,得到n个聚类中心,即n个词袋;步骤5:基于n个聚类中心,对训练样本进行特征向量转换处理,即将步骤3得到的T×(M+2)的矩阵形式的特征向量转换为列向量,以便于应用SVM支持向量机模型:构建n维列向量O,列向量的初始全为0;将训练样本的特征向量分别与n个聚类中心进行匹配,得到最匹配项(特征向量与聚类中心的欧式距离最小)为第k个聚类中心,则列向量O的第k维投票加1,其中k∈{1,2,…,n};步骤6:基于每个训练样本的列向量O,进行支持向量机SVM训练,得到不同类别的动作的SVM模型;步骤7:与训练样本相同的采集方式,采集待识别动作的CSI数据流时间序列矩阵Z,并进行步骤2、3所述的数据去噪处理和特征提取后,得到待识别特征向量;对待识别特征向量进行步骤5所述的特征向量转换处理后,输入到不同类别的动作的SVM模型进行类别匹配,输出识别结果。综上所述,由于采用了上述技术方案,本发明的有益效果是:具有高识别精度并对环境变化体现出良好鲁棒性的人体行为识别方法。附图说明图1为本发明的处理过错示意图;图2为为一个walk动作下未经处理的CSIvalue的波动情况;图3为经PCA去噪后得出的CSIvalue波动情况;图4为本发明在不同环境下的泛化能力的展示图;图5为与目前无线感知领域经典系统CARM的识别能力对比图;。图6为与目前无线感知领域经典系统CARM的环境鲁棒性对比图。具体实施方式为使本发明的目的、技术方案和优点更加清楚,下面结合实施方式和附图,对本发明作进一步地详细描述。以5种类别:stand(站)、sit(坐)、walk(走)、brushing(刷牙)为例,由本发明的基于机器学习的无线感知动作识别方法(简称WiAR方法)对训练样本进行SVM模型训练,以及测试样本的识别。表1给出了10-fold-crossvalidation统计检验法对本发明的识别效果的统计结果,其中WiFi频段为5GHz,采样率为2500Hz,小波级数R=12。表1编号standsitwalkbrushing平均识别率1100%100%96.7%100%290%90%96.7%88.9%3100%90%100%100%4100%90%96.7%88.9%590%100%96.7%88.9%6100%100%93.5%77.8%790%100%100%66.7%8100%90%96.7%88.9%9100%90%87.1%77.8%1090%100%100%100%总计求平均96%95%96.41%87.79%93.8%从表1的统计结果可知,本发明的WiAR方法的平均识别成功率能达到93.8%。在无线感知行为识别系统中,最为经典的系统之一为CARM。其处理时使用隐马尔科夫模型等方法。但隐马尔科夫模型主要是依靠最大似然估计的原理,其只有在训练数据十分充分的情况下才能保证训练出来的模型能很好的保证计算到的是全局最优,且要得到好的识别效果,初始参数的设定十分重要,而初始参数的设定目前还没有一个明确的方法可以准确的确定,因此该方案若要投入实际运用则有些难度。而且隐马尔科夫模型这种生成模型在处理分类问题上并不具备优势,泛化能力也有待提高。而SVM模型这类判别模型在处理小样本分类问题上则具备特有的优势并且有强泛化能力,图4为本发明的WiAR方法在不同环境(教师休息室(Lobby)、学生宿舍(Dormitory)、教室(Classroom)及户外场地(Outdoor))下的泛化能力的展示图。以其中一种环境(教师休息室)下采集的数据为训练样本,分别以在教师休息室、学生宿舍、教室及户外场地下采集的样本作为测试样本。其中WiFi频段为5GHz,采样率为2500Hz,小波级数R=12。从结果图中可以看出以教师休息室采集的数据为测试数据的情况下动作识别率高达90.22%,在未训练环境下进行测试,如学生宿舍、教室及户外场地采集的数据为测试数据时行为识别成功率仍然可达到88.45%、85.29%、83.25%。平均识别率高达86.8%,且在未训练环境下识别率波动不大。由此可见本发明的WiAR方法具备良好的环境鲁棒性及泛化能力。从图5的识别能力对比图可以看出,本发明提出的WiAR方法的平均识别率高达93.8%而CARM系统的识别率为92.6%,结果证明本发明提出的WiAR系统的识别能力略强于CARM。图6为本发明的WiAR方法与CARM的环境鲁棒性对比图,即对四种环境(Lobby、Dormitory、Classroom、Outdoor),将其中一种环境下的采集数据作为训练样本,分别以四种环境下的采集数据作为测试样本。从对比图中可看出本发明提出的WiAR方法在未训练环境下依然可以体现出很好的识别能力,稳定性强。而CARM在未训练环境下的识别率降低了近10个百分点。因此结果证明本发明提出的WiAR系统的环境鲁棒性强于CARM。以上所述,仅为本发明的具体实施方式,本说明书中所公开的任一特征,除非特别叙述,均可被其他等效或具有类似目的的替代特征加以替换;所公开的所有特征、或所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以任何方式组合。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1