本发明涉及人工智能,特别涉及一种基于元学习的跨域rfid人体行为识别方法、一种计算机可读存储介质、一种计算机设备以及一种基于元学习的跨域rfid人体行为识别装置。
背景技术:
1、相关技术中,人体行为识别(human activity recognizition,har)作为一种前景广阔的技术,已在诸如智能家居、无接触人车交互、老人跌倒检测等现实世界应用中展现出巨大潜力;现有的人体行为识别方法大致可以分为三类:基于视觉的方法、基于传感器的方法和基于无线传感的方法;其中,基于视觉的方法主要缺点是对光照条件极其敏感且涉及隐私泄露问题;基于传感器的方法则需要用户佩戴一些传感器(如加速度计或陀螺仪),从而影响用户的舒适度;因此,基于无线传感的方法因其对光照条件的鲁棒性和使用的便利性,受到了越来越多的研究关注;与基于wifi的无线传感系统相比,基于射频识别(radiofrequency identification,rfid)系统凭借着识别唯一id的标签支持多人的活动识别的特性以及低成本部署和长距离通信的优势,使其受到越来越多的关注。
2、在rfid系统中,一个具有挑战性的问题是如何解决域转移问题,以在测试数据(目标域)与训练数据(源域)不同的情况下进行可靠的感知。具体而言,域转移问题主要由环境差异和主体多样性引起,包括跨域不平衡的标签分布和异构信号分布。首先,每个用户不一定执行相同的活动集,例如,由于礼仪习惯的差异,一些用户可能只有{鞠躬,站立},而其他用户可能只有{挥手,行走}。因此,标签分布在不同域的数据集中表现出不平衡。其次,rfid信号是不同路径信号的线性叠加,包括直射信号和从静态家具和动态人反射的信号。因此,即使用户在不同环境中执行相同的活动,或不同用户在相同环境中执行相同的活动,收集到的信号分布也是异构的。域转移问题严重影响了基于rfid的识别系统的鲁棒性,当将源域中训练的模型应用于目标域时,性能可能急剧下降。
3、跨域识别的一部分解决方案是通过迁移学习来实现的,方法是使用目标域的标注数据微调预训练模型。这些工作假设在不同域之间存在共享的通用知识。然而,当源域与目标域差异较大时,可能会发生负迁移,导致迁移学习的失败。最近,无监督域对抗学习在跨域识别方面取得了显著进展,可以消除环境影响并传递活动相关特征。然而,在对抗学习可转移特征时,特征可分辨性会出现意外恶化。此外,这两种方法都需要耗时且费力地收集源域和目标域的足够样本,以在准确识别中实现高准确率。
技术实现思路
1、本发明旨在至少在一定程度上解决上述技术中的技术问题之一。为此,本发明的一个目的在于提出一种基于元学习的跨域rfid人体行为识别方法,通过元学习的快速适应新域的能力,将每一个用户的人体活动集的行为识别视为一个任务,使得改进的关系网络只需少量的新数据就能进行快速调整和适应,从而提高识别效果。
2、本发明的第二个目的在于提出一种计算机可读存储介质。
3、本发明的第三个目的在于提出一种计算机设备。
4、本发明的第四个目的在于提出一种基于元学习的跨域rfid人体行为识别装置。
5、为达到上述目的,本发明第一方面实施例提出了一种基于元学习的跨域rfid人体行为识别方法,包括获取射频识别设备采集的每个域对应的人体行为信号,其中,将在同一目标和环境下采集的多个人体行为信号定义为同一个域,且每个人体行为信号包括标签的相位和接收的信号强度指示;对所述人体行为信号进行预处理,以及根据预处理后的每个域对应的数据生成任务样本集,并将所述任务样本集划分为支持集和查询集;构建关系网络,并将所述支持集和所述查询集输入到所述关系网络进行训练,以得到训练好的人体行为识别模型,其中,所述关系网络包括嵌入模块和关系模块,所述嵌入模块用于获取查询样本和支持样本的时频特征,所述关系模块用于识别所述查询样本在所述支持集中对应的匹配类别;获取待识别人体行为信号和支持集,并将所述待识别人体行为信号和支持集输入到所述人体行为识别模型,以得到所述待识别人体行为信号对应的人体行为识别结果。
6、根据本发明实施例的基于元学习的跨域rfid人体行为识别方法,首先,获取射频识别设备采集的每个域对应的人体行为信号,其中,将在同一目标和环境下采集的多个人体行为信号定义为同一个域,且每个人体行为信号包括标签的相位和接收的信号强度指示;然后,对人体行为信号进行预处理,以及根据预处理后的每个域对应的数据生成任务样本集,并将任务样本集划分为支持集和查询集;接着,构建关系网络,并将支持集和查询集输入到关系网络进行训练,以得到训练好的人体行为识别模型,其中,关系网络包括嵌入模块和关系模块,嵌入模块用于获取查询样本和支持样本的时频特征,关系模块用于识别查询样本在支持集中对应的匹配类别;最后,获取待识别人体行为信号和支持集,并将待识别人体行为信号和支持集输入到人体行为识别模型,以得到待识别人体行为信号对应的人体行为识别结果;由此,通过元学习的快速适应新域的能力,将每一个用户的人体活动集的行为识别视为一个任务,使得改进的关系网络只需少量的新数据就能进行快速调整和适应,从而提高识别效果。
7、另外,根据本发明上述实施例提出的基于元学习的跨域rfid人体行为识别方法还可以具有如下附加的技术特征:
8、可选地,对所述人体行为信号进行预处理,包括:对所有标签的原始相位进行一维相位展开;对信号强度指示进行线性插值处理,以得到重新采样的信号流;采用滤波器对重新采样的信号流进行滤波平滑处理;为滤波平滑处理后的每个标签对应的信号流构建ds流,其中,ds流计算了信号流中两个连续数据值之间的差异。
9、可选地,根据预处理后的每个域对应的数据生成任务样本集,包括:构建每个人体行为信号对应的领域列表,其中,所述领域列表包括多个领域,每个领域均包括对应的人体行为信号;在生成每个人体行为信号对应的任务样本时,从对应的领域列表中随机选择一个领域,并从所选领域中随机选择一个人体行为信号,以生成任务样本集。
10、可选地,所述嵌入模块包括自校准模块、主干网络和跨校准模块,其中,所述自校准模块使用非局部注意机制捕捉样本中每个标签对应的信号流之间的依赖关系,以便保留与活动相关的信息并减轻与环境相关的干扰;主干网络从活动相关信息中提取时频特征;跨校准模块使用了成对相似性模块捕捉查询-支持关联掩码,并为每个查询样本生成一组经过校准的支持嵌入集。
11、可选地,所述主干网络包括三个cnn块和最大池化层,其中,每个cnn块包括32个滤波器3×3卷积,后跟批量归一化和relu非线性。
12、可选地,根据以下损失函数对所述嵌入模块进行训练,以通过非线性子空间学习嵌入特征的相似性,对同类别特征进行聚集:
13、
14、其中,ti表示第i个任务,θ表示嵌入模块的网络参数,nb表示成对样本数,表示,ⅱm,n表示样本i和样本j是否属于同一类活动,具体来说,如果样本i和样本j属于同一类活动,则值为1;如果样本i和样本j不属于同一类活动,则值为0,σ(ηi.j)表示样本i和样本j通过嵌入网络得到的特征向量之间的cosine距离。
15、可选地,根据以下损失函数对所述关系网络进行训练:
16、
17、其中,ti表示第i个任务,θ表示嵌入模块的网络参数,表示关系模块的网络参数,ⅱm,n表示支持样本n和查询样本m是否属于同一样本,具体来说,如果两个样本标签相同,则值取1;否则,值取0,表示查询样本m属于支持样本n所属类别的概率。
18、为达到上述目的,本发明第二方面实施例提出了一种计算机可读存储介质,其上存储有基于元学习的跨域rfid人体行为识别程序,该基于元学习的跨域rfid人体行为识别程序被处理器执行时实现如上述的基于元学习的跨域rfid人体行为识别方法。
19、为达到上述目的,本发明第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述的基于元学习的跨域rfid人体行为识别方法。
20、为达到上述目的,本发明第四方面实施例提出了一种基于元学习的跨域rfid人体行为识别装置,包括获取模块,用于获取射频识别设备采集的每个域对应的人体行为信号,其中,将在同一目标和环境下采集的多个人体行为信号定义为同一个域,且每个人体行为信号包括标签的相位和接收的信号强度指示;预处理模块,用于对所述人体行为信号进行预处理,以及根据预处理后的每个域对应的数据生成任务样本集,并将所述任务样本集划分为支持集和查询集;训练模块,用于构建关系网络,并将所述支持集和所述查询集输入到所述关系网络进行训练,以得到训练好的人体行为识别模型,其中,所述关系网络包括嵌入模块和关系模块,所述嵌入模块用于获取查询样本和支持样本的时频特征,所述关系模块用于识别所述查询样本在所述支持集中对应的匹配类别;人体行为识别模块,用于获取待识别人体行为信号和支持集,并将所述待识别人体行为信号和支持集输入到所述人体行为识别模型,以得到所述待识别人体行为信号对应的人体行为识别结果。
21、根据本发明实施例的基于元学习的跨域rfid人体行为识别装置,通过获取模块获取射频识别设备采集的每个域对应的人体行为信号,其中,将在同一目标和环境下采集的多个人体行为信号定义为同一个域,且每个人体行为信号包括标签的相位和接收的信号强度指示;预处理模块对人体行为信号进行预处理,以及根据预处理后的每个域对应的数据生成任务样本集,并将任务样本集划分为支持集和查询集;训练模块构建关系网络,并将支持集和查询集输入到关系网络进行训练,以得到训练好的人体行为识别模型,其中,关系网络包括嵌入模块和关系模块,嵌入模块用于获取查询样本和支持样本的时频特征,关系模块用于识别所述查询样本在支持集中对应的匹配类别;人体行为识别模块获取待识别人体行为信号和支持集,并将待识别人体行为信号和支持集输入到人体行为识别模型,以得到待识别人体行为信号对应的人体行为识别结果;由此,通过元学习的快速适应新域的能力,将每一个用户的人体活动集的行为识别视为一个任务,使得改进的关系网络只需少量的新数据就能进行快速调整和适应,从而提高识别效果。