基于频繁传感器事件序列的日常行为特征挖掘及计算方法与流程

文档序号:17540537发布日期:2019-04-29 14:32阅读:406来源:国知局
基于频繁传感器事件序列的日常行为特征挖掘及计算方法与流程

本发明涉及行为挖掘计算技术领域,具体而言,尤其涉及一种基于频繁传感器事件序列的日常行为特征挖掘及计算方法。



背景技术:

目前居民日常行为识别所使用的特征或者是预定义特征或者是离散特征。预定义特征一般包括行为开始的时刻、行为持续的时间,行为的密度、触发的传感器等等,预定义特征的获取相对容易,但是完全割裂了传感器事件之间的联系。由于表征居民日常行为的传感器事件是时间序列,而预定义特征和离散特征丢失了传感器事件的时间序列属性,导致预定义特征和离散特征的取值是行为、传感器触发的时刻或者特征出现频率统计的结果,这种离散的特征值最终阻碍了居民日常行为识别的质量。



技术实现要素:

根据上述提出的技术问题,而提供一种基于频繁传感器事件序列的日常行为特征挖掘及计算方法。本发明基于频繁传感器事件序列的日常行为特征挖掘及计算方法,包括:识别模型训练和行为识别测试两阶段;

所述识别模型训练至少包括以下步骤:

s1:通过设置的多个非入侵式传感器采集居民日常行为按照时间顺序连续地触发的传感器事件序列;

s2:对所述采集到的传感器事件序列进行预处理,所述预处理将所述传感器事件序列分割为多个以日常行为为单位的子序列;

s3:挖掘频繁出现的传感器事件序列,作为居民日常行为的特征;

s4:计算所述居民日常行为在特征上的取值;

每一个传感器事件满足模式:<触发传感器,触发的日期,触发的时间,触发值>;所述居民日常行为触发的所述传感器事件通过文本流的形式记录;

所述行为识别测试:采用有监督的机器学习方式训练分类器,使用训练后的分类器对待测试的行为进行识别。

进一步的,标注日常行为所触发的传感器事件序列的开始点和结束点为所述居民日常行为。

更进一步的,所述挖掘频繁出现的传感器事件序列通过使用频繁序列模式挖掘算法prefixspan挖掘隐藏在日常行为中的频繁传感器序列模式。

更进一步的,对于一个日常行为和一个特征,该日常行为触发的传感器事件序列在该特征下的取值形式定义为一个矩阵,根据矩阵的值计算该日常行为在该特征下的取值;

所述取值矩阵的每一行对应一个满足特征的传感器事件子序列,每一行的取值为<子序列中第一个传感器事件时刻,子序列中第二个传感器事件时刻,…,子序列中最后一个传感器事件时刻>。

进一步的,对于所述居民日常行为特征,所述取值矩阵中找出具有最大秩的取值矩阵,进而扩展除所述具有最大秩的取值矩阵的矩阵,使得所述矩阵的秩等于所述取值矩阵中的最大秩;

逐一比对搜索所有取值矩阵同最大秩矩阵的最佳匹配,通过皮尔逊相关系数计算每一个所述取值矩阵与最大秩矩阵的相似性,得到两个由行相似性构成的向量,再通过皮尔逊相关系数计算所述向量的相似性,所述向量的相似性为当前矩阵在当前特征的取值;

设最大秩矩阵和最大值矩阵模式是n*m的矩阵,取值矩阵是k*m的矩阵,且k≤m;在最大矩阵模式的n行中选择k行,这k行用于存储取值矩阵中k行的值,选择k行为匹配;所述最佳匹配所有的所述匹配中使公式(1)的值最小:

其中ai1表示最大值矩阵的第i行的第一个元素,bi1表示取值矩阵的第i行的第一个元素。

较现有技术相比,本发明具有以下优点:本发明克服了预定义特征和离散特征的缺点,使用频繁序列模式挖掘方法全面有效地挖掘到居民日常行为的连续特征,并且提出了特征值的计算算法,因此从理论上讲,使用本发明挖掘出的特征将显著地提升居民日常行为的精确率和召回率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明整体流程示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

如图1所示,基于频繁传感器事件序列的日常行为特征挖掘及计算方法,其特征在于,包括:识别模型训练和行为识别测试两阶段。

作为优选的实施方式,识别模型训练至少包括以下步骤:

s1:通过设置的多个非入侵式传感器采集居民日常行为按照时间顺序连续地触发的传感器事件序列。作为本申请的优选的实施方式,所述居民日常行为包括睡觉、做饭、吃饭、打扫卫生、洗浴、吃药、看电视、招待客人等等。可以理解为在其它实施方式中还包含其它的行为方式,只要能够包含居民的日常行为即可。

s2:对所述采集到的传感器事件序列进行预处理,所述预处理将所述传感器事件序列分割为多个以日常行为为单位的子序列。作为本申请优选的方式所述直接从传感器采集到的数据是传感器事件序列,预处理的工作是把传感器事件序列分割为若干以日常行为为单位的子序列。预处理的目的是为了统计各个日常行为的特征。

s3:挖掘频繁出现的传感器事件序列,作为居民日常行为的特征;

s4:计算所述居民日常行为在特征上的取值;

每一个传感器事件满足模式:<触发传感器,触发的日期,触发的时间,触发值>;所述居民日常行为触发的所述传感器事件通过文本流的形式记录;

所述行为识别测试:采用有监督的机器学习方式训练分类器,使用训练后的分类器对待测试的行为进行识别。

在本实施方式中,标注日常行为所触发的传感器事件序列的开始点和结束点为所述居民日常行为。以完整的居民日常行为为单位,标注日常行为所触发的传感器事件序列的开始点和结束点。

作为优选的实施方式,所述挖掘频繁出现的传感器事件序列通过使用频繁序列模式挖掘算法prefixspan挖掘隐藏在日常行为中的频繁传感器序列模式。挖掘频繁出现的传感器事件序列通过使用频繁序列模式挖掘算法prefixspan挖掘隐藏在日常行为中的频繁传感器序列模式。

在本实施方式中,对于一个日常行为和一个特征,该日常行为触发的传感器事件序列在该特征下的取值形式定义为一个矩阵,根据矩阵的值计算该日常行为在该特征下的取值。取值矩阵的每一行对应一个满足特征的传感器事件子序列,每一行的取值为<子序列中第一个传感器事件时刻,子序列中第二个传感器事件时刻,…,子序列中最后一个传感器事件时刻>。

作为优选的实施方式中,对于一个日常行为和一个特征,该日常行为触发的传感器事件序列在该特征下的取值形式定义为一个矩阵,根据矩阵的值计算该日常行为在该特征下的取值;

所述取值矩阵的每一行对应一个满足特征的传感器事件子序列,每一行的取值为<子序列中第一个传感器事件时刻,子序列中第二个传感器事件时刻,…,子序列中最后一个传感器事件时刻>。

作为优选的实施方式,对于所述居民日常行为特征,所述取值矩阵中找出具有最大秩的取值矩阵,进而扩展除所述具有最大秩的取值矩阵的矩阵,使得所述矩阵的秩等于所述取值矩阵中的最大秩;

逐一比对搜索所有取值矩阵同最大秩矩阵的最佳匹配,通过皮尔逊相关系数计算每一个所述取值矩阵与最大秩矩阵的相似性,得到两个由行相似性构成的向量,再通过皮尔逊相关系数计算所述向量的相似性,所述向量的相似性为当前矩阵在当前特征的取值;

如下矩阵所示,设最大秩矩阵和最大值矩阵模式是n*m的矩阵,取值矩阵是k*m的矩阵,且k≤m;在最大矩阵模式的n行中选择k行,这k行用于存储取值矩阵中k行的值,选择k行为匹配;所述最佳匹配所有的所述匹配中使公式(1)的值最小:

其中ai1表示最大值矩阵的第i行的第一个元素,bi1表示取值矩阵的第i行的第一个元素。

上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。

在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1