一种动作识别的方法及其识别系统与流程

文档序号：18107969发布日期：2019-07-06 11:48阅读：250来源：国知局

本申请涉及动作识别领域，具体地，涉及一种动作识别的方法及其识别系统。

背景技术：

在自然世界里，人通过触摸来操控物体、通过手势来表达意愿。我们希望人可以通过同样的方式同计算机交互。因此，对“多维机器视觉动作感知”的研究，首先必须研究如何对人体的三维动作进行采集，然后需要对采集到的复杂信息进行处理，识别出有效动作，最后对有效动作进行判断，分析人的意图。传统的有效分析过程中虽然能够解决动作的识别问题，但是在识别过程中，因为掺加了许多无用信息而增加了识别的时间，虽然现有技术中对于去除无用信息已经有了很多解决的手段，但是如何快速有效的甄选无用信息并去除依然是一个难题。

技术实现要素：

本申请的目的在于在进行动作识别前对元动作信息进行处理，去除无用的元动作而只对有效的元动作进行识别，提升了动作识别的严谨性，同时也提高了识别的准确率和效率。

为达到上述目的，本申请提供了一种动作识别的方法，包括以下步骤：采集动作数据，根据动作数据确定元动作；计算元动作的信息根据元动作的信息量判断是否去除该元动作。

如上的，其中，其中对元动作的确定包括如下子步骤：读取时间窗内的动作数据；将动作数据映射到多个象限，形成新动作的运动轨迹数据；在运动轨迹数据中存在大于阈值的第一点时，获取第一点之后的时间窗内的数据作为元动作。

如上的，其中，在确定元动作之前，将动作数据按照时间窗划分为多段数据，使用至少一个处理器分别处理多段数据。

如上的，其中，在所有的动作数据处理完成之后，将处理完成的动作数据合并。

如上的，其中，利用动作预处理层，采用基于熵的信息提取方法对元动作进行预处理，去除元动作中的无用元动作。

如上的，其中，计算元动作的信息量包括如下子步骤：对元动作进行分解，获得多个子动作；根据多个子动作计算元动作的信息量；其中，使用如下公式计算元动作的信息量：

其中：x＝{x1,x2,x3,...,xi}，，x为元动作，xi为元动作的子动作，p(xi)为子动作xi的发生概率，w＝{w1,w2,w3,...,wi}为动作的状态集合，wi代表动作的状态，p(xi|wi)为在某种状态下发生某种动作的后验概率。

如上的，其中，对信息量进行判断，公式为：

其中h(x|w＝wi)为元动作在wi状态下的信息熵；若result的结果为1，则说明元动作有意义，若result的结果为0，则说明元动作无意义。

一种动作识别系统，具体包括采集确定单元、去除单元以及识别单元；采集确定单元，采集动作数据，根据动作数据确定元动作；去除单元，对元动作进行预处理，去除无用的元动作；识别单元，识别有意义的元动作。

如上的，其中，采集确定单元包括以下子模块，采集模块、读取模块、预设模块以及比较模块、一个或多个处理器；采集模块，采集动作数据，采集的动作数据按照时间顺序放入时间窗口；读取映射模块，读取时间窗内的动作数据，将读取的动作数据映射到多个象限，形成新动作的运动轨迹数据；预设模块，在时间窗内预设第一阈值、第二阈值和第三阈值；比较模块，将运动轨迹数据分别与第一、第二和第三阈值进行比较；一个或多个处理器，根据比较的结果形成多段数据，并将多段数据进行整合形成元动作。

如上的，其中，去除单元包括以下子模块，动作分解模块、信息量计算模块、判断模块；动作分解模块，对元动作进行分解，获得多个子动作；信息量计算模块，根据分解后的子动作计算元动作的信息量；判断模块，根据计算后的结果判断是否去除无用的元动作。

本申请具有以下有益效果：

本申请提供的动作的识别的方法及其识别系统在进行动作识别前对元动作信息进行处理，能够去除无用的元动作而只对有效的元动作进行识别，增加了动作识别的严谨性，同时也提高了识别的准确率和效率。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请中记载的一些实施例，对于本领域普通技术人员来讲，还可以根据这些附图获得其他的附图。

图1是根据本申请实施例提供的动作识别的方法流程图；

图2是根据本申请实施例提供的动作识别方法的子流程图；

图3是根据本申请实施例提供的动作示意图；

图4是根据本申请实施例提供的识别系统内部结构示意图；

图5是根据本申请实施例提供的识别系统的子模块示意图。

具体实施方式

下面结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请是一种动作的识别的方法及其识别系统，根据本申请，在进行动作识别前对元动作信息进行处理，去除无用的元动作而只对有效的元动作进行识别，增加了动作识别的严谨性，同时也提高了识别的准确率和效率。

如图1所示为本申请提供的动作识别的方法流程图。

步骤s110：采集动作数据，根据动作数据确定元动作。

具体地，由于人的动作十分协调且具有随意性，所以人在完成一个动作时往往会运用身体的很多部位去协同完成该动作并且即使是同一个人在多次完成同一个动作时其完成的方式也尽不相同。

首先采集动作数据；

读取时间窗内的动作数据，将读取的动作数据映射到多个象限，例如常用的四个或三个象限，形成新动作的运动轨迹数据；

在时间窗内预设第一阈值、第二阈值和第三阈值，具体地，第一阈值代表动作静止点，第二阈值代表动作的开始点，第三阈值代表动作的结束点，将运动轨迹数据与第一阈值进行比较，若运动轨迹数据中存在大于第一阈值的第一点，则说明运动轨迹数据发生了动作的变化，然后将第一点中的运动轨迹数据分别与预设的第二阈值和第三阈值进行比较，若运动轨迹数据中存在数据大于第二阈值小于第三阈值的多个点，则将每个点按照开始和结束的顺序连成线段从而形成多段数据。其中在运动轨迹数据中存在大于阈值的第一点时，所述第一点之后的时间窗内的数据作为元动作。优选地，在确定元动作之前，将动作数据按照时间窗划分为多段数据。

优选地，使用一个或多个处理器分别处理多段数据，在所有的动作数据处理完成之后，将处理完成的动作数据合并。。

示例性地，若人想要拿起一个水杯，可能做得动作有很多种情况，元动作也就有多个，例如拿起身体左前方的水杯，完成该动作的主要动作是伸出左手并拿起水杯(情况a)，根据伸出左手、拿起水杯这一过程为新发生动作a的元动作。但人通常的动作是身体微微向左转向水杯，再伸出左手拿起水杯(情况b)，根据身体左转、伸出右手、拿起水杯这一过程为新发生动作b的元动作；当然也可能有人会在微微向右转去和同事打个招呼的同时，伸左手拿起水杯(情况c)，设置第一阈值为身体静止不动，第二阈值为身体转身，则此时身体右转、伸出左手、伸出右手、拿起水杯这一过程的集合为元动作。

虽然三种情况虽然做得动作不同，但目标都是为了拿起水杯，但是在数据的角度来看，新发生元动作a、b、c中的数据的差异是非常大的，这样并不能够准确快速的识别出目标动作，因此需要对元动作进行处理，执行步骤s120。

步骤s120：计算元动作中的信息量，根据元动作中的信息量判断是否去除该元动作。

具体地，利用动作预处理层，采用基于熵的信息提取方法对元动作进行预处理，去除元动作中的无用元动作，以步骤s120中的情况a、b、c举例，情况b、c中的身体微微向左转和身体微微向右转就是为动作识别增加难度或使识别无意义的无用元动作，因此需要去除，其中计算元动作的信息量具体包括以下步骤：

步骤s210：对元动作进行分解，获得多个子动作。

具体地，元动作中包括姿势信息和动作信息，根据元动作中的姿势信息和动作信息将元动作分解为多个子动作，将与姿势信息相同和/或动作信息相同的划分为同一子动作信息。

优选地，在步骤s110采集动作的同时，采集人体的动作影像，通过动作影像得到姿势信息和动作信息，若姿势信息间的姿势相似度高于预定阈值，则认为二者为同一姿势，将与姿势信息相对应的动作划分为同一子动作。同理，若动作信息间的相似度高于预定阈值，则认为二者为同一动作，将与动作信息相对应的动作划分为同一子动作。

步骤s220：根据子动作计算元动作的信息量。

信息量i(xi；wi)公式如下，其中：x为元动作，x＝{x1,x2,x3,...,xi}，xi为元动作的子动作，p(xi)为子动作xi的发生概率，w＝{w1,w2,w3,...,wi}为动作的状态集合(工作，生活等)，wi代表动作的状态，p(xi|wi)为在某种状态下发生某种动作的后验概率。

优选地，因为有些状态下有些动作不会发生，因此p(xi)≤p(xi|wi)恒成立。i(xi；wi)即为此动作的信息量。

步骤s230：对计算后的信息量进行判断。

具体地，利用公式

其中h(x|w＝wi)为元动作在wi状态下的信息熵，即在wi可能做的所有动作的平均信息量，n为常数。

若result的结果为1，则说明元动作有意义，则执行步骤s130：对该元动作进行识别。

若result结果为0，则说明该元动作无意义，执行步骤s140：去除该无用的元动作。对于去除的元动作我们不用做任何处理，因为其在该状态下的信息量极小即发生的概率极高，对其进行处理只能增加其发生概率即使其信息量更小，对系统来说没有太大的意义。

如图4所示为本申请实施例提供的动作识别系统内部结构示意图，具体地，识别系统内部包括采集确定单元401、去除单元402以及识别单元403。

采集确定单元401用于采集动作数据，根据动作数据确定元动作。

去除单元402与采集分析单元401连接，用于对元动作进行预处理，去除无用的元动作。

识别单元403与去除单元402连接，用于识别有意义的元动作。

采集确定单元401中包括以下子模块，具体包括采集模块、读取模块、预设模块以及比较模块、一个或多个处理器。

采集模块用于采集动作数据，采集的动作数据按照时间顺序放入时间窗口；

读取映射模块与采集模块连接，用于读取时间窗内的动作数据，将读取的动作数据映射到多个象限，形成新动作的运动轨迹数据。

预设模块用于在时间窗内预设第一阈值、第二阈值和第三阈值。

比较模块与预设模块连接，用于将运动轨迹数据分别与第一、第二和第三阈值进行比较。

一个或多个处理器与比较模连接，用于根据比较的结果形成多段数据，并将多段数据进行整合形成元动作。

其中去除单元402中包括以下子模块，如图5所示，具体包括动作分解模块501、信息量计算模块502、判断模块503。

动作分解模块501用于对元动作进行分解，获得多个子动作。

信息量计算模块502与动作分解模块501连接，用于根据分解后的子动作计算元动作的信息量。

判断模块503与信息量计算模块502连接，用于根据计算后的结果判断是否去除无用的元动作。

本申请具有以下有益效果：

虽然当前申请参考的示例被描述，其只是为了解释的目的而不是对本申请的限制，对实施方式的改变，增加和/或删除可以被做出而不脱离本申请的范围。

以上所述，仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以所述权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：骞一凡
技术所有人：骞一凡
我是此专利的发明人

上一篇：一种用于肝胆外科的引流袋的制作方法
上一篇：一种用于复合绝缘材料多波段紫外线老化试验的装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。