一种基于深度学习的老人跌倒行为的识别方法与流程

文档序号：15462833发布日期：2018-09-18 18:35阅读：来源：国知局

技术特征：

1.一种基于深度学习的老人跌倒行为的识别方法，其特征在于：包括如下步骤，

步骤1、对视频图像进行预处理，例如去噪、灰度变换等，剔除无关的干扰信息，便于选取人体特征明显的图像视频样本，即能清晰识别人体动作的视频样本；

步骤2、将步骤1中的视频样本进行采样，并将得到的采样序列输入卷积神经网络，通过Softmax分类器完成动作的分类；

步骤3、如果不是跌倒行为，则以原采样率继续进行检测，反之，则逐帧采样，获取帧序列，将经过特征提取之后的帧序列输入循环神经网络；

步骤4、将步骤3中的输出信息输入Softmax分类器，通过Softmax分类器识别判断出视频窗口的老人行为是否出现跌倒行为。如果不是，则重复步骤1、2、3和4，反之，检测到跌倒行为，发出预警信息。

2.根据权利要求1所述的基于深度学习的老人跌倒行为的识别方法，其特征在于：所述深度神经网络依次包括输入层、卷积层、长短时记忆网络层及Softmax分类层；

信号传输过程为：将提取出的图像特征作为训练样本输入卷积层，由卷积层将训练样本转化成对应的激活序列，将各激活序列依时序输入长短时记忆网络层，由长短时记忆网络层输出子序列，并通过Softmax分类层识别行为动作。

3.根据权利要求1所述的基于深度学习的老人跌倒行为的识别方法，其特征在于：所述步骤2中的3D卷积神经网络采用的是经典模型AlexNet，并将其扩展到3D-CNN；通过利用一个3D卷积核对一个堆叠的连续帧形成的视频小片段进行卷积，各个卷积层的特征图与上一层中的多个连续帧相连接，并捕获时域信息；

第i层的第j个特征图中位置(x,y,z)的值可以表示为：

其中，p，q和r分别是3D卷积核的高、宽以及时间域上的长度，是3D卷积核与上一层第m个特征图相连的权值。

4.根据权利要求3所述的基于深度学习的老人跌倒行为的识别方法，其特征在于：所述3D卷积神经网络采用最大值池化法，在每一个卷积层之后仅包含一个单独的最大值池化层，由卷积层输出的特征图作为输入特征图被传送至池化层，由池化层对输入特征图进行压缩，提取主要特征。

5.根据权利要求3所述的基于深度学习的老人跌倒行为的识别方法，其特征在于：在AlexNet输出结果后需要对结果进行平滑处理，计算公式如下：

其中代表在feature map中第i个卷积核(x,y)坐标处经过了ReLU激活函数的输出，本式的含义为一个值和它前后的n个值做标准化；k，n，α和β均为超参数；求和发生在feature map中，相同位置(x,y)的n个相邻kernel map上，其中N是卷积核的总数，符号max和min是为了表示边缘几层的标准化方式。

6.根据权利要求1所述的基于深度学习的老人跌倒行为的识别方法，其特征在于：所述长短时记忆网络包括5个LSTM层，每层由512个记忆单元组成，各个记忆单元分别包括依次相连的输入门、遗忘门、cell及输出门；每帧依次经过长短时记忆网络层处理后所得图像特征由Softmax分类器进行分类，对行为作出识别并预测。

7.根据权利要求6所述的基于深度学习的老人跌倒行为的识别方法，其特征在于：所述长短时记忆网络使用记忆单元来存储和输出信息，其H函数可以如下表示：

it＝σ(Wxixt+Whiht-1+Wcict-1+bi) (4)

ft＝σ(Wxfxt+Whfht-1+Wcfct-1+bf) (5)

ct＝ftct-1+ittanh(Wxcxt+Whcht-1+bc) (6)

ot＝σ(Wxoxt+Whoht-1+Wcoct+bo) (7)

ht＝ottanh(ct) (8)

其中，σ是回归sigmoid函数，i，f，o和c分别代表输入门，遗忘门，输出门和记忆单元激活向量。

完整全部详细技术资料下载

当前第2页1 2 3