一种基于深度学习的老人跌倒行为的识别方法与流程

文档序号:15462833发布日期:2018-09-18 18:35阅读:来源:国知局

技术特征:

1.一种基于深度学习的老人跌倒行为的识别方法,其特征在于:包括如下步骤,

步骤1、对视频图像进行预处理,例如去噪、灰度变换等,剔除无关的干扰信息,便于选取人体特征明显的图像视频样本,即能清晰识别人体动作的视频样本;

步骤2、将步骤1中的视频样本进行采样,并将得到的采样序列输入卷积神经网络,通过Softmax分类器完成动作的分类;

步骤3、如果不是跌倒行为,则以原采样率继续进行检测,反之,则逐帧采样,获取帧序列,将经过特征提取之后的帧序列输入循环神经网络;

步骤4、将步骤3中的输出信息输入Softmax分类器,通过Softmax分类器识别判断出视频窗口的老人行为是否出现跌倒行为。如果不是,则重复步骤1、2、3和4,反之,检测到跌倒行为,发出预警信息。

2.根据权利要求1所述的基于深度学习的老人跌倒行为的识别方法,其特征在于:所述深度神经网络依次包括输入层、卷积层、长短时记忆网络层及Softmax分类层;

信号传输过程为:将提取出的图像特征作为训练样本输入卷积层,由卷积层将训练样本转化成对应的激活序列,将各激活序列依时序输入长短时记忆网络层,由长短时记忆网络层输出子序列,并通过Softmax分类层识别行为动作。

3.根据权利要求1所述的基于深度学习的老人跌倒行为的识别方法,其特征在于:所述步骤2中的3D卷积神经网络采用的是经典模型AlexNet,并将其扩展到3D-CNN;通过利用一个3D卷积核对一个堆叠的连续帧形成的视频小片段进行卷积,各个卷积层的特征图与上一层中的多个连续帧相连接,并捕获时域信息;

第i层的第j个特征图中位置(x,y,z)的值可以表示为:

其中,p,q和r分别是3D卷积核的高、宽以及时间域上的长度,是3D卷积核与上一层第m个特征图相连的权值。

4.根据权利要求3所述的基于深度学习的老人跌倒行为的识别方法,其特征在于:所述3D卷积神经网络采用最大值池化法,在每一个卷积层之后仅包含一个单独的最大值池化层,由卷积层输出的特征图作为输入特征图被传送至池化层,由池化层对输入特征图进行压缩,提取主要特征。

5.根据权利要求3所述的基于深度学习的老人跌倒行为的识别方法,其特征在于:在AlexNet输出结果后需要对结果进行平滑处理,计算公式如下:

其中代表在feature map中第i个卷积核(x,y)坐标处经过了ReLU激活函数的输出,本式的含义为一个值和它前后的n个值做标准化;k,n,α和β均为超参数;求和发生在feature map中,相同位置(x,y)的n个相邻kernel map上,其中N是卷积核的总数,符号max和min是为了表示边缘几层的标准化方式。

6.根据权利要求1所述的基于深度学习的老人跌倒行为的识别方法,其特征在于:所述长短时记忆网络包括5个LSTM层,每层由512个记忆单元组成,各个记忆单元分别包括依次相连的输入门、遗忘门、cell及输出门;每帧依次经过长短时记忆网络层处理后所得图像特征由Softmax分类器进行分类,对行为作出识别并预测。

7.根据权利要求6所述的基于深度学习的老人跌倒行为的识别方法,其特征在于:所述长短时记忆网络使用记忆单元来存储和输出信息,其H函数可以如下表示:

it=σ(Wxixt+Whiht-1+Wcict-1+bi) (4)

ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf) (5)

ct=ftct-1+ittanh(Wxcxt+Whcht-1+bc) (6)

ot=σ(Wxoxt+Whoht-1+Wcoct+bo) (7)

ht=ottanh(ct) (8)

其中,σ是回归sigmoid函数,i,f,o和c分别代表输入门,遗忘门,输出门和记忆单元激活向量。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1