一种场景识别方法及装置的制造方法_2

文档序号：9911632阅读：来源：国知局

本对应的目标特征以及事件特征串行成一组新的特征组合，并将其输入到预先构建的SVM事件类型分类器中进行训练，以使该SVM事件类型分类器的输出结果满足预设条件，如对事件类型的识别率超过预设阈值。
[0039] 基于上述训练后的SVM事件类型分类器，当服务器需要进行场景识别时，服务器可以将目标监控图像的前景区域图像对应的目标特征以及事件特征输入到训练后的SVM事件类型分类器，以得到目标监控图像对应的事件类型。
[0040] 可见，在图1所示的方法流程中，通过获取目标监控图像的前景区域图像，并分别提取该前景区域图像的目标特征以及事件特征，进而，根据该目标特征以及事件特征对目标监控图像进行场景识别，提高了场景识别的准确率。
[0041] 为了使本领域技术人员更好地理解本发明实施例提供的技术方案，下面对本发明实施例中目标检测网络模型以及第一事件类型检测网络模型的构建以及应用进行描述。其中，以目标检测网络模型以及第一事件类型检测网络模型均为卷积神经网络 (Convolutional Neural Network，简称CNN)为例。
[0042] 在该实施例中，目标检测网络模型以及第一事件类型检测网络模型均主要由输入层、卷积和池化层、全连接层、softmax层等组成。
[0043]具体的，对于目标检测网络模型：
[0044]在该实施方式中，对于事先采集的各训练样本，服务器在获取到各训练样本的前景区域图像之后，可以根据前景区域图像中包括的目标(如人、机动车、非机动车或其它目标等)对前景区域图像进行分割，以得到多个目标候选区域，并判断各目标候选区域中包括的目标是否为有效目标（即预设目标)并确定具体的目标类型，通过遍历所有的目标候选区域，得到所有有效目标在前景区域图像中的位置信息。
[0045] 服务器识别出前景区域图像中各有效目标的位置信息之后，可以将该前景区域图像划分为若干个独立的子图像区域Area{}。例如，假设前景区域图像中包括η个有效目标，则可以得到η个独立的子图像区域 :4代31、4代32'4^311，每个子图像区域中包括一个独立的有效目标，进而服务器可以将该η个独立的子图像区域输入到预设的目标检测网络模型中进行训练。
[0046] 其中，对于第i个图像子区域Areai，该目标检测网络模型的第一层卷积函数输出
)为：
[00471
[0048]其中，tanh为双曲函数，输入层为1-1，输出层为1，k为预设的常量参数，W是一个 kw*kh大小的卷积核，f是卷积核的个数，Bias是输出偏置量，kh，kw是卷积核的高和宽，Ni为第 i个图像子区域内各像素点在二维图像平面的坐标值集合，（x，y)为第i个图像子区域内像素点在二维图像平面的坐标值。
[0049] 对于第一事件类型检测网络模型：
[0050] 输入层:服务器可以将获取到的训练样本的前景区域图像作为第一事件类型检测网络模型的输入，接入到输入层；
[0051] 卷积层:卷积层中每一个卷积层通过上一层的卷积结果与卷积核行二维卷积，激励结果输出经过非线性激励函数和偏置值相加得到；
[0052] 分类层（softmax):选取合适的卷积核和max-poo ling矩形的大小，将最后一个卷积层的输出降采样到一个像素，最后一个卷积层的输出和全连接层的连接为一维矩阵。最后一层通常为一个全连接层，每一个输出对应一种事件类型。在该实施方式中，采用 softmax回归作为最后一层的激励函数将每一个神经元的输出理解为每个输入图像所对应事件类型的可能性。
[0053] 可选地，第一事件类型检测网络的训练参数调整公式如下：
[0054]
[0055] 其中，N为整个前景区域图像内各像素点在二维图像平面的坐标值集合，（x，y)为整个前景区域图像内像素点在二维图像平面的坐标值。
[0056] 可见，在目标检测网络模型中，同一子图像区域内的参数训练模式为权重共享训练模式，但不同子图像空间之间的参数训练并不遵循权重共享原则，即目标检测网络模型的参数训练模式为局部权重共享训练模式（即同一子图像区域内共享，子图像区域之间不共享）；第一事件类型检测网络模型则直接使用权重共享训练模式进行参数训练。
[0057] 在该实施方式中，服务器构建并训练好上述目标检测网络模型以及第一事件类型检测网络模型后，可以通过该目标检测网络模型以及第一事件类型检测网络模型获取目标监控图像的前景区域图像对应的目标特征以及事件特征，并将该目标特征以及事件特征进行串联，得到一个高维组合特征，并将该高维组合特征输入到训练好的第二事件类型检测网络模型，如SVM事件类型分类器，并根据输出结果确定目标监控图像对应的事件类型。
[0058] 通过以上描述可以看出，在本发明实施例提供的技术方案中，通过获取目标监控图像的前景区域图像，并分别将该前景区域图像输入预设的目标检测网络模型以及第一事件类型检测网络模型，以得到该前景区域图像对应的目标特征以及事件特征，进而，将目标特征以及事件特征输入到预设的第二事件类型检测网络模型，以得到目标监控图像对应的事件类型，提高了场景识别的准确率。
[0059]请参见图2,为本发明实施例提供的一种场景识别装置的结构示意图，其中，该场景识别装置可以应用于上述方法实施例中的视频监控系统，例如，应用于视频监控系统的后台服务器中，如图2所示，该场景识别装置可以包括：
[0060] 获取单元210,用于获取目标监控图像的前景区域图像；
[0061] 特征提取单元220,分别将所述前景区域图像输入预设的目标检测网络模型以及第一事件类型检测网络模型，以得到所述前景区域图像对应的目标特征以及事件特征；
[0062] 场景识别单元230，用于将所述目标特征以及事件特征输入到预设的第二事件类型检测网络模型，以得到所述目标监控图像对应的事件类型。
[0063] 请一并参阅图3,图3为本发明实施例提供的另一种场景识别装置的结构示意图，在图2所示实施例的基础上，图3所示场景识别装置还可以包括：
[0064]判断单元240,用于判断所述前景区域图像中是否存在预设目标；
[0065] 相应地，所述特征提取单元220,可以具体用于当所述判断单元判断结果为存在时，分别将所述前景区域图像输入预设的目标检测网络模型以及第一事件类型检测网络模型。
[0066] 请一并参阅图4,图4为本发明实施例提供的另一种场景识别装置的结构示意图，在图2所示实施例的基础上，图4所示场景识别装置中，特征提取单元220可以包括：
[0067] 划分子单元221，用于根据所述前景区域中存在的有效目标将所述前景区域划分为多个独立子图像区域，其中，每个子图像区域中包括一个独立的有效目标；
[0068] 提取子单元222,用于将所述多个独立子图像区域输入到预设的目标检测网络模型中，以得到所述前景区域图像对应的目标特征。
[0069] 在可选实施例中，所述目标检测网络模型为卷积神经网络模型，对于第i个图像子区域，所述目标检测网络模型的第一层卷积函数输出公式为：
[0070]
[0071]其中，tanh为双曲函数，输入层为1-1，输出层为1，k为预设的常量参数，w是一个 kw*kh大小的卷积核，f是卷积核的个数，Bias是输出偏置量，kh，kw是卷积核的高和宽，Ni为第 i个图像子区域内各像素点在二维图像平面的坐标值集合，（x，y)为第i个图像子区域内像素点在二维图像平面的坐标值。
[0072]在可选实施例中，所述第二事件类型检测网络模型为支持向量机SVM事件类型分类器；
[0073] 相应地，请一并参阅5,图5为本发明实施例提供的另一种场景识别装置的结构示意图，在图2所示实施例的基础上，图5所示场景识别装置中，场景识别单元230可以包括：
[0074]

完整全部详细技术资料下载

当前第2页1 2 3