基于图像中的显著物体的物体识别方法与流程

文档序号：12721249阅读：来源：国知局

技术特征：

1.一种基于图像中的显著物体的物体识别方法，所述方法包括：

训练过程，所述训练过程用于建立分类数据库，在所述分类数据库中包括用于描述多个物体的第一特征向量，每个物体由至少一个第一特征向量表示；以及

识别过程，所述识别过程包括如下的步骤：

S21：将包含物体的图片输入到深度卷积神经网络中，将图片划分成M*M个网格，每个网格预测N个候选框，并针对整个图片的M*M*N个候选框中的每个候选框，得出每个候选框内存在物体的概率，其中M和N为大于等于1的整数；

S22：当存在物体的概率大于或等于预定阈值时，选取该概率所对应的候选框作为第一有效候选框；

S23：将第一有效候选框的图像输入到分类神经网络中以获取第二特征向量；以及

S24：基于所述第二特征向量、第一特征向量以及分类数据库，执行k最近邻分类算法(KNN)以识别出物体的类别。

2.根据权利要求1所述的方法，还包括如下的步骤：

S20：在将包含物体的图片输入到深度卷积神经网络的之前，将图片分割成彼此之间存在重叠区域的S个面积相同的区域，S为大于等于1的整数。

3.根据权利要求2所述的方法，其中，还包括如下的步骤：

S21’：将包含S个区域的图片输入到深度卷积神经网络中，将S个区域中的每个区域划分成M*M个网格，每个网格预测N个候选框，在每个网格中标记N个候选框针对于相应网格的归一化坐标，并针对于整个图片的M*M*N*S个候选框中的每个候选框，得出每个候选框内存在物体的概率；

S22’：当存在物体的概率大于或等于预定阈值时，选取该概率所对应的候选框作为第二有效候选框，将所有区域中的第二有效候选框的归一化坐标转换为针对于包含物体的图片的图片坐标，并得到针对于图片坐标的第三有效候选框，

S23’：将第三有效候选框的图像输入到分类神经网络中以获取第二特征向量；以及

S24’：基于所述第二特征向量、第一特征向量以及分类数据库，执行k最近邻分类算法(KNN)以识别出物体的类别。

4.根据权利要求1所述的方法，其中，所述训练过程包括如下的步骤：

S11：以第一角度、第一距离和第一光照对至少一个物体进行拍摄以获取图片；

S12：将图片输入到深度卷积神经网络中以生成至少一个候选框；

S13:手动地确定该目标候选框在图片中的坐标并选取每个物体的目标候选框，并且存储该目标候选框中的图像；

S14：以不同于第一角度、第一距离和第一光照的多个角度、多个距离和多个光照对至少一个物体进行拍摄以获取多个不同的图片；

S15：对获取的多个不同的图片执行上述的步骤S12和S13；

S16：将存储的所有图像使用分类神经网络进行特征提取以得到第一特征向量；

S17：将提取出的所有第一特征向量存储到分类数据库中，其中在该分类数据库中存储用于描述多个物体的第一特征向量。

5.根据权利要求1、3、4中的任一项所述的方法，其中，所述深度卷积神经网络是基于显著物体的YOLO神经网络，以及所述分类神经网络是卷积神经网络(CNN)。

6.根据权利要求1或3所述的方法，其中，所述特定阈值位于0.1至1的范围内。

7.根据权利要求1所述的方法，其中，还包括如下的步骤：在步骤S22之后和步骤S23之前，对第一有效候选框执行非极大值抑制算法以进一步筛选第一有效候选框，以将筛选出的有效候选框用在步骤S23中；

其中，非极大值抑制所用的阈值位于0至0.6的范围内。

8.根据权利要求3所述的方法，其中，还包括如下的步骤：在步骤S22’中，对第二有效候选框执行非极大值抑制算法以进一步筛选第二有效候选框，以将筛选出的有效候选框进行坐标转换；

对坐标转换之后的得到第三有效候选框执行非极大值抑制算法以将筛选出的有效候选框用在步骤S23’中；以及

其中，非极大值抑制所用的阈值位于0至0.6的范围内。

9.根据权利要求5所述的方法，其中，CNN网络基于SqueezeNet模型、VGG模型和ResNet模型中的任一种。

10.根据权利要求1所述的方法，其中，k最近邻分类算法是基于投票委员会机制的k最近邻分类算法。

完整全部详细技术资料下载

当前第2页1 2 3