一种菜品检测方法与流程

文档序号：12721329阅读：来源：国知局

技术特征：

1. 一种菜品检测方法，其特征在于，所述方法包括以下步骤：1）输入待检测的图像；2）使用预先训练的卷积神经网络提取图像特征；3）以特征图中每个元素在原图中对应位置为中心，给出提议区域；4）根据每个提议区域中心对应的特征向量判断该区域是否为物体；5）如果提议区域是物体，则使用SPPNET提取该区域的特征；6）根据区域特征做回归，计算更准确的bounding box，同时判断该区域是否为菜品。

2.如权利要求1所述的菜品检测方法，其特征在于，步骤2）提取图像特征的步骤包括：首先将待检测图像转换为224*224像素作为特征提取网络的输入，然后做5层卷积，每层卷积核分别为7*7、5*5、3*3、3*3、3*3，并且对每层提取的特征图的局部区域做最大值池化，得到大小为51*39，每个位置256维的特征图，该256维向量即为该位置对应原图局部区域的特征向量。

3.如权利要求2所述的菜品检测方法，其特征在于，步骤3）给出提议区域的步骤包括：以特征图中每个元素在原图中的对应位置为中心，以原图大小为1000*600为标准，给出三种尺度128、256、512，三种比例1:1、1:2、2:1，共九个提议区域。

4. 如权利要求3所述的菜品检测方法，其特征在于，步骤4）判断是否为物体的步骤包括：如果原图中的bounding box和提议区域重合部分超过70%则认为该区域包含物体，否则认为不包含，对图像作标签；使用提议区域中心对应的特征向量作为特征；使用特征和标签训练一个全连接的神经网络来判断该区域是否为物体。

5.如权利要求4所述的菜品检测方法，其特征在于，步骤5）包括：在提议区域是物体的情况下，在特征图上找到待提取特征的局部图像对应的区域，将该区域分别以4*4、2*2、1*1三种比例将特征图进行分割，对分割好的每一块做最大值池化，提取该区块的256维特征，将各区块提取出的特征连接到一起，最终得到4*4*256+2*2*256+1*1*256=5376维特征。

6.如权利要求5所述的菜品检测方法，其特征在于，步骤6）包括：将通过SPPNET提取出的区域特征向量作为输入，以该区域属于菜品和背景的可能性作为输出，训练一个神经网络，通过该神经网络进行判断。

7.如权利要求6所述的菜品检测方法，其特征在于，判断是否属于菜品时，当为菜品的可能性为90%时将该物体判断为菜品。

完整全部详细技术资料下载

当前第2页1 2 3