对象识别方法及装置与流程

文档序号:26590037发布日期:2021-09-10 20:36阅读:65来源:国知局
1.本说明书涉及机器学习
技术领域
:,特别涉及一种对象识别方法及装置。
背景技术
::2.行人识别技术主要研究方法正逐步从传统的人为设计的特征提取与度量匹配相结合的方式,转变为基于深度学习模型的特征提取和行人识别的方式。3.目前,行人识别研究方法大多将行人检测工作和行人再识别工作分开进行,导致行人再识别工作中,会使用默认标注好的行人区域进行识别工作。然而,在实际应用场景中,通常需要从监控设备收集的整张图像中进行目标行人的提取,用于训练网络的数据集需要大量的前期准备工作,从图像信息的摄录到图片信息中行人的标注分类均需要很多的人力工作来完成。同时,现有的通过神经网络方式进行行人再识别的网络结构相对简单,实际识别率及识别效果一般,准确度有待于进一步提高。4.针对上述问题,目前尚未提出有效的解决方案。技术实现要素:5.本说明书实施例提供了一种对象识别方法及装置,以提高行人识别的效率和准确率。6.本说明书实施例提供了一种对象识别方法,包括:获取待检测图像;将所述待检测图像输入到训练好的对象检测识别网络中,以识别所述待检测图像中是否存在目标对象;其中,所述对象检测识别网络包括对象特征提取子网络、对象检测子网络和对象识别子网络;所述对象特征提取子网络用于对所述待检测图像进行特征提取,生成特征集合图;所述对象检测子网络和所述对象识别子网络共享所述对象特征提取子网络输出的特征集合图;所述对象检测子网络用于对所述特征集合图进行对象检测,输出多个对象候选区域,所述对象识别子网络用于确定所述多个对象候选区域中各对象候选区域中是否存在目标对象。7.在一个实施例中,所述对象检测识别网络通过以下方式训练得到:获取训练样本集和标签集,其中,所述训练样本集中包括多个图像中各图像的多个候选区域的特征向量,所述标签集中包括所述多个候选区域中各候选区域的特征向量对应的分类标签,所述分类标签包括第一标签、第二标签和第三标签,其中,所述第一标签表明该候选区域为与目标对象吻合的包围盒,所述第二标签表明该候选区域为包含对象但不是目标对象的包围盒,所述第三标签表明该候选区域为背景包围盒;利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,得到所述对象检测识别网络。8.在一个实施例中,利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,包括:将所述训练样本集中分类标签为第一标签的候选区域对应的特征向量存储在查找表中;将训练过程中对象识别子网络识别为所述第一标签的候选区域对应的特征向量存储在mini‑batch中;计算mini‑batch中的特征向量与所述查找表中的特征向量之间的第一相似度;通过模型迭代训练,增大所述第一相似度。9.在一个实施例中,利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,包括:将所述训练样本集中分类标签为第二标签的候选区域对应的特征向量存储在循环队列中;将训练过程中对象识别子网络识别为所述第一标签的候选区域对应的特征向量存储在mini‑batch中;计算mini‑batch中的特征向量与所述循环队列中的特征向量之间的第二相似度,通过模型迭代训练,减小所述第二相似度。10.在一个实施例中,在计算mini‑batch中的特征向量与循环队列中的特征向量之间的第二相似度之后,还包括:在所述第二相似度大于预设阈值的情况下,将mini‑batch中对应的特征向量保存至所述循环队列中。11.在一个实施例中,在训练所述对象检测识别网络的过程中,采用oim损失函数来对对象检测识别网络中的参数进行更新。12.在一个实施例中,所述对象检测子网络包括faster‑rcnn检测网络。13.本说明书实施例还提供了一种对象识别装置,包括:获取模块,用于获取待检测图像;识别模块,用于将所述待检测图像输入到训练好的对象检测识别网络中,以识别所述待检测图像中是否存在目标对象;其中,所述对象检测识别网络包括对象特征提取子网络、对象检测子网络和对象识别子网络;所述对象特征提取子网络用于对所述待检测图像进行特征提取,生成特征集合图;所述对象检测子网络和所述对象识别子网络共享所述对象特征提取子网络输出的特征集合图;所述对象检测子网络用于对所述特征集合图进行对象检测,输出多个对象候选区域,所述对象识别子网络用于确定所述多个对象候选区域中各对象候选区域中是否存在目标对象。14.本说明书实施例还提供一种计算机设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述任意实施例中所述的对象识别方法的步骤。15.本说明书实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任意实施例中所述的对象识别方法的步骤。16.在本说明书实施例中,提供了一种对象识别方法,可以获取待检测图像,将所述待检测图像输入到训练好的对象检测识别网络中,以识别所述待检测图像中是否存在目标对象,所述对象检测识别网络包括对象特征提取子网络、对象检测子网络和对象识别子网络,所述对象特征提取子网络用于对所述待检测图像进行特征提取,生成特征集合图,所述对象检测子网络和所述对象识别子网络共享所述对象特征提取子网络输出的特征集合图,所述对象检测子网络用于对所述特征集合图进行对象检测,输出多个对象候选区域,所述对象识别子网络用于确定所述多个对象候选区域中各对象候选区域中是否存在目标对象。上述方案中,通过将待检测图像输入训练好的对象检测识别网络之后即可识别出该待检测图像中是否存在目标行人,可以提高对象识别的效率,节约成本;通过将对象检测和对象识别统一到一个网络中并共享行人特征信息,可以将两部分连接成一个有机的整体,实现了从整张图像信息中提取行人后再进行识别的过程,可以提升了网络识别的准确率,更加符合实际应用的需求。附图说明17.此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,并不构成对本说明书的限定。在附图中:18.图1示出了本说明书一实施例中的对象识别方法的流程图;19.图2示出了本具体实施例中的对象检测识别网络的网络框架;20.图3示出了对象特征提取子网络和对象识别网络的网络结构;21.图4示出了目标行人的图像的示意图;22.图5示出了将待检测图像输入行人检测识别网络后输出的结果示意图。23.图6示出了本说明书一实施例中的对象识别装置的示意图;24.图7示出了本说明书一实施例中的计算机设备的示意图。具体实施方式25.下面将参考若干示例性实施方式来描述本说明书的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本说明书,而并非以任何方式限制本说明书的范围。相反,提供这些实施方式是为了使本说明书公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。26.本领域的技术人员知道,本说明书的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本说明书公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。27.本说明书实施例提供了一种对象识别方法。图1示出了本说明书一实施例中对象识别方法的流程图。虽然本说明书提供了如下述实施例或附图所示的方法操作步骤或装置结构,但基于常规或者无需创造性的劳动在所述方法或装置中可以包括更多或者更少的操作步骤或模块单元。在逻辑性上不存在必要因果关系的步骤或结构中,这些步骤的执行顺序或装置的模块结构不限于本说明书实施例描述及附图所示的执行顺序或模块结构。所述的方法或模块结构的在实际中的装置或终端产品应用时,可以按照实施例或者附图所示的方法或模块结构连接进行顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至分布式处理环境)。28.具体地,如图1所示,本说明书一种实施例提供的对象识别方法可以包括以下步骤:29.步骤s101,获取待检测图像。30.本实施例中的方法可以应用于对象识别设备。对象识别设备可以是一个服务器,也可以是包括多个服务器的集群。在一个实施例中,对象识别设备可以接收业务终端发送的待检测图像。在另一个实施例中,对象识别设备也可以接收业务终端发送的待检测视频,可以从待检测视频中提取多个待检测图像。其中,待检测图像可以是灰度图,也可以是彩色图。31.步骤s102,将所述待检测图像输入到训练好的对象检测识别网络中,以识别所述待检测图像中是否存在目标对象。32.在接收到待检测图像之后,可以将待检测图像输入到训练好的对象检测识别网络中,以识别待检测图像中是否存在目标对象。其中,目标对象可以是待识别的各种对象,例如,行人、动物、植物、路标等。33.所述对象检测识别网络可以包括对象特征提取子网络、对象检测子网络和对象识别子网络。所述对象特征提取子网络用于对所述待检测图像进行特征提取,生成特征集合图。对象特征提取子网络可以包括多个卷积层,用于提取图像中的特征。所述对象检测子网络和所述对象识别子网络共享所述对象特征提取子网络输出的特征集合图。所述对象检测子网络可以用于对所述特征集合图进行对象检测,输出多个对象候选区域。所述对象识别子网络可以用于确定所述多个对象候选区域中各对象候选区域中是否存在目标对象。所述对象检测识别网络可以通过对对象特征提取子网络、对象检测子网络和对象识别子网络进行联合训练获得。34.上述实施例中,通过将待检测图像输入训练好的对象检测识别网络之后即可识别出该待检测图像中是否存在目标行人,可以提高对象识别的效率,节约成本;通过将对象检测和对象识别统一到一个网络中并共享行人特征信息,可以将两部分连接成一个有机的整体,实现了从整张图像信息中提取行人后再进行识别的过程,可以提升了网络识别的准确率,更加符合实际应用的需求。35.在本说明书一些实施例中,所述对象检测识别网络可以通过以下方式训练得到:获取训练样本集和标签集,其中,所述训练样本集中包括多个图像中各图像的多个候选区域的特征向量,所述标签集中包括所述多个候选区域中各候选区域的特征向量对应的分类标签,所述分类标签包括第一标签、第二标签和第三标签,其中,所述第一标签表明该候选区域为与目标对象吻合的包围盒,所述第二标签表明该候选区域为包含对象但不是目标对象的包围盒,所述第三标签表明该候选区域为背景包围盒;利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,得到所述对象检测识别网络。36.具体地,可以获取训练样本集和标签集。所述训练样本集中可以包括多个图像中各图像的多个候选区域的特征向量。特征向量是通过对图像进行特征提取得到的。所述标签集中包括所述多个候选区域中各候选区域的特征向量对应的分类标签,所述分类标签包括第一标签、第二标签和第三标签。其中,所述第一标签表明该候选区域为与目标对象吻合的包围盒,即该包围盒中包含目标对象。所述第二标签表明该候选区域为包含对象但不是目标对象的包围盒。所述第三标签表明该候选区域为背景包围盒,即该候选区域中不包含任何对象。可以利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,得到所述对象检测识别网络。通过上述方式,可以利用训练样本集和标签集对对象特征提取子网络、对象检测子网络和对象识别子网络进行联合训练,得到训练好的行人检测识别网络。37.在本说明书一些实施例中,利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,可以包括:将所述训练样本集中分类标签为第一标签的候选区域对应的特征向量存储在查找表中;将训练过程中对象识别子网络识别为所述第一标签的候选区域对应的特征向量存储在mini‑batch中;计算mini‑batch中的特征向量与所述查找表中的特征向量之间的第一相似度;通过模型迭代训练,增大所述第一相似度。38.为了提高对象检测识别网络的识别准确率,可以通过训练模型使得相同对象之间的特征接近。具体的,在训练网络的过程中,将训练样本集中分类为第一标签的候选区域对应的特征向量存储在查找表中。第一标签表明该候选区域中包含目标对象。在训练过程的正向传播时,识别网络对训练样本集中的特征向量进行分类,可以将识别为第一标签的候选区域对应的特征向量存储在mini‑batch(小批量数据集)中。其中,mini‑batch是指在训练之前,对数据进行随机混洗,然后创建多个小批量数据集(mini‑batches),对每一个mini‑batch,用梯度下降训练网络权重。之后,可以计算mini‑batch中的特征向量与查找表中的特征向量之间的第一相似度。通过模型迭代训练,更新网络中的模型参数,增大第一相似度。通过上述方式,可以提高对象检测识别网络的预测准确率。39.在本说明书一些实施例中,利用所述训练样本集和标签集对所述特征向量提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,可以包括:将所述训练样本集中分类标签为第二标签的候选区域对应的特征向量存储在循环队列中;将训练过程中对象识别子网络识别为所述第一标签的候选区域对应的特征向量存储在mini‑batch中;计算mini‑batch中的特征向量与所述循环队列中的特征向量之间的第二相似度,通过模型迭代训练,减小所述第二相似度。40.为了提高对象检测识别网络的识别准确率,可以通过训练模型使得不同对象之间的特征区别大。具体的,在训练网络的过程中,可以将训练样本集中分类标签为第二标签的候选区域对应的特征向量存储在循环队列中。第二标签表明该候选区域内包含的对象不是目标对象。在训练过程的正向传播时,识别网络对训练样本集中的特征向量进行分类,可以将识别为第一标签的候选区域对应的特征向量存储在mini‑batch中。之后,可以计算mini‑batch中的特征向量与循环队列中的特征向量之间的第二相似度。通过模型迭代训练,更新网络中的模型参数,增大第二相似度。通过上述方式,可以提高对象检测识别网络的预测准确率。41.在本说明书一些实施例中,在计算mini‑batch中的特征向量与循环队列中的特征向量之间的第二相似度之后,还可以包括:在所述第二相似度大于预设阈值的情况下,将mini‑batch中对应的特征向量保存至所述循环队列中。42.为了进一步提高对象检测识别网络的识别准确率,可以在计算mini‑batch中的特征向量与循环队列中的特征向量之间的第二相似度之后,判断第二相似度是否大于预设阈值。在判断第二相似度大于预设阈值的情况下,可以将mini‑batch中的对应的特征向量保存至循环队列中。在第二相似度大于预设阈值的情况下,表明对象识别子网络中的标签标注出现了错误。则在每次迭代后,将mini‑batch中对应的特征向量加入循环队列,避免后续出现相同的错误,从而提高识别的准确率。通过上述方式,可以进一步提高对象识别检测网络的识别准确率。43.在本说明书一些实施例中,在训练所述对象检测识别网络的过程中,可以采用oim损失函数(onlineinstancematching,在线实例匹配损失函数)来对对象检测识别网络中的参数进行更新。通过计算查找表中某一类目标对象的特征向量的概率,可以得到oim损失函数的最大化期望似然函数。可以将特征向量出现在查找表中的概率和出现在循环队列的概率结合,然后通过最大化期望似然函数的推导,得到的损失函数。通过进行oim损失函数针对该特征向量的梯度下降变化,不断更新卷积神经网络中的各项参数,以达到训练网络的目的。44.在本说明书一些实施例中,所述对象检测子网络可以包括faster‑rcnn(faster‑regionswithcnnfeatures,更快地利用卷积神经网络特征提取区域)检测网络。其中,faster‑rcnn检测网络的工作流程如下:输入测试图像;将整张图片输入cnn,进行特征提取;用rpn(regionproposalnetwork,区域提议网络)生成建议窗口,每张图片生成300个建议窗口;把建议窗口映射到cnn的最后一层卷积特征图上;通过roi(regionofinterest,感兴趣区域)池化层使每个roi池化层生成固定尺寸的特征图;利用探测分类概率和探测边框回归对分类概率和边框回归联合训练。faster‑rcnn可以采用卷积网络自行产生建议框,并且和检测网络共享卷积网络,使得建议框数目从原有的约几千个减少为几百个,且建议框的质量也有本质的提高。通过采用faster‑rcnn检测网络来实现对象检测子网络,可以提高对象检测的效率和准确率。45.在本说明书一些实施例中,所述对象特征提取子网络与所述对象识别子网络采用restnet‑50深度网络模型实现。restnet‑50网络模型结构可以包含5个不同的卷积层,分别命名为conv1、conv2_x、conv3_x、conv4_x和conv5_x,其中x表示每个卷积层的残差网络单元标识。根据restnet‑50卷积神经网络结构,将对象特征提取子网络放入conv1至conv4_3的网络层次结构中,将对象识别网络放入conv4_4至conv5_3网络结构中。46.下面结合一个具体实施例对上述方法进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本说明书,并不构成对本说明书的不当限定。47.请参考图2和图3,图2示出了本具体实施例中的对象检测识别网络的网络框架,图3示出了对象特征提取子网络和对象识别网络的网络结构。本具体实施例中,以对象为行人为例进行说明。已有的实验研究表明,卷积神经网络在行人特征提取、目标行人检测等图像信息处理领域有着良好的性能和效果。本文使用将行人检测和目标行人识别工作统一至一个卷积神经网络的方法进行行人再识别工作的研究。整体网络结构流程图参考图2所示,网络结构是由三个子网络系统组合而成,分别是特征提取子网络、行人检测子网络以及行人识别子网络。其中,行人检测子网络和行人识别子网络将共享由特征提取子网络提取的行人特征信息。48.本具体实施例中,采用restnet‑50卷积神经网络模型作为的基础网络。如图3所示,可以将特征提取子网络和行人识别子网络分配到神经网络模型。restnet‑50网络模型结构可以包含5个不同的卷积层,分别命名为conv1、conv2_x、conv3_x、conv4_x和conv5_x,其中x表示每个卷积层的残差网络单元标识。根据restnet‑50卷积神经网络结构,将对象特征提取子网络放入conv1至conv4_3的网络层次结构中,将对象识别网络放入conv4_4至conv5_3网络结构中。49.下面说明本具体实施例中的行人检测识别神经网络模型的工作原理。50.将输入的图像信息送入第一部分特征提取网络中进行卷积,生成含有1024个特征通道的特征集合图(featuremaps),生成的特征图像分辨率为原始图像的1/16。51.根据生成的特征集合图针对行人的特征部分再进行一次特征卷积,过滤器的维度为3×5×512。利用faster‑rcnn方法进行候选特征区域的标注,针对第二步生成的特征图像的每个像素点使用9个anchors(锚点)进行行人的检测,使用softmax分类器对每个标注区域内判断是否存在行人目标,选取置信度高的行人候选区域,采用线性回归方法对选中的候选区域进行位置的精修。最后采用非极大抑制值方式从所有的候选区域内筛选置信度最高的128个包围盒作为行人检测网络的输出。52.对获取的所有包围盒进行池化处理,调整图像比例后,将生成的14×14×1024维特征图像送入行人识别网络,经过行人识别网络的特征提取后,经过一个全局平均池化层(将每一张特征图的所有像素点计算平均值的操作)后输出一个2048维的特征向量。53.由于行人检测网络的准确率无法达到百分之百,会出现输出的行人检测包围盒(bounding‑box)内没有行人的问题。第四步结束后,再次利用softmax分类器对没有行人的候选区域进行筛选。并使用线性回归方法对行人检测包围盒进行进行精修。同时再对2048维度的特征向量进行l2归一化函数处理,生成一个256维的输出向量。54.将步骤5种的特征向量与目标行人进行余弦相似度计算,判断是否为目标行人。55.请参考图4和图5,图4示出了目标行人的图像的示意图,图5示出了将待检测图像输入行人检测识别网络后输出的结果示意图。在图5中,多个方框为行人检测网络检测出的候选区域,方框左上方的数字为该候选区域中存在目标行人的概率。56.本具体实施例中的神经网络训练过程反向传播流程介绍:57.在训练阶段,经过行人检测网络提取候选区域后,将候选区域与特征集合图里的特征图像进行对比,根据输入图像中标注的行人区域坐标,为每一个候选区域进行分类并进行标签注释。58.将训练样本集中的标注标签的区域划分为3种类型:与目标行人吻合的包围盒(第一标签),包含行人但不是目标行人的包围盒(第二标签)以及背景包围盒(第三标签)。59.神经网络的目的是对不同的行人进行分类,可以尽可能使实例中相同行人之间的特征差距减小,同事最大化不同行人之间的特征差距。所以本网络采用了oim损失函数来对卷积神经网络中的参数进行更新。60.假定训练集中有l个已经标注的目标行人,创建一个查找表(lut,look‑uptable)来保存标签为第一标签的行人特征,以及一个循环队列(cq,circularqueue)来保存标签为第二标签的行人特征。61.将训练集中的图像送入神经网络进行特征提取,逐一选取识别网络中标识为第一标签的候选区域,并将该候选区域的特征向量x(维度与生成的特征向量保持一致)存入mini‑batch中。62.前向传播过程中,计算mini‑batch中样本与lut中所有标注为第一标签的特征向量之间的余弦相似度。而在训练过程中即反向传播过程中,如果目标行人的分类标签为t,则通过计算查找lut的第t列。63.而针对循环队列中保存的标签,将循环队列中的特征向量与mini‑batch中的样本也进行余弦相似度的计算,如果产生匹配,则表明行人识别网络中的第一标签标注出现了错误。则在每次迭代后,将mini‑batch中的特征向量加入循环队列,然后弹出一个队头向量。64.通过计算lut表中第i类行人的特征向量x的概率,得到oim损失函数的最大化期望似然函数。通过进行oim损失函数针对x的梯度下降变化,不断更新卷积神经网络中的各项参数,以达到训练网络的目的。65.本具体实施例中的神经网络架构经过试验验证,针对cmc(cumulativematchingcharacteristic,累计匹配特性曲线)和map(meanaverageprecision,平均精确度均值)两项性能指标的表现均优于将检测和识别工作分开进行的行人再识别方式。同时,通过将目标行人从整张图像中提取出来再进行识别的工作方式也更加适用于实际操作。66.基于同一发明构思,本说明书实施例中还提供了一种对象识别装置,如下面的实施例所述。由于对象识别装置解决问题的原理与对象识别方法相似,因此对象识别装置的实施可以参见对象识别方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图6是本说明书实施例的对象识别装置的一种结构框图,如图6所示,包括:获取模块601和识别模块602,下面对该结构进行说明。67.获取模块601用于获取待检测图像。68.识别模块602用于将所述待检测图像输入到训练好的对象检测识别网络中,以识别所述待检测图像中是否存在目标对象。69.其中,所述对象检测识别网络包括对象特征提取子网络、对象检测子网络和对象识别子网络;所述对象特征提取子网络用于对所述待检测图像进行特征提取,生成特征集合图;所述对象检测子网络和所述对象识别子网络共享所述对象特征提取子网络输出的特征集合图;所述对象检测子网络用于对所述特征集合图进行对象检测,输出多个对象候选区域,所述对象识别子网络用于确定所述多个对象候选区域中各对象候选区域中是否存在目标对象。70.在本说明书一些实施例中,所述对象检测识别网络通过以下方式训练得到:获取训练样本集和标签集,其中,所述训练样本集中包括多个图像中各图像的多个候选区域的特征向量,所述标签集中包括所述多个候选区域中各候选区域的特征向量对应的分类标签,所述分类标签包括第一标签、第二标签和第三标签,其中,所述第一标签表明该候选区域为与目标对象吻合的包围盒,所述第二标签表明该候选区域为包含对象但不是目标对象的包围盒,所述第三标签表明该候选区域为背景包围盒;利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,得到所述对象检测识别网络。71.在本说明书一些实施例中,利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,包括:将所述训练样本集中分类标签为第一标签的候选区域对应的对象特征存储在查找表中;将训练过程中对象识别子网络识别为所述第一标签的候选区域对应的对象特征存储在mini‑batch中;计算mini‑batch中的特征向量与所述查找表中的特征向量之间的第一相似度;通过模型迭代训练,增大所述第一相似度。72.在本说明书一些实施例中,利用所述训练样本集和标签集对所述对象特征提取子网络、所述对象检测子网络和所述对象识别子网络进行训练,包括:将所述训练样本集中分类标签为第二标签的候选区域对应的特征向量存储在循环队列中;将训练过程中对象识别子网络识别为所述第一标签的候选区域对应的特征向量存储在mini‑batch中;计算mini‑batch中的特征向量与所述循环队列中的特征向量之间的第二相似度,通过模型迭代训练,减小所述第二相似度。73.在本说明书一些实施例中,在计算mini‑batch中的特征向量与循环队列中的特征向量之间的第二相似度之后,还包括:在所述第二相似度大于预设阈值的情况下,将mini‑batch中对应的特征向量保存至所述循环队列中。74.在本说明书一些实施例中,在训练所述对象检测识别网络的过程中,采用oim损失函数来对对象检测识别网络中的参数进行更新。75.在本说明书一些实施例中,对象检测子网络包括faster‑rcnn检测网络。76.在本说明书一些实施例中,对象特征提取子网络和对象识别子网络采用restnet‑50深度网络模型实现。77.从以上的描述中,可以看出,本说明书实施例实现了如下技术效果:通过将待检测图像输入训练好的对象检测识别网络之后即可识别出该待检测图像中是否存在目标行人,可以提高对象识别的效率,节约成本;通过将对象检测和对象识别统一到一个网络中并共享行人特征信息,可以将两部分连接成一个有机的整体,实现了从整张图像信息中提取行人后再进行识别的过程,可以提升了网络识别的准确率,更加符合实际应用的需求。78.本说明书实施方式还提供了一种计算机设备,具体可以参阅图7所示的基于本说明书实施例提供的对象识别方法的计算机设备组成结构示意图,所述计算机设备具体可以包括输入设备71、处理器72、存储器73。其中,所述存储器73用于存储处理器可执行指令。所述处理器72执行所述指令时实现上述任意实施例中所述的对象识别方法的步骤。79.在本实施方式中,所述输入设备具体可以是用户和计算机系统之间进行信息交换的主要装置之一。所述输入设备可以包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;输入设备用于把原始数据和处理这些数的程序输入到计算机中。所述输入设备还可以获取接收其他模块、单元、设备传输过来的数据。所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit,asic)、可编程逻辑控制器和嵌入微控制器的形式等等。所述存储器具体可以是现代信息技术中用于保存信息的记忆设备。所述存储器可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如ram、fifo等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、tf卡等。80.在本实施方式中,该计算机设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。81.本说明书实施方式中还提供了一种基于对象识别方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现上述任意实施例中所述对象识别方法的步骤。82.在本实施方式中,上述存储介质包括但不限于随机存取存储器(randomaccessmemory,ram)、只读存储器(read‑onlymemory,rom)、缓存(cache)、硬盘(harddiskdrive,hdd)或者存储卡(memorycard)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。83.在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。84.显然,本领域的技术人员应该明白,上述的本说明书实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本说明书实施例不限制于任何特定的硬件和软件结合。85.应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本说明书的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。86.以上所述仅为本说明书的优选实施例而已,并不用于限制本说明书,对于本领域的技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1