物体识别方法和装置的制造方法

文档序号：9751331阅读：468来源：国知局

物体识别方法和装置的制造方法
【技术领域】
[0001]本公开涉及图像处理，尤其涉及一种物体识别方法和装置。
【背景技术】
[0002]目前，大部分物体识别方法都是先学习大量的样本，获得学习结果，即物体模型；然后用不同的框遍历需要测试的图片，将遍历的框中的内容依次与物体模型比对，确定框中是否存在此物体模型。然而，对于一幅N*N图像而言，要遍历所有可能的框，需要遍历的次数大约为N的4次方数量级。

【发明内容】

[0003]为克服相关技术中存在的问题，本公开提供一种物体识别方法和装置。所述技术方案如下:
[0004]根据本公开实施例的第一方面，提供一种物体识别方法，该方法包括:
[0005]基于BING方法在待识别图像中确定至少一个第一候选框，该第一候选框用于标识待检测是否包含目标物体的图像区域；
[0006]将第一候选框与目标物体模型进行比对，该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型；
[0007]若第一候选框中存在所述目标物体模型，则标示第一候选框。
[0008]本公开的实施例提供的技术方案可以包括以下有益效果:通过BING方法获取可能包含目标物体的至少一个第一候选框，相对于现有技术，可大大减少需要比对的候选框的数目，因单次比对所持续的时间相对固定，因此，比对次数的减少可加速物体识别过程;将第一候选框与目标物体模型进行比对，该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型，若第一候选框中存在目标物体模型，则标示第一候选框，完成对物体的识别，其中，采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小，较贴近目标物体的形状，可保证物体识别的精确度，因此，本公开可快速、精确地进行物体识别。
[0009]可选地，上述基于BING方法在待识别图像中确定至少一个第一候选框，包括:采用BING方法对待识别图像进行对象估计，获得该待识别图像中的至少一个第一候选框。
[0010]进一步地，上述将第一候选框与目标物体模型进行比对之前，还包括:对至少一个第一候选框进行聚类，确定第二候选框。该第二候选框的个数少于第一候选框的个数。相应地，上述将第一候选框与目标物体模型进行比对，具体为:将第二候选框与目标物体模型进行比对。上述若第一候选框中存在目标物体模型，则标示第一候选框，具体为:若第二候选框中存在目标物体模型，则标示第二候选框。
[0011]本公开的实施例提供的技术方案可以包括以下有益效果:通过对至少一个第一候选框进行聚类确定第二候选框，进一步减少需比对的候选框的个数，完成物体识别过程所消耗的时间更少，提升用户体验。
[0012]进一步地，上述对至少一个第一候选框进行聚类，确定第二候选框之前，还包括:在至少一个第一候选框中，选取置信分值大于预设值的候选框。该置信分值用于表征候选框中包含目标物体的概率。相应地，上述对至少一个第一候选框进行聚类，确定第二候选框，包括:根据置信分值大于预设值的候选框的大小，对置信分值大于预设值的候选框进行聚类，确定第二候选框。
[0013]其中，上述根据置信分值大于预设值的候选框的大小，对置信分值大于预设值的候选框进行聚类，确定第二候选框，包括:对置信分值大于预设值的候选框中每两个候选框，获取两个候选框各自左上角和右下角在待识别图像中位置坐标;根据两个候选框各自左上角和右下角在所述待识别图像中位置坐标，获得两个候选框的重合面积;若两个候选框的重合面积大于预设阈值，则判定两个候选框为一类;根据聚类后的候选框，确定第二候选框。
[0014]进一步地，上述根据聚类后的候选框，确定第二候选框，可以通过多种方式实现。
[0015]—种实现方式中，根据聚类后的候选框，确定第二候选框可以包括:将每一类包含的候选框在待识别图像中的位置坐标求平均，确定每一类包含的所有候选框的平均坐标对应的候选框为第二候选框。例如，类I中每个候选框的左上角和右下角在待识别图像中位置坐标是已知的，对类I中所有候选框的左上角在待识别图像中位置坐标求平均值，获得类I包含的所有候选框的左上角在待识别图像中平均位置坐标;同理，对类I中所有候选框的右下角在待识别图像中位置坐标求平均值，获得类I包含的所有候选框的右下角在待识别图像中平均位置坐标，该两个平均位置坐标对应的候选框即为根据类I中所有候选框确定的第二候选框。
[0016]另一种实现方式中，根据聚类后的候选框，确定第二候选框可以包括:根据聚类后的候选框，确定每一类包含的候选框中置信分值最大的候选框为第二候选框。这里仍以类I为例进行说明，其中，类I包含的候选框中，每一候选框对应的置信分值可能是不同的，确定对应置信分值最大的候选框作为类I的第二候选框。同理，在类2包含的候选框中，确定对应置信分值最大的候选框作为类2的第二候选框。以此类推，确定每一类的第二候选框。
[0017]进一步地，上述标示第一候选框之后，还包括:向用户发出音频提示或者视频提示，以提示用户识别到目标物体。
[0018]本公开的实施例提供的技术方案可以包括以下有益效果:通过多样的提示方式，可以使得用户采用各种方式获取到识别到物体的提示信息，增加用户兴趣，提升用户体验。
[0019]根据本公开实施例的第二方面，提供一种物体识别装置，所述装置包括:
[0020]获取模块，被配置为基于BING方法在待识别图像中确定至少一个第一候选框，该第一候选框用于标识待检测是否包含目标物体的图像区域；
[0021]比对模块，被配置为将第一候选框与目标物体模型进行比对，该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型；
[0022]标示模块，被配置为若第一候选框中存在目标物体模型，则标示第一候选框。
[0023]本公开的实施例提供的技术方案可以包括以下有益效果:通过BING方法获取可能包含目标物体的至少一个第一候选框，相对于现有技术，可大大减少需要比对的候选框的数目，因单次比对所持续的时间相对固定，因此，比对次数的减少可加速物体识别过程;将第一候选框与目标物体模型进行比对，该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型，若第一候选框中存在目标物体模型，则标示第一候选框，完成对物体的识别，其中，采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小，较贴近目标物体的形状，可保证物体识别的精确度，因此，本公开可快速、精确地进行物体识别。
[0024]应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。
【附图说明】
[0025]为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。
[0026]图1是根据一示例性实施例示出的一种物体识别方法的流程图；
[0027]图2是图1不例性实施例的一种应用场景不意图；
[0028]图3是根据一示例性实施例示出的一种物体识别方法的流程图；
[0029]图4是根据一示例性实施例示出的一种物体识别装置框图；
[0030]图5是根据一示例性实施例示出的一种物体识别装置框图；
[0031 ]图6是根据一示例性实施例示出的一种物体识别装置框图；
[0032]图7是根据一示例性实施例示出的一种物体识别装置框图。
[0033]通过上述附图，已示出本公开明确的实施例，后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围，而是通过参考特定实施例为本领域技术人员说明本公开的概念。
【具体实施方式】
[0034]这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0035]本公开的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例例如能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈志军;李明浩;侯文迪;
技术所有人：小米科技有限责任公司;
我是此专利的发明人

上一篇：一种集成特征选择方法及系统的制作方法
上一篇：基于卷积神经网络的目标定位方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。