图像的识别方法、装置、存储介质以及电子设备与流程

文档序号:31334721发布日期:2022-08-31 08:25阅读:63来源:国知局
图像的识别方法、装置、存储介质以及电子设备与流程

1.本发明涉及计算机领域,具体而言,涉及一种图像的识别方法、装置、存储介质以及电子设备。


背景技术:

2.深度学习是目前人工智能领域使用的最通用技术方案,其最基本的方法被称为监督学习,即所有的数据都有相应的人工标注,使用人工标注的结果来指导深度学习的神经网络进行训练,使其能够满足特定的需求。经过一段时间的发展,深度学习衍生出了很多其他的学习方法,自监督学习,主要思想即是自己监督自己进行学习,给予神经网络同一图像的两张不同的变体(如一张做旋转,一张做镜像)使得网络给出的结果能够判断出这两张输入来自同一张图像。自监督学习最主要解决的问题就是带有人工标注的数据较为稀少带来的网络性能不高的问题。在logo(商标)识别领域,现有技术中,是将logo的检测和logo的识别分开,将logo的识别单独进行处理,不再使用分类的方法,而使用检索的方案进行识别,首先训练一个二分类的检测器判断图像中logo的位置,然后将logo送入到检索网络中,检索出和其最相似的logo的类别。但需要标注数据进行训练,而目前学术界可以使用的logo数据集的数量非常有限且其质量很差,这导致网络训练结果的性能得不到足够的提升。


技术实现要素:

3.本发明实施例提供了一种图像的识别方法、装置、存储介质以及电子设备,以至少解决训练模型的网络性能低的技术问题。
4.根据本发明实施例的一个方面,提供了一种图像的识别方法,包括:获取目标图像,其中,上述目标图像中包含待分类对象;对上述目标图像进行数据增强,得到第一图像和第二图像;将上述第一图像输入至第一识别模型,得到第一输出结果并根据上述第一输出结果确定上述目标图像的分类结果,将上述第二图像输入第二识别模型,得到第二输出结果;获取上述第一输出结果与上述第二输出结果的对比结果;在上述对比结果小于阈值的情况下,输出上述目标图像的分类结果。
5.根据本发明实施例的另一方面,提供了一种图像的识别装置,包括:第一获取模块,用于获取目标图像,其中,上述目标图像中包含待分类对象;处理模块,用于对上述目标图像进行数据增强,得到第一图像和第二图像;输入模块,用于将上述第一图像输入至第一识别模型,得到第一输出结果并根据上述第一输出结果确定上述目标图像的分类结果,将上述第二图像输入第二识别模型,得到第二输出结果;第二获取模块,用于获取上述第一输出结果与上述第二输出结果的对比结果;输出模块,用于在上述对比结果小于阈值的情况下,输出上述目标图像的分类结果。
6.作为一种可选的示例,上述处理模块包括:第一旋转单元,用于对上述目标图像进行第一度数的角度旋转,得到第一旋转图像;第一翻转单元,用于水平或竖直翻转上述第一旋转图像,得到第一翻转图像;第一裁剪单元,用于对上述第一翻转图像进行随机裁剪,得
到上述第一图像;第二旋转单元,用于对上述目标图像进行第二度数的角度旋转,得到第二旋转图像;第二翻转单元,用于水平或竖直翻转上述第二旋转图像,得到第二翻转图像;第二裁剪单元,用于对上述第二翻转图像进行随机裁剪,得到上述第二图像。
7.作为一种可选的示例,上述第二获取模块包括:计算单元,用于计算上述第一输出结果和上述第二输出结果之间的余弦距离,得到上述对比结果。
8.作为一种可选的示例,上述装置还包括:更新模块,用于在上述对比结果大于或等于上述阈值的情况下,更新上述第一识别模型和上述第二识别模型的模型参数。
9.作为一种可选的示例,上述更新模块包括:第一调整单元,用于调整上述第一识别模型的模型参数;第一识别单元,用于使用调整后的上述第一识别模型识别上述第一图像,得到上述第一输出结果;第二调整单元,用于在上述目标图像包括上述待分类对象的情况下,在上述对比结果仍大于或等于上述阈值的情况下,或上述分类结果与上述标注结果不同的情况下,继续调整上述第一识别模型的模型参数,直到上述对比结果小于上述阈值且上述分类结果与上述标注结果相同。
10.作为一种可选的示例,上述更新模块包括:第三调整单元,用于调整上述第一识别模型的模型参数;第二识别单元,用于使用调整后的上述第一识别模型识别上述第一图像,得到上述第一输出结果;第四调整单元,用于在上述目标图像未包括上述待分类对象的情况下,在上述对比结果仍大于或等于上述阈值的情况下,继续调整上述第一识别模型的模型参数,直到上述对比结果小于上述阈值。
11.作为一种可选的示例,上述更新模块包括:获取单元,用于获取更新后的上述第一识别模型的更新模型参数和上述第二识别模型的当前模型参数;处理单元,用于根据上述第一识别模型的更新模型参数和上述第二识别模型的当前模型参数更新上述第二识别模型,得到上述第二识别模型的更新模型参数。
12.作为一种可选的示例,上述处理单元包括:第一处理子单元,用于将上述第一识别模型的更新模型参数乘以第一值,得到第一模型参数;第二处理子单元,用于将上述第二识别模型的当前模型参数乘以第二值,得到第二模型参数,其中,上述第一值和上述第二值的和为1;第三处理子单元,用于对上述第一模型参数和上述第二模型参数进行求和,得到上述第二识别模型的更新模型参数。
13.根据本发明实施例的又一方面,还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被处理器运行时执行上述图像的识别方法。
14.根据本发明实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过所述计算机程序执行上述的图像的识别方法。
15.在本技术的上述图像的识别方法可用于深度学习技术的计算机视觉的过程中,在本发明实施例中,采用了获取目标图像,其中,上述目标图像中包含待分类对象;对上述目标图像进行数据增强,得到第一图像和第二图像;将上述第一图像输入至第一识别模型,得到第一输出结果并根据上述第一输出结果确定上述目标图像的分类结果,将上述第二图像输入第二识别模型,得到第二输出结果;获取上述第一输出结果与上述第二输出结果的对比结果;在上述对比结果小于阈值的情况下,输出上述目标图像的分类结果的方法,由于在上述方法中,通过第一识别模型和第二识别模型识别目标图像,得到对比结果,根据对比结
果不断更新第一识别模型和第二识别模型,直到对比结果小于阈值时,输出分类结果,从而实现了提升第一识别模型和第二识别模型的网络性能的目的,进而解决了训练模型的网络性能低的技术问题。
附图说明
16.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
17.图1是根据本发明实施例的一种可选的图像的识别方法的流程图;
18.图2是根据本发明实施例的一种可选的图像的识别方法的具体流程图;
19.图3是根据本发明实施例的一种可选的图像的识别装置的结构示意图;
20.图4是根据本发明实施例的一种可选的电子设备的示意图。
具体实施方式
21.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
22.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
23.根据本发明实施例的第一方面,提供了一种图像的识别方法,可选地,如图1所示,上述方法包括:
24.s102,获取目标图像,其中,目标图像中包含待分类对象;
25.s104,对目标图像进行数据增强,得到第一图像和第二图像;
26.s106,将第一图像输入至第一识别模型,得到第一输出结果并根据第一输出结果确定目标图像的分类结果,将第二图像输入第二识别模型,得到第二输出结果;
27.s108,获取第一输出结果与第二输出结果的对比结果;
28.s110,在对比结果小于阈值的情况下,输出目标图像的分类结果。
29.可选地,本实施例中,目标图像可以为带有商品标志的图像,并包含此商品标志所属的分类结果,例如目标图像为由多个字母组成的商品标志,所属的分类结果为字母类。第一识别模型和第二识别模型为两个相同结构的模型,区别在于第二识别模型的参数是由第一识别模型的参数进行稳步更新的,而第一识别模型的参数是通过对比结果进行反向传播得到的。第一输出结果和第二输出结果为和两条向量,对比结果为两条向量的余弦距离,两条向量的余弦距离越小,表示两个模型越相似,第二识别模型网络性能越好。
30.可选地,本实施例中,获取包含待分类对象的目标图像,对目标图像进行不同角度旋转,翻转,随机裁剪等操作,得到不同的第一图像和第二图像,将第一图像输入至第一识别模型,得到第一输出结果和目标图像的分类结果,将第二图像输入至第二识别模型,得到第二输出结果,其中第一输出结果和第二输出结果为两条不同的向量,计算第一输出结果与第二输出结果的余弦距离,得到对比结果,当对比结果小于阈值时,表示第二识别模型的网络性能很好,此时第一识别模型输出的分类结果即为目标图像的分类结果,输出此分类结果。例如阈值为0.3,第一识别模型输出的分类结果为字母类,计算得到对比结果为0.2,对比结果小于阈值,输出结果为字母类。
31.可选地,本实施例中,通过第一识别模型和第二识别模型识别目标图像,得到对比结果,根据对比结果不断更新第一识别模型和第二识别模型,直到对比结果小于阈值时,输出分类结果,从而实现了提升第一识别模型和第二识别模型的网络性能的目的,进而解决了训练模型的网络性能低的技术问题。
32.作为一种可选的示例,对目标图像进行数据增强,得到第一图像和第二图像包括:
33.对目标图像进行第一度数的角度旋转,得到第一旋转图像;
34.水平或竖直翻转第一旋转图像,得到第一翻转图像;
35.对第一翻转图像进行随机裁剪,得到第一图像;
36.对目标图像进行第二度数的角度旋转,得到第二旋转图像;
37.水平或竖直翻转第二旋转图像,得到第二翻转图像;
38.对第二翻转图像进行随机裁剪,得到第二图像。
39.可选地,本实施例中,第一度数可以为30度,90度,120度,第二度数可以为40度,70度,150度,将目标图像先进行第一度数90度旋转,再水平翻转,最后随机裁剪部分图像,得到第一图像。将目标图像先进行第二度数150度旋转,再竖直翻转,最后随机裁剪部分图像,得到第二图像。使得训练图像丰富度更高,可以更好的训练第一识别模型和第二识别模型。
40.作为一种可选的示例,获取第一输出结果与第二输出结果的对比结果包括:
41.计算第一输出结果和第二输出结果之间的余弦距离,得到对比结果。
42.可选地,本实施例中,计算第一输出结果和第二输出结果两条不同向量的余弦距离,即对比结果,可以为0.2,0.5,0.8,余弦距离越小,表示两条向量越相似即两个模型越相似,两个识别模型的网络性能越好。
43.作为一种可选的示例,上述方法还包括:
44.在对比结果大于或等于阈值的情况下,更新第一识别模型和第二识别模型的模型参数。
45.可选地,本实施例中,阈值为两个模型稳定的临界条件,当对比结果大于或等于阈值时,表示两个模型不稳定,需要继续训练更新,当对比结果小于阈值时,表示两个模型稳定,不需要再训练更新。例如阈值为0.3,对比结果为0.4,对比结果大于阈值,需要更新第一识别模型和第二识别模型的模型参数。
46.作为一种可选的示例,在对比结果大于或等于阈值的情况下,更新第一识别模型的模型参数包括:
47.调整第一识别模型的模型参数;
48.使用调整后的第一识别模型识别第一图像,得到第一输出结果;
49.在目标图像包括待分类对象的情况下,在对比结果仍大于或等于阈值的情况下,或分类结果与标注结果不同的情况下,继续调整第一识别模型的模型参数,直到对比结果小于阈值且分类结果与标注结果相同。
50.可选地,本实施例中,调整第一识别模型的模型参数,得到调整后的第一识别模型,将第一图像输入至调整后的第一识别模型,得到第一输出结果,对别结果,分类结果,在目标图像包括待分类对象,对比结果大于或等于阈值,或分类结果与标注结果不同情况下,第一识别模型的网络性能还不够稳定,循环就行调整第一识别模型的模型参数,直到对别结果小于阈值且分类结果与标注结果相同,第一识别模型的网络性能稳定,不需要再更新调整第一识别模型的模型参数。
51.作为一种可选的示例,在对比结果大于或等于阈值的情况下,更新第一识别模型的模型参数包括:
52.调整第一识别模型的模型参数;
53.使用调整后的第一识别模型识别第一图像,得到第一输出结果;
54.在目标图像未包括待分类对象的情况下,在对比结果仍大于或等于阈值的情况下,继续调整第一识别模型的模型参数,直到对比结果小于阈值。
55.可选地,本实施例中,调整第一识别模型的模型参数,得到调整后的第一识别模型,将第一图像输入至调整后的第一识别模型,得到第一输出结果,对别结果,分类结果,在目标图像不包括待分类对象,对比结果大于或等于阈值的情况下,第一识别模型的网络性能还不够稳定,循环就行调整第一识别模型的模型参数,直到对别结果小于阈值,第一识别模型的网络性能稳定,不需要再更新调整第一识别模型的模型参数。
56.作为一种可选的示例,在对比结果大于或等于阈值的情况下,更新第二识别模型的模型参数包括:
57.获取更新后的第一识别模型的更新模型参数和第二识别模型的当前模型参数;
58.根据第一识别模型的更新模型参数和第二识别模型的当前模型参数更新第二识别模型,得到第二识别模型的更新模型参数。
59.可选地,本实施例中,更新后的第一识别模型性能稳定后,获取更新后的第一识别模型的更新模型参数和第二识别模型的当前模型参数,根据第一识别模型的更新模型参数和第二识别模型的当前模型参数更新第二识别模型,得到第二识别模型的更新模型参数。
60.作为一种可选的示例,根据第一识别模型的更新模型参数和第二识别模型的当前模型参数更新第二识别模型,得到第二识别模型的更新模型参数包括:
61.将第一识别模型的更新模型参数乘以第一值,得到第一模型参数;
62.将第二识别模型的当前模型参数乘以第二值,得到第二模型参数,其中,第一值和第二值的和为1;
63.对第一模型参数和第二模型参数进行求和,得到第二识别模型的更新模型参数。
64.可选地,本实施例中,第一值与第二值的和为1,第一值和第二值可以为0.2与0.8,0.3与0.7,例如第一值为0.2时,第二值为0.8,计算第一识别模型的更新参数乘以第一值0.2的积,第二识别参数的当前模型参数乘以第二值0.8的积,将两积之和作为第二识别模型的更新模型参数。
65.可选地,结合一种示例进行说明,本技术涉及一种图像的识别方法,通过第一识别
模型和第二识别模型识别目标图像,得到对比结果,根据对比结果不断更新第一识别模型和第二识别模型,直到对比结果小于阈值时,输出分类结果。具体流程如图2所示。
66.1、输入目标图像,经过数据增强,即目标图像进行不同角度旋转,水平或竖直翻转,随机裁剪等一些操作变换后生成两幅图像。
67.2、第一图像输入至第一识别模型,第二图像输入至第二识别模型,两幅图像的在经过不同的模型后输出第一输出结果和第二输出结果,第一识别模型输出目标图像的分类结果。
68.第一识别模型和第二识别模型是两个相同结构的模型,区别在于第二识别模型的模型参数是由第一识别模型的模型参数进行稳步更新的,而第二识别模型的模型参数是通过第一输出结果和第二输出结果进行反向传播得到的。第二识别模型的更新是第二识别模型的当前模型参数乘0.8加上第一识别模型的更新模型参数乘0.2。
69.3、计算第一输出结果和第二输出结果的余弦距离,即对比结果,余弦距离越小代表两个模型对同一个图像得到的结果类似,算法越稳定。
70.4、第一识别模型判断此输入的目标图像是否有标注结果,如果有且对比结果小于阈值,输出目标图像的分类结果。
71.需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
72.根据本技术实施例的另一方面,还提供了一种图像的识别装置,如图3所示,包括:
73.第一获取模块302,用于获取目标图像,其中,目标图像中包含待分类对象;
74.处理模块304,用于对目标图像进行数据增强,得到第一图像和第二图像;
75.输入模块306,用于将第一图像输入至第一识别模型,得到第一输出结果并根据第一输出结果确定目标图像的分类结果,将第二图像输入第二识别模型,得到第二输出结果;
76.第二获取模块308,用于获取第一输出结果与第二输出结果的对比结果;
77.输出模块310,用于在对比结果小于阈值的情况下,输出目标图像的分类结果。
78.可选地,本实施例中,目标图像可以为带有商品标志的图像,并包含此商品标志所属的分类结果,例如目标图像为由多个字母组成的商品标志,所属的分类结果为字母类。第一识别模型和第二识别模型为两个相同结构的模型,区别在于第二识别模型的参数是由第一识别模型的参数进行稳步更新的,而第一识别模型的参数是通过对比结果进行反向传播得到的。第一输出结果和第二输出结果为和两条向量,对比结果为两条向量的余弦距离,两条向量的余弦距离越小,表示两个模型越相似,第二识别模型网络性能越好。
79.可选地,本实施例中,获取包含待分类对象的目标图像,对目标图像进行不同角度旋转,翻转,随机裁剪等操作,得到不同的第一图像和第二图像,将第一图像输入至第一识别模型,得到第一输出结果和目标图像的分类结果,将第二图像输入至第二识别模型,得到第二输出结果,其中第一输出结果和第二输出结果为两条不同的向量,计算第一输出结果与第二输出结果的余弦距离,得到对比结果,当对比结果小于阈值时,表示第二识别模型的网络性能很好,此时第一识别模型输出的分类结果即为目标图像的分类结果,输出此分类
结果。例如阈值为0.3,第一识别模型输出的分类结果为字母类,计算得到对比结果为0.2,对比结果小于阈值,输出结果为字母类。
80.可选地,本实施例中,通过第一识别模型和第二识别模型识别目标图像,得到对比结果,根据对比结果不断更新第一识别模型和第二识别模型,直到对比结果小于阈值时,输出分类结果,从而实现了提升第一识别模型和第二识别模型的网络性能的目的,进而解决了训练模型的网络性能低的技术问题。
81.作为一种可选的示例,处理模块包括:
82.第一旋转单元,用于对目标图像进行第一度数的角度旋转,得到第一旋转图像;
83.第一翻转单元,用于水平或竖直翻转第一旋转图像,得到第一翻转图像;
84.第一裁剪单元,用于对第一翻转图像进行随机裁剪,得到第一图像;
85.第二旋转单元,用于对目标图像进行第二度数的角度旋转,得到第二旋转图像;
86.第二翻转单元,用于水平或竖直翻转第二旋转图像,得到第二翻转图像;
87.第二裁剪单元,用于对第二翻转图像进行随机裁剪,得到第二图像。
88.可选地,本实施例中,第一度数可以为30度,90度,120度,第二度数可以为40度,70度,150度,将目标图像先进行第一度数90度旋转,再水平翻转,最后随机裁剪部分图像,得到第一图像。将目标图像先进行第二度数150度旋转,再竖直翻转,最后随机裁剪部分图像,得到第二图像。使得训练图像丰富度更高,可以更好的训练第一识别模型和第二识别模型。
89.作为一种可选的示例,第二获取模块包括:
90.计算单元,用于计算第一输出结果和第二输出结果之间的余弦距离,得到对比结果。
91.可选地,本实施例中,计算第一输出结果和第二输出结果两条不同向量的余弦距离,即对比结果,可以为0.2,0.5,0.8,余弦距离越小,表示两条向量越相似即两个模型越相似,两个识别模型的网络性能越好。
92.作为一种可选的示例,上述装置还包括:
93.更新模块,用于在对比结果大于或等于阈值的情况下,更新第一识别模型和第二识别模型的模型参数。
94.可选地,本实施例中,阈值为两个模型稳定的临界条件,当对比结果大于或等于阈值时,表示两个模型不稳定,需要继续训练更新,当对比结果小于阈值时,表示两个模型稳定,不需要再训练更新。例如阈值为0.3,对比结果为0.4,对比结果大于阈值,需要更新第一识别模型和第二识别模型的模型参数。
95.作为一种可选的示例,更新模块包括:
96.第一调整单元,用于调整第一识别模型的模型参数;
97.第一识别单元,用于使用调整后的第一识别模型识别第一图像,得到第一输出结果;
98.第二调整单元,用于在目标图像包括待分类对象的情况下,在对比结果仍大于或等于阈值的情况下,或分类结果与标注结果不同的情况下,继续调整第一识别模型的模型参数,直到对比结果小于阈值且分类结果与标注结果相同。
99.可选地,本实施例中,调整第一识别模型的模型参数,得到调整后的第一识别模型,将第一图像输入至调整后的第一识别模型,得到第一输出结果,对别结果,分类结果,在
目标图像包括待分类对象,对比结果大于或等于阈值,或分类结果与标注结果不同情况下,第一识别模型的网络性能还不够稳定,循环就行调整第一识别模型的模型参数,直到对别结果小于阈值且分类结果与标注结果相同,第一识别模型的网络性能稳定,不需要再更新调整第一识别模型的模型参数。
100.作为一种可选的示例,更新模块包括:
101.第三调整单元,用于调整第一识别模型的模型参数;
102.第二识别单元,用于使用调整后的第一识别模型识别第一图像,得到第一输出结果;
103.第四调整单元,用于在目标图像未包括待分类对象的情况下,在对比结果仍大于或等于阈值的情况下,继续调整第一识别模型的模型参数,直到对比结果小于阈值。
104.可选地,本实施例中,调整第一识别模型的模型参数,得到调整后的第一识别模型,将第一图像输入至调整后的第一识别模型,得到第一输出结果,对别结果,分类结果,在目标图像不包括待分类对象,对比结果大于或等于阈值的情况下,第一识别模型的网络性能还不够稳定,循环就行调整第一识别模型的模型参数,直到对别结果小于阈值,第一识别模型的网络性能稳定,不需要再更新调整第一识别模型的模型参数。
105.作为一种可选的示例,更新模块包括:
106.获取单元,用于获取更新后的第一识别模型的更新模型参数和第二识别模型的当前模型参数;
107.处理单元,用于根据第一识别模型的更新模型参数和第二识别模型的当前模型参数更新第二识别模型,得到第二识别模型的更新模型参数。
108.可选地,本实施例中,更新后的第一识别模型性能稳定后,获取更新后的第一识别模型的更新模型参数和第二识别模型的当前模型参数,根据第一识别模型的更新模型参数和第二识别模型的当前模型参数更新第二识别模型,得到第二识别模型的更新模型参数。
109.作为一种可选的示例,处理单元包括:
110.第一处理子单元,用于将第一识别模型的更新模型参数乘以第一值,得到第一模型参数;
111.第二处理子单元,用于将第二识别模型的当前模型参数乘以第二值,得到第二模型参数,其中,第一值和第二值的和为1;
112.第三处理子单元,用于对第一模型参数和第二模型参数进行求和,得到第二识别模型的更新模型参数。
113.可选地,本实施例中,第一值与第二值的和为1,第一值和第二值可以为0.2与0.8,0.3与0.7,例如第一值为0.2时,第二值为0.8,计算第一识别模型的更新参数乘以第一值0.2的积,第二识别参数的当前模型参数乘以第二值0.8的积,将两积之和作为第二识别模型的更新模型参数。
114.本实施例的其他示例请参见上述示例,在此不在赘述。
115.图4是根据本技术实施例的一种可选的电子设备的结构框图,如图4所示,包括处理器402、通信接口404、存储器406和通信总线408,其中,处理器402、通信接口404和存储器406通过通信总线408完成相互间的通信,其中,
116.存储器406,用于存储计算机程序;
117.处理器402,用于执行存储器406上所存放的计算机程序时,实现如下步骤:
118.获取目标图像,其中,目标图像中包含待分类对象;
119.对目标图像进行数据增强,得到第一图像和第二图像;
120.将第一图像输入至第一识别模型,得到第一输出结果并根据第一输出结果确定目标图像的分类结果,将第二图像输入第二识别模型,得到第二输出结果;
121.获取第一输出结果与第二输出结果的对比结果;
122.在对比结果小于阈值的情况下,输出目标图像的分类结果。
123.可选地,在本实施例中,上述的通信总线可以是pci(per ipheral component i nterconnect,外设部件互连标准)总线、或eisa(extended industry standard architecture,扩展工业标准结构)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。通信接口用于上述电子设备与其他设备之间的通信。
124.存储器可以包括ram,也可以包括非易失性存储器(non-volati le memory),例如,至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
125.作为一种示例,上述存储器406中可以但不限于包括上述图像的识别装置中的第一获取模块302、处理模块304、输入模块306、第二获取模块308以及输出模块310。此外,还可以包括但不限于上述请求的处理装置中的其他模块单元,本示例中不再赘述。
126.上述处理器可以是通用处理器,可以包含但不限于:cpu(central processing unit,中央处理器)、np(network processor,网络处理器)等;还可以是dsp(digital signal processing,数字信号处理器)、asic(appl ication specific integrated ci rcuit,专用集成电路)、fpga(fie ld-programmab le gate array,现场可编程门阵列)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
127.可选地,本实施例中的具体示例可以参考上述实施例中所描述的示例,本实施例在此不再赘述。
128.本领域普通技术人员可以理解,图4所示的结构仅为示意,实施上述图像的识别方法的设备可以是终端设备,该终端设备可以是智能手机(如android手机、ios手机等)、平板电脑、掌上电脑以及移动互联网设备(mobi le i nternet devices,mi d)、pad等终端设备。图4其并不对上述电子设备的结构造成限定。例如,电子设备还可包括比图4中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图4所示的不同的配置。
129.本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、rom、ram、磁盘或光盘等。
130.根据本发明的实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被处理器运行时执行上述图像的识别方法中的步骤。
131.可选地,在本实施例中,本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(read-on ly memory,
rom)、随机存取器(random access memory,ram)、磁盘或光盘等。
132.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
133.上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在上述计算机可读取的存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在存储介质中,包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。
134.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
135.在本技术所提供的几个实施例中,应该理解到,所揭露的客户端,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
136.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
137.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
138.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1