一种图像识别方法、设备及计算机可读介质与流程

文档序号:36710663发布日期:2024-01-16 12:05阅读:17来源:国知局
一种图像识别方法、设备及计算机可读介质与流程

本申请涉及图像处理领域,尤其涉及一种图像识别方法、设备及计算机可读介质。


背景技术:

1、本部分旨在为权利要求书中陈述的本申请的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就被认为是现有技术。

2、随着互联网的发展,图像数据飞速增加,互联网平台每天要处理数以亿计的图像数据。互联网平台时常需要从数量巨大的业务图像数据中识别一些特定图像,如违规图像、不和谐图像等。这些图像常常数量较少,仅占整个业务数据的万分之一甚至更低。如何高效、准确、并使用尽可能少的服务器资源识别这类图像,是一个非常有价值的业务问题。


技术实现思路

1、本申请的多个方面提供一种图像识别方法、设备及计算机可读存储介质,用以解决目前无法在节省服务器开销的情况下高效、准确的进行图像识别的问题。

2、本申请的一方面,提供一种图像识别方法,所述方法用于在正负样本比例小于预设值场景下识别正样本所对应类别的目标图像,所述方法包括:

3、利用训练的第一模型从总样本中识别出目标样本图像;

4、针对识别出的目标样本图像,利用多网络集成的第二模型进行二次识别,从而识别出目标图像,其中,所述多网络集成的第二模型为至少包含两个不同类型的神经网络的模型。

5、可选的,训练所述第一模型的方法包括:

6、利用训练好的多个第二模型对第一模型进行蒸馏,令第一模型输出的样本分数与第二模型对齐。

7、可选的,所述利用训练好的多个第二模型对第一模型进行蒸馏的步骤包括:

8、利用训练好的多个第二模型采用最大疑似蒸馏法监督训练所述第一模型。

9、可选的,所述利用训练的第一模型从总样本中识别出目标样本图像的步骤包括:

10、将第一模型输出的图像是正样本的概率值大于等于预设阈值的图像识别为目标样本图像。

11、可选的,所述利用多网络集成的第二模型进行二次识别的步骤包括:

12、每个网络的第二模型分别进行二次识别,分别获得二次识别结果;

13、计算所有二次识别结果的平均值;

14、依据所述平均值识别出目标图像。

15、可选的,所述识别出目标图像的步骤包括:

16、将所述平均值与指定阈值比较,若所述平均值大于等于所述指定阈值,则可判断当前图像为目标图像。

17、可选的,所述多网络集成的第二模型与第一模型为级联关系。

18、本申请的另一方面,提供一种图像识别设备,所述设备包括:

19、一级识别单元,用于利用训练的第一模型从总样本中识别出目标样本图像;

20、二级识别单元,用于针对识别出的目标样本图像,利用多网络集成的第二模型进行二次识别,从而识别出目标图像,其中,所述多网络集成的第二模型为至少包含两个不同类型的神经网络的模型。

21、本申请的另一方面,提供一种电子设备,所述设备包括:

22、至少一个处理器;以及

23、与所述至少一个处理器通信连接的存储器;其中,

24、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述图像识别的方法。

25、本申请的另一方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令可被处理器执行以实现所述图像识别方法。

26、本申请实施例提供的方案中,通过第一模型与第二模型的级联框架实现二级分类,利用第一模型识别速度快,资源消耗小的优点从海量样本中进行一级过滤,再利用第二模型识别准确率高的优点对一级过滤结果进行二级过滤,避免了利用第二模型直接针对海量数据进行过滤造成的资源消耗大的问题,针对正负样本比例极不均衡的场景,即提升了图像识别效率,降低了资源消耗,又保证了图像识别的准确率。



技术特征:

1.一种图像识别方法,其中,所述方法用于在正负样本比例小于预设值场景下识别正样本所对应类别的目标图像,所述方法包括:

2.根据权利要求1所述的方法,其中,训练所述第一模型的方法包括:

3.根据权利要求2所述的方法,其中,所述利用训练好的多个第二模型对第一模型进行蒸馏的步骤包括:

4.根据权利要求1所述的方法,其中,所述利用训练的第一模型从总样本中识别出目标样本图像的步骤包括:

5.根据权利要求1所述的方法,其中,所述利用多网络集成的第二模型进行二次识别的步骤包括:

6.根据权利要求1所述的方法,其中,所述识别出目标图像的步骤包括:

7.根据权利要求1所述的方法,其中,所述多网络集成的第二模型与第一模型为级联关系。

8.一种图像识别设备,其中,所述设备包括:

9.一种电子设备,所述电子设备包括:

10.一种计算机可读介质,其上存储有计算机程序指令,所述计算机程序指令可被处理器执行以实现如权利要求1至7中任一项所述的方法。


技术总结
本申请提供图像处理领域一种图像识别方法、设备及计算机可读介质,本申请所述方法用于在正负样本比例小于预设值场景下识别正样本所对应类别的目标图像,所述方法包括:利用训练的第一模型从总样本中识别出目标样本图像;针对识别出的目标样本图像,利用多网络集成的第二模型进行二次识别,从而识别出目标图像,其中,所述多网络集成的第二模型为至少包含两个不同类型的神经网络的模型。本申请既提升了图像识别效率,降低了资源消耗,又保证了图像识别的准确率。

技术研发人员:周健
受保护的技术使用者:上海哔哩哔哩科技有限公司
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1