本申请实施例涉及计算机,尤其涉及一种类别识别方法、装置、设备、存储介质及程序产品。
背景技术:
1、目前,应用于大规模的图像审核技术上的视觉识别系统,主流的实现方式是基于深度学习的方法。该方法需要积累较大的数据量才能保证模型有较好的泛化能力和实际应用价值。其要求从大量的数据中获取所关注的正样本,此类正样本在应用到大规模的审核数据上时往往需要数十万或者数万的累积量,在一些训练数据中未曾明确定义的类别识别上,相关技术中,通过人工收集更多所关注这一类的数据缓解数据不足,同时进一步训练一个单独的视觉识别模型,通过该种方式实现对新类别的有效识别。
2、上述方案中,采用重新训练识别模型的方式,需要投入大量的人力成本和时间成本,如耗费大量的标注时间成本,特别是在关注的正样本占比极小(如不到百万分之一)的情况下,需要获得足够多数量的正样本需要标注数百万甚至数千万的数据,在实际应用中时间和人力成本十分高昂,需要改进。
技术实现思路
1、本申请实施例提供了一种类别识别方法、装置、设备、存储介质及程序产品,能够极大的节省时间成本和人力成本,提高了类别识别效率。
2、第一方面,本申请实施例提供了一种类别识别方法,该方法包括:
3、获取图片样本集和文本样本集,所述图片样本集中的图片样本与所述文本样本集中的文本样本具有不同的关联关系;
4、基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练;
5、将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到所述类别信息在所述待识别图片中的匹配图片。
6、第二方面,本申请实施例还提供了一种类别识别装置,包括:
7、获取模块,配置为获取图片样本集和文本样本集,所述图片样本集中的图片样本与所述文本样本集中的文本样本具有不同的关联关系;
8、训练模块,配置为基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练;
9、识别模块,配置为将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到所述类别信息在所述待识别图片中的匹配图片。
10、第三方面,本申请实施例还提供了一种类别识别设备,该设备包括:
11、一个或多个处理器;
12、存储装置,用于存储一个或多个程序,
13、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本申请实施例所述的类别识别方法。
14、第四方面,本申请实施例还提供了一种存储计算机可执行指令的非易失性存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行本申请实施例所述的类别识别方法。
15、第五方面,本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序存储在计算机可读存储介质中,设备的至少一个处理器从计算机可读存储介质读取并执行计算机程序,使得设备执行本申请实施例所述的类别识别方法。
16、本申请实施例中,通过获取图片样本集和文本样本集,其中,图片样本集中的图片样本与文本样本集中的文本样本具有不同的关联关系,基于图片样本集以及文本样本集对设置的识别模型进行训练,将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到类别信息在待识别图片中的匹配图片。上述的类别识别方式中,利用基于图片和文本的训练数据训练得到的识别模型确定出和设置的类别方式对应的匹配图片,无需针对具体的类别进行单独的模型训练,同时本方案对识别模型的训练过程中,无需进行样本的标注,能够节省大量的时间和人力成本,且模型的识别准确度高,其更加贴近使用场景,通用性更强。
1.类别识别方法,其特征在于,包括:
2.根据权利要求1所述的类别识别方法,其特征在于,在所述获取图片样本集和文本样本集之前,还包括:
3.根据权利要求1所述的类别识别方法,其特征在于,所述基于所述图片样本集以及所述文本样本集对设置的识别模型进行训练,包括:
4.根据权利要求3所述的类别识别方法,其特征在于,所述标准图片包括预设大小的张量矩阵,所述标准文本包括预设维度的矩阵。
5.根据权利要求3所述的类别识别方法,其特征在于,所述计算所述图片向量与所述文本向量的相似度,并基于所述图片样本与所述文本样本的关联关系对所述图片编码网络和所述文本编码网络进行训练得到训练完成的识别模型,包括:
6.根据权利要求3所述的类别识别方法,其特征在于,所述图片编码网络和所述文本编码网络包括自注意力模块、残差神经网络模块以及前向网络模块。
7.根据权利要求1-6中任一项所述的类别识别方法,其特征在于,所述将待识别图片以及设置的类别信息输入至训练完成的识别模型,以得到所述类别信息在所述待识别图片中的匹配图片,包括:
8.类别识别装置,其特征在于,包括:
9.一种类别识别设备,所述设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现权利要求1-7中任一项所述的类别识别方法。
10.一种存储计算机可执行指令的非易失性存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行权利要求1-7中任一项所述的类别识别方法。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的类别识别方法。