本申请涉及人工智能,尤其涉及一种商品标注方法及装置。
背景技术:
1、得益于算力、数据的爆炸式增长,基于深度学习的ai技术得以迅速发展,并在诸多行业领域落地。比如,目标检测、识别以及分类等ai视觉技术在许多场景的应用表现优越。
2、在深度神经网络的模型训练中需要大量的高质量标注数据,数据的质量和规模是影响算法模型性能的关键因素。实践经验表明,标注数据的数据量越大、质量越高、对模型训练的效果越有帮助。
3、目前,在常规的人工标注流程中,标注人员需要将待标注图片与所有类别的样例图进行逐一的视觉比对。当标注类别数到达万级别,待标注图片百万级别时,人工比对工作量繁重,且耗时巨大,使得标注效率低下。
技术实现思路
1、有鉴于此,本申请实施例提供了一种商品标注方法及装置,旨在降低人工标注的复杂度,使得数据标注质量提高,进而提升商品标注效率。
2、第一方面,本申请提供了一种商品标注方法,所述方法包括:
3、获取待标注商品的图像信息;
4、利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;
5、计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图;
6、基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
7、可选地,所述图像特征提取模型的训练过程如下:
8、获取训练集,所述训练集包括已标注的商品样本集;
9、利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
10、可选地,所述计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
11、利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;
12、根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
13、可选地,所述根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
14、根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
15、基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
16、可选地,在所述对所述待标注商品进行标注之后,所述方法还包括:
17、将标注后的商品加入所述预设商品类别样本集中。
18、第二方面,本申请提供了一种商品标注方法装置,所述装置包括:
19、获取模块,用于获取待标注商品的图像信息;
20、特征提取模块,用于利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;
21、计算模块,用于计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图;
22、标注模块,用于基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。
23、可选地,所述图像特征提取模型的训练过程如下:
24、获取训练集,所述训练集包括已标注的商品样本集;
25、利用所述训练集,对所述图像特征提取模型进行训练,所述图像特征提取模型用于提取商品样本特征。
26、可选地,所述计算模块包括:
27、第一计算子模块,用于利用相似度距离公式,计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度;
28、第二计算子模块,用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
29、可选地,所述第二计算子模块,具体用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
30、基于所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果。
31、可选地,在所述对所述待标注商品进行标注之后,所述装置还包括:
32、加入模块,用于将标注后的商品加入所述预设商品类别样本集中。
33、上述技术方案具有如下有益效果:
34、本申请提供了一种商品标注方法及装置。在执行所述方法时,先获取待标注商品的图像信息,接着利用预先训练的图像特征提取模型,对所述图像信息进行特征提取,得到所述图像信息对应的图像特征向量;然后计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果;其中,所述预设商品类别样本集包括多个商品样本,每个商品样本对应的商品类别,以及每个商品样本对应的样例图,最后基于所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以使得标注人员根据所述预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,对所述待标注商品进行标注。这样一来,本申请在标注过程中,引入预先训练的图像提取模型提取待标注图片的特征,并与预设商品类别样本集中每个商品样本进行相似度匹配计算,选择满足预设筛选条件的商品类别作为所述待标注商品的预测类别集合,以便于标注人员根据预测类别集合中每个类别集合的商品样本与所述待标注商品的相似度,确定出待标注图的真实类别后,对待标注商品进行标注,降低人工标注的复杂度,使得数据标注质量提高,进而提升商品标注效率。
1.一种商品标注方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述图像特征提取模型的训练过程如下:
3.根据权利要求1所述的方法,其特征在于,所述计算所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,得到所述图像特征向量与预设商品类别样本集中每个类别的相似度结果,包括:
5.根据权利要求1所述的方法,其特征在于,在所述对所述待标注商品进行标注之后,所述方法还包括:
6.一种商品标注方法装置,其特征在于,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述图像特征提取模型的训练过程如下:
8.根据权利要求6所述的装置,其特征在于,所述计算模块包括:
9.根据权利要求8所述的装置,其特征在于,所述第二计算子模块,具体用于根据所述图像特征向量与预设商品类别样本集中每个商品样本的相似度,确定所述图像特征向量与预设商品类别样本集中每个类别的相似度平均值;
10.根据权利要求6所述的装置,其特征在于,在所述对所述待标注商品进行标注之后,所述装置还包括: