本发明涉及图像处理,尤其涉及一种商品识别建模方法及装置。
背景技术:
1、目前在快消品消费行业里,商品sku(stock keeping unit,最小存货单位)种类多(存量多,增量也快)、sku分类细(差异小)、sku密集(单张图陈列数目多);同时,热门商品的类型包装更是大同小异,使得商品数据标注难度高、易错标、标注纠错成本大,导致商品数据集质量一般或者较差,从而最终影响识别模型效果。
2、现有的商品sku识别方法,对目标sku进行识别分类的时候,由于竞品等负样本的识别干扰,往往需要花费大量的人力去收集建立sku和各种负样本的训练数据进行标注和学习来确保sku分类器在各种负样本的干扰下保持较好的识别准确率。
技术实现思路
1、本发明提供了一种商品识别建模方法及装置,以解决现有商品识别样本标注工作量大难以保证模型准确率的技术问题。
2、为了解决上述技术问题,本发明实施例提供了一种商品识别建模方法,包括:
3、构建商品图像库,并根据所述商品数据库中各个图像的获取第一数据集;所述第一数据集包括各个sku图像;
4、根据随机算法对所述第一数据集中的sku图像进行掩膜处理,生成第二数据集;
5、根据第一裁剪算法对所述商品图像库中的各个图像进行裁剪,生成第三数据集,所述第三数据集中包括若干尺寸的商品图像;
6、基于深度神经网络构建商品识别模型,并根据所述第二数据集和所述第三数据集迭代训练所述商品识别模型,直至达到预设条件,输出训练好的商品识别模型。
7、本发明根据sku图像和掩膜图像生成负样本和基于预设比例对商品图像生成负样本,从而根据两个不同策略生成负样本训练集,从而对商品识别模型进行训练,提高了sku的识别准确率,同时,由于sku的识别训练完全由端到端进行学习,不用额外的数据处理,避免商品识别样本标注工作量大。
8、进一步的,所述根据所述商品数据库中各个图像的获取第一数据集,具体为:
9、根据各个sku图像的轮廓确定最小外接矩形框,并根据所述最小外接矩形框对所述商品数据库中的各个商品图像进行位置标注;所述各个商品图像包括一个或多个sku图像;
10、根据标注好的商品图像中的位置信息将各个sku图像进行裁剪,生成第一数据集。
11、进一步的,所述根据随机算法对所述第一数据集中的sku图像进行掩膜处理,生成第二数据集,具体为:
12、获取第一数据集,并根据随机算法和预设比例随机抽取所述第一数据集中的sku图像集;
13、根据预设掩膜比例对抽取的sku图像集中的每一个sku图像添加掩膜图像,生成第二数据集。
14、进一步的,所述根据第一裁剪算法对所述商品图像库中的各个图像进行裁剪,生成第三数据集,具体为:
15、预设若干长宽比和裁剪面积,根据预设的长宽比和裁剪面积进行随机组合,生成若干个裁剪框;
16、抽取所述图像数据库中的图像,根据第一裁剪算法和各个裁剪框将图像裁剪成若干个预设尺寸的商品图像,生成第三数据集。
17、进一步的,所述基于深度神经网络构建商品识别模型,并根据所述第二数据集和所述第三数据集迭代训练所述商品识别模型,直至达到预设条件,输出训练好的商品识别模型,具体为:
18、根据深度神经网络构建商品识别模型,根据预训练权重初始化训练参数;
19、根据所述训练参数、第二数据集和第三数据集对所述商品识别模型进行迭代训练,所述训练参数包括训练批次和学习率;
20、在每一次迭代训练中动态调整所述商品识别模型的训练参数,直至所述商品识别模型的准确率达到预设阈值,停止迭代,输出训练好的商品识别模型。
21、第二方面,本发明提供了一种商品识别建模装置,包括:第一数据生成模块、第二数据生成模块、第三数据生成模块和模型训练模块;
22、所述第一数据生成模块,用于构建商品图像库,并根据所述商品数据库中各个图像的获取第一数据集;
23、所述第二数据生成模块,用于根据随机算法对所述第一数据集中的sku图像进行掩膜处理,生成第二数据集;
24、所述第三数据生成模块,用于根据第一裁剪算法对所述商品图像库中的各个图像进行裁剪,生成第三数据集,所述第三数据集中包括若干尺寸的商品图像;
25、所述模型训练模块,用于基于深度神经网络构建商品识别模型,并根据所述第二数据集和所述第三数据集迭代训练所述商品识别模型,直至达到预设条件,输出训练好的商品识别模型。
26、进一步的,所述第一数据生成模块,具体用于:
27、根据各个sku图像的轮廓确定最小外接矩形框,并根据所述最小外接矩形框对所述商品数据库中的各个商品图像进行位置标注;所述各个商品图像包括一个或多个sku图像;
28、根据标注好的商品图像中的位置信息将各个sku图像进行裁剪,生成第一数据集。
29、进一步的,所述第二数据生成模块,具体用于:
30、获取第一数据集,并根据随机算法和预设比例随机抽取所述第一数据集中的sku图像集;
31、根据预设掩膜比例对抽取的sku图像集中的每一个sku图像添加掩膜图像,生成第二数据集。
32、进一步的,所述第三数据生成模块,具体用于:
33、预设若干长宽比和裁剪面积,根据预设的长宽比和裁剪面积进行随机组合,生成若干个裁剪框;
34、抽取所述图像数据库中的图像,根据第一裁剪算法和各个裁剪框将图像裁剪成若干个预设尺寸的商品图像,生成第三数据集。
35、进一步的,所述模型训练模块,具体用于:
36、根据深度神经网络构建商品识别模型,根据预训练权重初始化训练参数;
37、根据所述训练参数、第二数据集和第三数据集对所述商品识别模型进行迭代训练,所述训练参数包括训练批次和学习率;
38、在每一次迭代训练中动态调整所述商品识别模型的训练参数,直至所述商品识别模型的准确率达到预设阈值,停止迭代,输出训练好的商品识别模型。
1.一种商品识别建模方法,其特征在于,包括:
2.如权利要求1所述的商品识别建模方法,其特征在于,所述根据所述商品数据库中各个图像的获取第一数据集,具体为:
3.如权利要求2所述的商品识别建模方法,其特征在于,所述根据随机算法对所述第一数据集中的sku图像进行掩膜处理,生成第二数据集,具体为:
4.如权利要求1所述的商品识别建模方法,其特征在于,所述根据第一裁剪算法对所述商品图像库中的各个图像进行裁剪,生成第三数据集,具体为:
5.如权利要求1所述的商品识别建模方法,其特征在于,所述基于深度神经网络构建商品识别模型,并根据所述第二数据集和所述第三数据集迭代训练所述商品识别模型,直至达到预设条件,输出训练好的商品识别模型,具体为:
6.一种商品识别建模装置,其特征在于,包括:第一数据生成模块、第二数据生成模块、第三数据生成模块和模型训练模块;
7.如权利要求6所述的商品识别建模装置,其特征在于,所述第一数据生成模块,具体用于:
8.如权利要求7所述的商品识别建模装置,其特征在于,所述第二数据生成模块,具体用于:
9.如权利要求6所述的商品识别建模装置,其特征在于,所述第三数据生成模块,具体用于:
10.如权利要求6所述的商品识别建模装置,其特征在于,所述模型训练模块,具体用于: