本发明涉及计算机,尤其涉及一种物品信息的检验方法和装置。
背景技术:
1、在电商领域,在商品发布之前,需要对商品的物品信息进行检验,以确保电商平台中交易的安全性。现有技术中,需要电商平台的管理者人工对电商平台使用者上传的图片和文本内容进行人工审核,判断图片和文本内容是否匹配,以确保将物品信息检验通过的商品进行发布,耗费大量的人力和时间,同时由于无法自动化完成物品信息的检验流程,商品发布效率低。
技术实现思路
1、有鉴于此,本发明实施例提供一种物品信息的检验方法和装置,利用预训练的标签模型以及检验模型,可以实现物品信息的自动化检验过程。其中,标签模型通过主动学习可以尽可能减少人工打标的数量以及时间,提高确定物品标签的效率,检验模型中通过图像识别得到的第一识别结果,可以弥补标签确定模型无法识别的标签,进一步提升检验结果的准确性。
2、为实现上述目的,根据本发明实施例的一个方面,提供了一种物品信息的检验方法。
3、本发明实施例的一种物品信息的检验方法包括:获取待检验的物品信息,所述物品信息包括图片和文本内容;利用预训练的标签模型确定所述图片对应的物品标签;所述标签模型是通过主动学习训练得到的;将所述图片、所述物品标签以及所述文本内容输入预训练的检验模型,对所述图片进行图像识别得到第一识别结果;将所述文本内容分别与所述物品标签以及所述第一识别结果进行对比,根据比对结果确定所述物品信息的检验结果。
4、可选地,所述将所述文本内容分别与所述物品标签以及所述第一识别结果进行对比,根据比对结果确定所述物品信息的检验结果,包括:利用所述检验模型将所述文本内容与所述物品标签以及所述第一识别结果进行比对,如果所述文本内容存在于所述物品标签和/或所述第一识别结果中,则确定所述检验结果为所述文本内容与所述图片匹配,否则确定所述检验结果为所述文本内容与所述图片不匹配。
5、可选地,该方法还包括:针对所述文本内容存在于所述第一识别结果、且不存在于所述物品标签的情况,根据所述第一识别结果对所述标签模型进行优化。
6、可选地,所述物品信息还包括业务场景;所述利用预训练的标签模型确定所述图片对应的物品标签,包括:确定与所述业务场景对应的预训练的目标标签模型;利用所述目标标签模型确定所述图片在所述业务场景下对应的物品标签。
7、可选地,所述检验模型通过半监督学习算法训练得到,包括:获取具备第一物品标签的第一标签样本数据以及不具备第一物品标签的第一空白样本数据;利用预置二分类模型的图像识别层对所述第一标签样本数据中的第一图片以及所述第一空白样本数据中的第二图片进行识别,生成第二识别结果;根据第二识别结果、所述第一标签样本数据和所述第一空白样本数据对所述预置二分类模型进行训练。
8、可选地,所述第一标签样本数据包括第一图片、第一物品标签、第一文本内容、以及所述第一文本内容与所述物品标签和所述第一图片的对应关系;所述第一空白样本数据包括第二图片以及对应的第二文本内容;所述根据第二识别结果、所述第一标签样本数据和所述第一空白样本数据对所述预置二分类模型进行训练,包括:将所述第一物品标签、所述第一文本内容、所述对应关系、第二识别结果以及所述第二文本内容输入所述二分类模型的分类层,以对所述二分类模型进行训练,得到所述检验模型。
9、可选地,所述标签模型是通过主动学习训练得到的,包括重复执行下述步骤:获取不具备第二物品标签的第二空白样本数据;利用查询函数从所述第二空白样本数据中确定出目标样本数据;获取所述目标样本数据的标准打标结果,得到具备第二物品标签的第二标签样本数据;根据所述第二标签样本数据对所述标签模型进行训练。
10、可选地,该方法还包括:确定与所述第二空白样本数据对应的业务场景,并根据所述业务场景确定出对应的预置标签模型;所述预置标签模型包括以下任意一种:朴素贝叶斯模型、决策树模型、最邻近算法模型、支持向量机模型、限行回归分析模型;对所述预置标签模型进行训练得到所述目标标签模型。
11、可选地,该方法还包括:按照预设时间段,获取各个业务场景在运行过程中产生的新的业务数据;将新的业务数据作为所述第二空白样本数据,对所述标签模型进行优化。
12、为实现上述目的,根据本发明实施例的又一方面,提供了一种物品信息的检验装置。
13、本发明实施例的一种物品信息的检验装置包括:获取模块,用于获取待检验的物品信息,所述物品信息包括图片和文本内容;打标模块,用于利用预训练的标签模型确定所述图片对应的物品标签;所述标签模型是通过主动学习训练得到的;识别模块,用于将所述图片、所述物品标签以及所述文本内容输入预训练的检验模型,对所述图片进行图像识别得到第一识别结果;结果模块,用于将所述文本内容分别与所述物品标签以及所述第一识别结果进行比对,根据比对结果确定所述物品信息的检验结果。
14、为实现上述目的,根据本发明实施例的又一方面,提供了一种用于检验物品信息的电子设备。
15、本发明实施例的一种用于检验物品信息的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例的一种物品信息的检验方法。
16、为实现上述目的,根据本发明实施例的再一方面,提供了一种计算机可读存储介质。
17、本发明实施例的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例的一种物品信息的检验方法。
18、上述发明中的一个实施例具有如下优点或有益效果:利用预训练的标签模型以及检验模型,可以实现物品信息的自动化检验过程。其中,标签模型通过主动学习可以尽可能减少人工打标的数量以及时间,提高确定物品标签的效率,检验模型中通过图像识别得到的第一识别结果,可以弥补标签确定模型无法识别的标签,进一步提升检验结果的准确性。
19、上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
1.一种物品信息的检验方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述文本内容分别与所述物品标签以及所述第一识别结果进行比对,根据比对结果确定所述物品信息的检验结果,包括:
3.根据权利要求1所述的方法,其特征在于,还包括:
4.根据权利要求1所述的方法,其特征在于,所述物品信息还包括业务场景;所述利用预训练的标签模型确定所述图片对应的物品标签,包括:
5.根据权利要求1所述的方法,其特征在于,所述检验模型通过半监督学习算法训练得到。
6.根据权利要求5所述的方法,其特征在于,所述检验模型通过半监督学习算法训练得到,包括:
7.根据权利要求6所述的方法,所述第一标签样本数据包括第一图片、第一物品标签、第一文本内容、以及所述第一文本内容与所述物品标签和所述第一图片的对应关系;所述第一空白样本数据包括第二图片以及对应的第二文本内容;所述根据第二识别结果、所述第一标签样本数据和所述第一空白样本数据对所述预置二分类模型进行训练,包括:
8.根据权利要求4所述的方法,其特征在于,所述标签模型是通过主动学习训练得到的,包括重复执行下述步骤:
9.根据权利要求8所述的方法,其特征在于,还包括:
10.根据权利要求8所述的方法,其特征在于,还包括:
11.一种物品信息的检验装置,其特征在于,包括:
12.一种用于检验物品信息的电子设备,其特征在于,包括:
13.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-10中任一所述的方法。