本技术涉及电子商务,具体而言,涉及一种商品异常出价识别方法、装置、设备及存储介质。
背景技术:
1、在电商平台中,商家和用户可以对商品进行出价,但由于商品价格受外部影响会出现较大的波动,当商品价格波动异常,不符合主流价格区间时,就会出现商品价格混乱的现象,导致正常的交易秩序被扰乱。因此,需要对商品进行出价识别,以保证商品出价在合理范围内。
2、目前针对商品的出价识别主要是采用时间序列或者采用机器学习等方法进行价格区间的预测,并根据预测的价格区间进行出价识别。
3、但是,现有技术的方法存在预测结果不准确的问题,进而导致出价识别结果不准确。
技术实现思路
1、本技术的目的在于,针对上述现有技术中的不足,提供一种商品异常出价识别方法、装置、设备及存储介质,以解决现有技术中出价识别结果不准确的问题。
2、为实现上述目的,本技术采用的技术方案如下:
3、第一方面,本技术提供了一种商品异常出价识别方法,所述方法包括:
4、获取目标商品的实时特征,并根据社区动态信息创建图片特征集合和文本向量集合,所述实时特征用于表征所述目标商品的交易信息,所述社区动态信息用于记录多个商品的图片和文本信息,所述图片特征集合中包括多个图片特征,所述文本向量集合中包括多个文本向量;
5、从出价日志中提取目标商品的图片特征信息,并根据所述图片特征信息和所述图片特征集合确定所述目标商品的图片相似度特征序列和图片趋势特征序列,所述出价日志用于记录所述目标商品的出价信息,所述图片相似度特征序列中包括多个依次排列的数量,每个数量分别表示预设时间区间内每个时间段上与所述图片特征信息相似的图片特征的数量,所述图片趋势特征序列中包括多个依次排列的趋势特征,每个趋势特征用于表征所述预设时间区间内每个时间段相对于上一时间段的相似图片特征数量的变化信息;
6、从所述出价日志中提取所述目标商品的标题向量,并根据所述标题向量和所述文本向量集合确定所述目标商品的文本相似度特征序列和标题趋势特征序列;
7、将所述图片相似度特征序列、图片趋势特征序列、文本相似度特征序列、标题趋势特征序列以及所述目标商品的实时特征输入预先训练得到的出价识别模型中,得到所述出价日志中所述目标商品的出价识别结果。
8、可选的,所述根据所述图片特征信息和所述图片特征集合确定所述目标商品的图片相似度特征序列和图片趋势特征序列,包括:
9、确定所述图片特征信息和所述图片特征集合中各图片特征的相似度,得到所述图片特征集合中各图片特征与所述图片特征信息的图片相似度;
10、基于预设的图片相似度阈值以及各图片特征与所述图片特征信息的图片相似度,确定所述图片相似度特征序列和图片趋势特征序列。
11、可选的,所述基于预设的图片相似度阈值以及各图片特征与所述图片特征信息的图片相似度,确定所述图片相似度特征序列和图片趋势特征序列,包括:
12、根据所述相似度阈值以及各图片特征与所述图片特征信息的图片相似度,对所述图片特征集合中的图片特征进行筛选,得到多个目标图片特征;
13、根据目标图片特征的数量、每个目标图片特征对应的时间以及所述预设时间区间,得到所述图片相似度特征序列;
14、对所述图片相似度特征序列进行趋势计算,得到所述图片趋势特征序列。
15、可选的,所述根据所述标题向量和所述文本向量集合确定所述目标商品的文本相似度特征序列和标题趋势特征序列,包括:
16、确定所述标题向量和所述文本向量集合中各文本向量的相似度,得到所述文本向量集合中各文本向量与所述标题向量的文本相似度;
17、基于预设的文本相似度阈值以及各文本向量与所述标题向量的文本相似度,确定所述文本相似度特征序列和标题趋势特征序列。
18、可选的,所述确定所述标题向量和所述文本向量集合中各文本向量的相似度,得到所述文本向量集合中各文本向量与所述标题向量的文本相似度,包括:
19、确定所述标题向量中第一词汇的词向量和第一文本向量中各词汇的词向量的相似度,并确定所述第一文本向量中各词向量的最大相似度,将所述最大相似度作为所述第一词汇和所述第一文本向量的相似度,所述第一词汇为所述标题向量中的任一词汇,所述第一文本向量为所述文本向量集合中的任一文本向量;
20、将所述标题向量中各词汇和所述第一文本向量的相似度的平均值作为所述标题向量和所述第一文本向量的相似度。
21、可选的,所述得到所述目标商品的出价识别结果之后,包括:
22、根据所述目标商品的出价识别结果对所述目标商品的出价进行拦截或输出。
23、可选的,所述将所述图片相似度特征序列、图片趋势特征序列、文本相似度特征序列、标题趋势特征序列以及所述目标商品的实时特征输入预先训练得到的价格识别模型中,得到所述目标商品的出价识别结果之前,包括:
24、获取样本目标商品的样本实时特征,并根据样本出价日志创建样本图片特征集合和样本文本向量集合,所述样本出价日志中包括:预设的样本出价标签;
25、从样本出价日志中提取样本目标商品的样本图片特征信息,并根据所述样本图片特征信息和所述样本图片特征集合确定所述样本目标商品的样本图片相似度特征序列和样本图片趋势特征序列;
26、从样本出价日志中提取所述样本目标商品的样本标题向量,并根据所述样本标题向量和所述样本文本向量集合确定所述样本目标商品的样本文本相似度特征序列和样本标题趋势特征序列;
27、根据所述样本图片相似度特征序列、样本图片趋势特征序列、样本文本相似度特征序列、样本标题趋势特征序列以及所述样本目标商品的样本实时特征采用多分类树进行价格二分类模型训练,得到所述价格识别模型。
28、第二方面,本技术提供了一种商品异常出价识别装置,所述装置包括:
29、获取模块,用于获取目标商品的实时特征,并根据社区动态信息创建图片特征集合和文本向量集合,所述实时特征用于表征所述目标商品的交易信息,所述社区动态信息用于记录多个商品的图片和文本信息,所述图片特征集合中包括多个图片特征,所述文本向量集合中包括多个文本向量;
30、图片提取模块,用于从出价日志中提取目标商品的图片特征信息,并根据所述图片特征信息和所述图片特征集合确定所述目标商品的图片相似度特征序列和图片趋势特征序列,所述出价日志用于记录所述目标商品的出价信息,所述图片相似度特征序列中包括多个依次排列的数量,每个数量分别表示预设时间区间内每个时间段上与所述图片特征信息相似的图片特征的数量,所述图片趋势特征序列中包括多个依次排列的趋势特征,每个趋势特征用于表征所述预设时间区间内每个时间段相对于上一时间段的相似图片特征数量的变化信息;
31、文本提取模块,用于从所述出价日志中提取所述目标商品的标题向量,并根据所述标题向量和所述文本向量集合确定所述目标商品的文本相似度特征序列和标题趋势特征序列;
32、识别模块,用于将所述图片相似度特征序列、图片趋势特征序列、文本相似度特征序列、标题趋势特征序列以及所述目标商品的实时特征输入预先训练得到的出价识别模型中,得到所述出价日志中所述目标商品的出价识别结果。
33、可选的,所述图片提取模块具体用于:
34、确定所述图片特征信息和所述图片特征集合中各图片特征的相似度,得到所述图片特征集合中各图片特征与所述图片特征信息的图片相似度;
35、基于预设的图片相似度阈值以及各图片特征与所述图片特征信息的图片相似度,确定所述图片相似度特征序列和图片趋势特征序列。
36、可选的,所述图片提取模块还具体用于:
37、根据所述相似度阈值以及各图片特征与所述图片特征信息的图片相似度,对所述图片特征集合中的图片特征进行筛选,得到多个目标图片特征;
38、根据目标图片特征的数量、每个目标图片特征对应的时间以及所述预设时间区间,得到所述图片相似度特征序列;
39、对所述图片相似度特征序列进行趋势计算,得到所述图片趋势特征序列。
40、可选的,所述文本提取模块具体用于:
41、确定所述标题向量和所述文本向量集合中各文本向量的相似度,得到所述文本向量集合中各文本向量与所述标题向量的文本相似度;
42、基于预设的文本相似度阈值以及各文本向量与所述标题向量的文本相似度,确定所述文本相似度特征序列和标题趋势特征序列。
43、可选的,所述文本提取模块还具体用于:
44、确定所述标题向量中第一词汇的词向量和第一文本向量中各词汇的词向量的相似度,并确定所述第一文本向量中各词向量的最大相似度,将所述最大相似度作为所述第一词汇和所述第一文本向量的相似度,所述第一词汇为所述标题向量中的任一词汇,所述第一文本向量为所述文本向量集合中的任一文本向量;
45、将所述标题向量中各词汇和所述第一文本向量的相似度的平均值作为所述标题向量和所述第一文本向量的相似度。
46、第三方面,本技术提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如上述第一方面所述方法的步骤。
47、第四方面,本技术提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如上述第一方面所述方法的步骤。
48、本技术的有益效果是:通过结合图片相似度特征序列、图片趋势特征序列、文本相似度特征序列、标题趋势特征序列以及目标商品的实时特征进行商品出价识别,可以更加准确的确定近期一段时间内目标商品的热度趋势,考虑到了商品热度趋势这一外部因素对于商品价格的影响,实现了将多模态的图文、结构化数据构造的时序特征引入出价异常判断,因而提高了对商品异常出价识别的精确度,并且避免了单独通过商品的时序价格进行价格预测造成的准确性低的问题。