确定商品匹配信息的方法、系统、电子设备及存储介质与流程

文档序号:22390685发布日期:2020-09-29 17:55阅读:来源:国知局

技术特征:

1.一种确定商品匹配信息的方法,其特征在于,每个所述商品包括销售属性和商品标题,待匹配的两个所述商品分别为第一商品和第二商品,所述第一商品属于第一类商品,所述第二商品属于第二类商品,所述方法包括以下步骤:

构建第一模型,使用第一历史数据和第二历史数据生成训练数据集,使用所述训练数据集对所述第一模型进行训练;

其中,所述第一历史数据为所述第一类商品的包括销售属性和商品标题的历史数据,所述第二历史数据为所述第二类商品的包括销售属性和商品标题的历史数据;

基于所述第一模型使用所述第一商品的销售属性和商品标题与所述第二商品的销售属性和商品标题交叉匹配计算得到所述第一商品和所述第二商品构成的商品对所对应的销售属性的特征向量;

基于排序模型使用所述销售属性的特征向量计算所述第一商品和所述第二商品的匹配度。

2.如权利要求1所述的确定商品匹配信息的方法,其特征在于,

所述训练数据集包括若干条训练数据,每条所述训练数据包括n个特征,n为大于等于2的整数;

构建的所述第一模型为

其中,i为取值1至n的整数变量;

xi表示第i个特征;

ai表示xi对应的第一权重参数;

bi表示xi对应的第二权重参数;

wi表示xi对应的第一系数;

所述使用所述训练数据集对所述第一模型进行训练的步骤包括以下步骤:

利用所述训练数据集确定所述第一模型中的所述第一权重参数ai、所述第二权重参数bi和所述第一系数wi。

3.如权利要求2所述的确定商品匹配信息的方法,其特征在于,

所述第一历史数据的数量为p条,p为大于1的自然数;

所述第二历史数据的数量为q条,q为大于1的自然数;

所述使用所述第一历史数据和所述第二历史数据生成训练数据集的步骤包括以下步骤:

将p条所述第一历史数据与q条所述第二历史数据两两组合生成p*q组历史商品对,对每对所述历史商品对进行标注以得到对应的标签,所述标签包括匹配和不匹配;

将每对所述历史商品对中的所述第一历史数据对应的销售属性和所述第二历史数据对应的销售属性分别拆分出汉字、字母和数字三个特征维度,其中缺失的所述特征维度置空;

计算每对所述历史商品对中的所述第一历史数据对应的销售属性的所述汉字、所述字母、所述数字分别与所述第二历史数据对应的标题的雅克比相似度,以得到所述历史商品对对应的第一特征x1、第二特征x2和第三特征x3,计算每对所述历史商品对中的所述第二历史数据对应的销售属性的所述汉字、所述字母、所述数字分别与所述第一历史数据对应的标题的雅克比相似度,以得到所述历史商品对对应的第四特征x4、第五特征x5和第六特征x6;

将每对所述历史商品对的所述第一特征x1、所述第二特征x2、所述第三特征x3、所述第四特征x4、所述第五特征x5、所述第六特征x6以及对应的所述标签生成历史商品序列;

其中,p*q条所述历史商品序列组成所述训练数据集;所述训练数据集中置空的所述特征维度对应的xi不填充。

4.如权利要求3所述的确定商品匹配信息的方法,其特征在于,所述利用所述训练数据集确定所述第一模型中的所述第一权重参数ai、所述第二权重参数bi和所述第一系数wi的步骤中确定所述第一权重参数ai、所述第二权重参数bi包括以下步骤:

通过梯度下降法利用所述训练数据集分别求解单个特征xi对应的所述第一权重参数ai、所述第二权重参数bi;

其中所述梯度下降法使用的损失函数loss为:

其中,yi表示所述标签,取值为-1时表示不匹配,取值为1时表示匹配;m表示所述训练数据集的数量;x′是二维向量。

5.如权利要求3所述的确定商品匹配信息的方法,其特征在于,所述利用所述训练数据集确定所述第一模型中的所述第一权重参数ai、所述第二权重参数bi和所述第一系数wi的步骤中确定所述第一系数wi包括以下步骤:

测试所述第一系数wi对应的xi的分类准确率pi;

使用softmax计算所述第一系数wi,计算公式为:

6.如权利要求3所述的确定商品匹配信息的方法,其特征在于,

所述基于所述第一模型使用所述第一商品的销售属性和商品标题与所述第二商品的销售属性和商品标题交叉匹配计算得到所述第一商品和所述第二商品构成的商品对所对应的销售属性的特征向量的步骤包括以下步骤:

将所述第一商品对应的销售属性和所述第二商品对应的销售属性分别拆分出汉字、字母和数字三个特征维度,其中缺失的所述特征维度置空;

分别计算所述第一商品对应的销售属性的所述汉字、所述字母、所述数字分别与所述第二商品对应的标题的雅克比相似度,以得到所述第一商品与所述第二商品组成的商品对对应的第一特征x1、第二特征x2和第三特征x3,分别计算所述第二商品对应的销售属性的所述汉字、所述字母、所述数字分别与所述第一商品对应的标题的雅克比相似度,以得到所述第一商品与所述第二商品组成的商品对对应的第四特征x4、第五特征x5和第六特征x6;

使用witanh(ai·xi+bi)分别对所述第一商品与所述第二商品组成的商品对的特征xi进行特征变换以得到所述第一商品和所述第二商品构成的商品对所对应的销售属性的特征向量中的特征,其中置空的所述特征维度对应的所述第一商品和所述第二商品构成的商品对所对应的销售属性的特征向量中的特征置0。

7.如权利要求1-6任一项所述的确定商品匹配信息的方法,其特征在于,

所述基于排序模型使用所述销售属性的特征向量计算所述第一商品和所述第二商品的匹配度的步骤中还使用以下特征向量中的至少一个计算所述第一商品和所述第二商品的匹配度:所述商品的标题句向量的余弦相似度、所述商品的品牌词、所述商品的产品词、所述商品的规格以及所述商品的价格。

8.一种确定商品匹配信息的系统,其特征在于,每个所述商品包括销售属性和商品标题,待匹配的两个所述商品分别为第一商品和第二商品,所述第一商品属于第一类商品,所述第二商品属于第二类商品,所述系统包括:

模型生成模块,用于构建第一模型,使用第一历史数据和第二历史数据生成训练数据集,使用所述训练数据集对所述第一模型进行训练;

其中,所述第一历史数据为所述第一类商品的包括销售属性和商品标题的历史数据,所述第二历史数据为所述第二类商品的包括销售属性和商品标题的历史数据;

特征向量计算模块,用于基于所述第一模型使用所述第一商品的销售属性和商品标题与所述第二商品的销售属性和商品标题交叉匹配计算得到所述第一商品和所述第二商品构成的商品对所对应的销售属性的特征向量;

匹配度计算模块,用于基于排序模型使用所述销售属性的特征向量计算所述第一商品和所述第二商品的匹配度。

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述的确定商品匹配信息的方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述的确定商品匹配信息的方法的步骤。


技术总结
本发明公开了确定商品匹配信息的方法、系统、电子设备及存储介质,每个商品包括销售属性和商品标题,待匹配的两个商品分别为第一商品和第二商品,第一商品属于第一类商品,第二商品属于第二类商品,方法包括以下步骤:构建第一模型,使用第一历史数据和第二历史数据生成训练数据集,使用所述训练数据集对所述第一模型进行训练;基于第一模型使用第一商品的销售属性和商品标题与第二商品的销售属性和商品标题交叉匹配计算得到第一商品和第二商品构成的商品对所对应的销售属性的特征向量;基于排序模型使用销售属性的特征向量计算第一商品和第二商品的匹配度。本发明通过在商品匹配过程中引入销售属性这一特征,使得商品匹配的召回率显著提升。

技术研发人员:安旭;贾宝玉
受保护的技术使用者:北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
技术研发日:2019.03.19
技术公布日:2020.09.29
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1