选品方法和装置以及计算机可读存储介质与流程

文档序号:16212651发布日期:2018-12-08 07:56阅读:120来源:国知局
选品方法和装置以及计算机可读存储介质与流程

本发明涉及数据处理领域,特别涉及一种选品方法和装置以及计算机可读存储介质。

背景技术

随着消费者需求的多样化,电商正在从纯线上销售转为线上线下融合,逐步成为一种日渐主流的电商形态。线下门店的商品来源主要通过线上平台供货,需要从海量商品中选择特定商品。

目前线下店的商品主要采取的是采销人员的人工选品方式,即一般是通过采销人员的业务经验,进行供应商遴选、商品审核等等,以对平台上的商品各方面进行考察,从中选择参与适合门店定位和对应品类的商品。



技术实现要素:

发明人经过分析后发现,由于当前大型电商平台上的库存量单元(stockkeepingunit,简称:sku)数量多以百万计,因此人工选品方式的工作量是巨大的。此外,由于人工选品存在主观偏差,没有综合评判指标,导致人工选品方式失误概率较高,进而导致销售表现不好。

本发明实施例所要解决的一个技术问题是:如何提高线下店铺选品的效率和准确率。

根据本发明一些实施例的第一个方面,提供一种选品方法,包括:根据备选商品的线上商品数据、与待选品店铺的线下距离小于预设值的线上用户的用户行为数据确定备选商品的特征值;将备选商品的特征值输入分类模型,其中,分类模型是以训练样本数据的特征值作为输入、销量信息作为标记值训练的;根据分类模型的分类结果确定是否为待选品店铺选择备选商品。

在一些实施例中,选品方法还包括:获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;采用训练样本数据的特征值作为输入、相应的销量信息作为标记值对分类模型进行训练。

在一些实施例中,分类模型为分类决策树,分类决策树中的分类结点为商品的特征,叶子结点表示分类结果。

在一些实施例中,选品方法还包括:获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;对分类模型进行训练,包括:根据待添加结点位置所对应的训练样本数据,计算未添加到分类决策树中的特征的信息增益;将信息增益最大的特征添加到待添加结点位置,作为分类结点;重复以上计算信息增益、添加特征的步骤,直到所有特征都添加到分类决策树中。

在一些实施例中,选品方法还包括:获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;对分类模型进行训练,包括:根据待添加结点位置所对应的训练样本数据,计算未添加到分类决策树中的特征的信息增益;在每个未添加到分类决策树中的特征的信息增益均小于预设的信息增益阈值的情况下,向待添加结点位置添加表示分类结果的叶子结点,其中,分类结果根据待添加结点位置对应的标记值确定;在未添加到分类决策树中的特征的信息增益没有均小于预设的信息增益阈值的情况下,将信息增益最大的特征添加到待添加结点位置,作为分类结点;重复以上计算信息增益、添加特征的步骤,直到所有特征都添加到分类决策树中。

在一些实施例中,选品方法还包括:将测试商品的特征值输入到分类决策树中;根据分类决策树的分类结果与测试商品的标记值确定分类决策树的预测准确率;响应于预测准确率低于预设的准确率阈值,执行以下至少一种操作后重新训练分类决策树:修改信息增益阈值;更新特征;更新训练样本数据。

在一些实施例中,选品方法还包括:获取多个训练样本数据子集,其中,每个训练样本数据子集对应的商品属于同一类别;分别采用每个训练样本数据子集训练分类模型,获得多个子分类模型;根据每个子分类模型的预测准确率,确定每个子分类模型的权重,以便根据每个子分类模型的分类结果的加权计算结果确定是否为待选品店铺选择备选商品。

在一些实施例中,选品方法还包括执行以下至少一种特征筛选方法:筛除相关性大于预设值的不同特征中的一个特征;筛除与销量信息的相关性小于预设值的特征。

在一些实施例中,线上商品数据包括以下至少一种:线上购买特征、线上浏览特征、线上搜索特征、线上添加购物车特征、线上品牌销量特征、线上评价特征、线上基础属性特征、线下预设范围内用户的线上购买特征;用户行为数据包括以下至少一种:用户位置特征、用户购买特征、用户浏览特征、用户搜索特征、用户添加购物车特征、用户购买品牌特征、用户基础属性特征。

根据本发明一些实施例的第二个方面,提供一种选品装置,包括:备选商品特征值确定模块,被配置为根据备选商品的线上商品数据、与待选品店铺的线下距离小于预设值的线上用户的用户行为数据确定备选商品的特征值;备选商品特征值输入模块,被配置为将备选商品的特征值输入分类模型,其中,分类模型是以训练样本数据的特征值作为输入、销量信息作为标记值训练的;选品确定模块,被配置为根据分类模型的分类结果确定是否为待选品店铺选择备选商品。

在一些实施例中,选品装置还包括:分类模型训练模块,被配置为获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;采用训练样本数据的特征值作为输入、相应的销量信息作为标记值对分类模型进行训练。

在一些实施例中,分类模型为分类决策树,分类决策树中的分类结点为商品的特征,叶子结点表示分类结果。

在一些实施例中,选品装置还包括:分类决策树训练模块,被配置为获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;对分类模型进行训练,包括:根据待添加结点位置所对应的训练样本数据、计算未添加到分类决策树中的特征的信息增益,将信息增益最大的特征添加到待添加结点位置、作为分类结点,重复以上计算信息增益、添加特征的步骤直到所有特征都添加到分类决策树中。

在一些实施例中,选品装置还包括:分类决策树训练模块,被配置为获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;对分类模型进行训练,包括:根据待添加结点位置所对应的训练样本数据、计算未添加到分类决策树中的特征的信息增益,在每个未添加到分类决策树中的特征的信息增益均小于预设的信息增益阈值的情况下、向待添加结点位置添加表示分类结果的叶子结点,在未添加到分类决策树中的特征的信息增益没有均小于预设的信息增益阈值的情况下、将信息增益最大的特征添加到待添加结点位置作为分类结点,重复以上计算信息增益、添加特征的步骤直到所有特征都添加到分类决策树中;其中,分类结果根据待添加结点位置对应的标记值确定。

在一些实施例中,选品装置还包括:分类模型测试调整模块,被配置为将测试商品的特征值输入到分类决策树中;根据分类决策树的分类结果与测试商品的标记值确定分类决策树的预测准确率;响应于预测准确率低于预设的准确率阈值,执行以下至少一种操作后重新训练分类决策树:修改信息增益阈值;更新特征;更新训练样本数据。

在一些实施例中,选品装置还包括:多模型训练模块,被配置为获取多个训练样本数据子集,其中,每个训练样本数据子集对应的商品属于同一类别;分别采用每个训练样本数据子集训练分类模型,获得多个子分类模型;根据每个子分类模型的预测准确率,确定每个子分类模型的权重,以便根据每个子分类模型的分类结果的加权计算结果确定是否为待选品店铺选择备选商品。

在一些实施例中,选品装置还包括:特征筛选模块,被配置为执行以下至少一种特征筛选方法:筛除相关性大于预设值的不同特征中的一个特征;筛除与销量信息的相关性小于预设值的特征。

在一些实施例中,线上商品数据包括以下至少一种:线上购买特征、线上浏览特征、线上搜索特征、线上添加购物车特征、线上品牌销量特征、线上评价特征、线上基础属性特征、线下预设范围内用户的线上购买特征;用户行为数据包括以下至少一种:用户位置特征、用户购买特征、用户浏览特征、用户搜索特征、用户添加购物车特征、用户购买品牌特征、用户基础属性特征。

根据本发明一些实施例的第三个方面,提供一种选品装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器中的指令,执行前述任意一种选品方法。

根据本发明一些实施例的第四个方面,提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种选品方法。

上述发明中的一些实施例具有如下优点或有益效果:本发明的实施例可以通过线上商品数据以及线下待选品店铺周围的用户的数据确定备选商品的特征值,并采用预先训练的分类模型对备选商品进行分类、以确定是否为待选品店铺选择该备选商品,从而可以从海量线上商品中快速地确定线下店铺需要采销的商品,提高了选品效率和准确率。

通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为根据本发明一些实施例的选品方法的示例性流程图。

图2a和2b为根据本发明一些实施例的特征筛选方法的示例性流程图。

图3为根据本发明一些实施例的分类模型训练方法的示例性流程图。

图4为本发明一些实施例中的分类决策树示意图。

图5a和5b为根据本发明一些实施例的分类决策树训练方法的示例性流程图。

图6为根据本发明另一些实施例的分类决策树训练方法的示例性流程图。

图7为根据本发明一些实施例的分类模型调整方法的示例性流程图。

图8为根据本发明一些实施例的选品装置的示例性结构图。

图9为根据本发明另一些实施例的选品装置的示例性结构图。

图10为根据本发明又一些实施例的选品装置的示例性结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。

同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。

应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。

图1为根据本发明一些实施例的选品方法的示例性流程图。如图1所示,该实施例的选品方法包括步骤s102~s106。

在步骤s102中,根据备选商品的线上商品数据、与待选品店铺的线下距离小于预设值的线上用户的用户行为数据确定备选商品的特征值。待选品店铺为待选择商品的线下店铺。

线上商品数据包括商品的销售数据、流量数据、售后服务数据、供应链数据、线上用户的用户画像数据等等。用户行为数据是线下店铺周围的、与线上用户匹配的人群信息,可以通过在用户进行线上操作时采集用户的线下操作位置获得这些人群的标识。

线下店铺周围的用户可以定义为在与待选品店铺的线下距离小于预设值的覆盖范围内,在预设时间内的预设操作的次数达到预设值的用户。例如,在最近3个月内,在待选品周围3公里的范围内下单次数超过5次、浏览网站或使用应用次数超过20次的用户可以被定义为线下店铺周围的用户。

在步骤s104中,将备选商品的特征值输入分类模型,其中,分类模型是以训练样本数据的特征值作为输入、销量信息作为标记值训练的。分类模型的分类结果包括为待选品店铺选择备选商品以及不为待选品店铺选择备选商品。

在训练阶段和预测阶段所使用的特征是一致的,特征值根据每个商品的情况确定。在选择特征时,可以对线上商品数据和用户行为数据中的特征进行特征融合以获得进行训练和预测时所使用的特征,从而特征同时具有了线上和线下的属性,可以更好地为线下店铺选择线上商品。

在步骤s106中,根据分类模型的分类结果确定是否为待选品店铺选择备选商品。

通过上述实施例的方法,可以通过线上商品数据以及线下待选品店铺周围的用户的数据确定备选商品的特征值,并采用预先训练的分类模型对备选商品进行分类、以确定是否为待选品店铺选择该备选商品,从而可以从海量线上商品中快速地确定线下店铺需要采销的商品,提高了选品效率和准确率。

在一些实施例中,线上商品数据、用户行为数据的具体内容可以参考表1。本领域技术可以根据需要选择下表中的一个或多个小类数据,或者也可以选择表1之外的其他数据。

表1

在获得线上商品数据和用户行为数据中的特征后,可以根据商品标识将不同的特征进行融合处理。整合后的特征的一个示例可以如表2所示。在表2中,最后一列的“是否畅销”为标记值,除第一列和最后一列以外的每一列表示一个特征。

表2

在一些实施例中,可以在初步确定进行特征后,对特征进行进一步筛选。下面参考图2a和2b描述本发明特征筛选方法的实施例。

图2a为根据本发明一些实施例的特征筛选方法的示例性流程图。如图2a所示,该实施例的特征筛选方法包括步骤s2012~s2014。

在步骤s2012中,计算不同特征之间的相关性。

相关性计算的一个实施例的方法为计算两个变量之间的协方差。如果两个变量的变化趋于一致,则二者的协方差为正;如果两个变量的变化趋势相反,则协方差为负值;如果两个变量独立,那么协方差为0。公式(1)为协方差计算方法的一个示例。

在公式(1)中,n表示总数据量,i表示数据的标识;x和y分别表示两个不同的变量,例如表示两个特征,xi和yi分别表示两个变量的第i个取值,分别表示两个变量的均值;cov(x,y)表示两个变量的协方差。

在步骤s2014中,筛除相关性大于预设值的不同特征中的一个特征。例如,可以根据业务需求保留主要的特征。

从而,可以在相似的多个特征之中仅保留一个特征,提高了计算效率。

图2b为根据本发明另一些实施例的特征筛选方法的示例性流程图。如图2b所示,该实施例的特征筛选方法包括步骤s2022~s2024。

在步骤s2022中,计算特征与销量信息之间的相关性。相关性的计算方法仍然可以参考公式(1)。此时,公式(1)的两个变量x和y中,其中一个为特征,另一个为销量信息、即标记值。

在步骤s2024中,筛除与销量信息的相关性小于预设值的特征。

从而,可以去除对结果影响较小的特征,提高了分类的准确性。

下面参考图3描述分类模型训练方法的实施例。

图3为根据本发明一些实施例的分类模型训练方法的示例性流程图。如图3所示,该实施例的分类模型训练方法包括步骤s302~s306。

在步骤s302中,获取用于训练的线上商品数据和用户行为数据。

在步骤s304中,根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息。

销量信息可以是销售数量、销售额等数据;还可以是“畅销”、“非畅销”等二分类或多分类的标签,例如,可以预先设定日销量在1000件以上的sku具有“畅销”的标记值。

销量信息可以是纯线下数据、纯线上数据或二者兼而有之,本领域技术人员可以根据需要进行选择。从而,可以根据商品是否热销来决定是否为线下店铺选择该商品。

在步骤s306中,采用训练样本数据的特征值作为输入、相应的销量信息作为标记值对分类模型进行训练。分类模型可以是决策树、神经网络、逻辑回归等模型。

以决策树为例,训练完成的分类决策树中的分类结点可以为商品的特征,叶子结点可以表示分类结果。图4为本发明一些实施例中的分类决策树示意图。如图4所示,如果一个商品的收藏量大于预设值x、并且是进口商品,则将其分类为“选择商品”;如果一个商品的收藏量大于预设值x、不是进口商品、待选品店铺周围的线下人群偏好度低,则将其分类为“不选择商品”。

下面参考图5a描述本发明分类决策树训练方法的实施例。

图5a为根据本发明一些实施例的分类决策树训练方法的示例性流程图。如图5a所示,该实施例的分类决策树训练方法包括步骤s502~s506。

在步骤s502中,根据待添加结点位置所对应的训练样本数据,计算未添加到分类决策树中的特征的信息增益。待添加结点位置所对应的训练样本数据是指采用分类决策树将所有训练样本数据进行分类至当前位置时所剩余的数据。

当待添加结点是根结点时,由于在根结点进行分类之前尚未进行任何分类,因此根结点对应的训练样本数据为训练本分类决策树所采用的全部训练样本数据。

当待添加结点不是根结点时,待添加结点位置所对应的训练样本数据为待添加结点的父结点对应的训练样本数据中采用父结点特征进行分类后的训练样本数据。例如,父结点对应数据a、b、c、d,父结点特征为“库存量是否大于预设值y”,则库存量大于y的数据a、b可以是父结点的第一个子结点位置对应的数据,库存量小于等于y的数据c、d可以是父结点的第二个子结点位置对应的数据。

在步骤s504中,将信息增益最大的特征添加到待添加结点位置。

然后,可以根据新添加的特征对新添加结点位置对应的训练样本数据进行分类。从而,获得了下一个循环中待添加结点位置所对应的训练样本数据。

在步骤s506中,判断当前是否还有特征未被添加到决策树中。如果是,回到步骤s502;如果不是,结束训练过程,并且为当前分类决策树添加表示分类结果的叶子结点。叶子结点所表示的分类结果根据待添加结点位置对应的训练样本数据的标记值确定。即,如果叶子结点与兄弟叶子结点相比,如果标记值为a的商品数据较多、或者占比较多,则将该叶子结点的分类结果设为a。

在一些实施例中,可以在特征的信息增益均较小的时候不为待添加结点添加特征。下面参考图5b描述本发明分类决策树训练方法的实施例。

图5b为根据本发明另一些实施例的分类决策树训练方法的示例性流程图。如图5b所示,该实施例的分类决策树训练方法包括步骤s512~s520。

在步骤s512中,根据待添加结点位置所对应的训练样本数据,计算未添加到分类决策树中的特征的信息增益。

在步骤s514中,判断是否每个未添加到分类决策树中的特征的信息增益均小于预设的信息增益阈值。如果是,执行步骤s516;如果不是,执行步骤s518。

在步骤s516中,向待添加结点位置添加表示分类结果的叶子结点,其中,分类结果根据待添加结点位置对应的标记值确定。

在步骤s518中,将信息增益最大的特征添加到待添加结点位置,作为分类结点。

在步骤s520中,判断当前是否还有特征未被添加到决策树中。如果是,回到步骤s512;如果不是,结束训练过程,并且为当前分类决策树的分类结点添加表示分类结果的叶子结点。

下面示例性地介绍信息增益的一种计算方法。设对于训练样本数据集s和特征t,s中包含x条正样本和y负样本,正样本和负样本分别表示不同的最终分类结果,例如分别表示畅销商品和非畅销商品。对数据集s进行针对特征t的分类标记,例如设t代表“收藏量”,收藏量“高”的正样本x1条,负样本y1条;收藏量“低”的正样本x2条,负样本y2条。则基于特征t,计算特征t的信息增益率的方式如下。

首先,采用公式(2)计算数据集s的信息熵info(s)。

然后,采用公式(3)计算特征t的信息熵info(t)。

最后,采用公式(4)和(5)计算特征t的信息增益率gainratio(t),其中,splitinfo(t)为中间变量。

通过上述实施例的方法,可以将对分类结果影响大的结点优先添加到分类决策树中,使得训练出的分类模型更加准确,进而提高了选品的准确性。

在一些实施例中,可以预先训练多个模型。下面参考图6描述本发明分类决策树训练方法的实施例。

图6为根据本发明另一些实施例的分类决策树训练方法的示例性流程图。如图6所示,该实施例的分类决策树训练方法包括步骤s602~s606。

在步骤s602中,获取多个训练样本数据子集,其中,每个训练样本数据子集对应的商品属于同一类别。例如,同一个训练样本数据子集中的数据可以属于同一品类、同一地域类别等等。

在步骤s604中,分别采用每个训练样本数据子集训练分类模型,获得多个子分类模型。具体的训练方法可以参考前述实施例,这里不再赘述。

在步骤s606中,根据每个子分类模型的预测准确率,确定每个子分类模型的权重,以便根据每个子分类模型的分类结果的加权计算结果确定是否为待选品店铺选择备选商品。子分类模型的权重可以与其预测准确率呈正相关关系。

从而,可以根据不同类别商品的特点预先训练多个模型,并根据多个模型的预测结果综合地确定预测结果,提高了选品的准确性。

在一些实施例中,可以将预先采集的已标记的数据划分为训练集和测试集。在采用训练集训练模型后,可以采用测试集对分类模型进行检验。下面参考图7描述本发明分类模型调整方法的实施例。

图7为根据本发明一些实施例的分类模型调整方法的示例性流程图。如图7所示,该实施例的分类模型调整方法包括步骤s702~s706。

在步骤s702中,将测试商品的特征值输入到分类决策树中。

在步骤s704中,根据分类决策树的分类结果与测试商品的标记值确定分类决策树的预测准确率。

在步骤s706中,响应于预测准确率低于预设的准确率阈值,执行以下至少一种操作后重新训练分类决策树:修改信息增益阈值;更新特征;更新训练样本数据。

由于信息增益阈值决定了当前位置是添加特征结点还是表示分类结果的结点,因此通过修改信息增益阈值,可以对决策树的结构进行调整;更新特征可以是增加特征、减少特征或者替换特征,从而可以根据不同的数据特点进行预测;更新训练样本数据可以是增加数据、减少数据或者替换数据,从而可以剔除极端数据、收纳更能够代表店铺周围的用户喜好的数据。

通过对训练完成的分类模型进行测试和调整,可以提高模型的预测准确率,进一步提高了选品的准确性和选品效率。

下面参考图8描述本发明选品装置的实施例。

图8为根据本发明一些实施例的选品装置的示例性结构图。如图8所示,该实施例的选品装置80包括:备选商品特征值确定模块810,被配置为根据备选商品的线上商品数据、与待选品店铺的线下距离小于预设值的线上用户的用户行为数据确定备选商品的特征值;备选商品特征值输入模块820,被配置为将备选商品的特征值输入分类模型,其中,分类模型是以训练样本数据的特征值作为输入、销量信息作为标记值训练的;选品确定模块830,被配置为根据分类模型的分类结果确定是否为待选品店铺选择备选商品。

在一些实施例中,选品装置80还包括:分类模型训练模块840,被配置为获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;采用训练样本数据的特征值作为输入、相应的销量信息作为标记值对分类模型进行训练。

在一些实施例中,分类模型为分类决策树,分类决策树中的分类结点为商品的特征,叶子结点表示分类结果。

在一些实施例中,选品装置80还包括:分类决策树训练模块850,被配置为获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;对分类模型进行训练,包括:根据待添加结点位置所对应的训练样本数据、计算未添加到分类决策树中的特征的信息增益,将信息增益最大的特征添加到待添加结点位置、作为分类结点,重复以上计算信息增益、添加特征的步骤直到所有特征都添加到分类决策树中。

在一些实施例中,选品装置80还包括:分类决策树训练模块850,被配置为获取用于训练的线上商品数据和用户行为数据;根据商品标识对获取的线上商品数据和用户行为数据进行特征融合,生成训练样本数据,其中,训练样本数据包括每个商品标识对应的特征值和销量信息;对分类模型进行训练,包括:根据待添加结点位置所对应的训练样本数据、计算未添加到分类决策树中的特征的信息增益,在每个未添加到分类决策树中的特征的信息增益均小于预设的信息增益阈值的情况下、向待添加结点位置添加表示分类结果的叶子结点,在未添加到分类决策树中的特征的信息增益没有均小于预设的信息增益阈值的情况下、将信息增益最大的特征添加到待添加结点位置作为分类结点,重复以上计算信息增益、添加特征的步骤直到所有特征都添加到分类决策树中;其中,分类结果根据待添加结点位置对应的标记值确定。

在一些实施例中,选品装置80还包括:分类模型测试调整模块860,被配置为将测试商品的特征值输入到分类决策树中;根据分类决策树的分类结果与测试商品的标记值确定分类决策树的预测准确率;响应于预测准确率低于预设的准确率阈值,执行以下至少一种操作后重新训练分类决策树:修改信息增益阈值;更新特征;更新训练样本数据。

在一些实施例中,选品装置80还包括:多模型训练模块870,被配置为获取多个训练样本数据子集,其中,每个训练样本数据子集对应的商品属于同一类别;分别采用每个训练样本数据子集训练分类模型,获得多个子分类模型;根据每个子分类模型的预测准确率,确定每个子分类模型的权重,以便根据每个子分类模型的分类结果的加权计算结果确定是否为待选品店铺选择备选商品。

在一些实施例中,选品装置80还包括:特征筛选模块880,被配置为执行以下至少一种特征筛选方法:筛除相关性大于预设值的不同特征中的一个特征;筛除与销量信息的相关性小于预设值的特征。

在一些实施例中,线上商品数据包括以下至少一种:线上购买特征、线上浏览特征、线上搜索特征、线上添加购物车特征、线上品牌销量特征、线上评价特征、线上基础属性特征、线下预设范围内用户的线上购买特征;用户行为数据包括以下至少一种:用户位置特征、用户购买特征、用户浏览特征、用户搜索特征、用户添加购物车特征、用户购买品牌特征、用户基础属性特征。

图9为根据本发明另一些实施例的选品装置的示例性结构图。如图9所示,该实施例的选品装置900包括:存储器910以及耦接至该存储器910的处理器920,处理器920被配置为基于存储在存储器910中的指令,执行前述任意一个实施例中的选品方法。

其中,存储器910例如可以包括系统存储器、固定非易失性存储介质等。系统存储器例如存储有操作系统、应用程序、引导装载程序(bootloader)以及其他程序等。

图10为根据本发明又一些实施例的选品装置的示例性结构图。如图10所示,该实施例的选品装置1000包括:存储器1010以及处理器1020,还可以包括输入输出接口1030、网络接口1040、存储接口1050等。这些接口1030,1040,1050以及存储器1010和处理器1020之间例如可以通过总线1060连接。其中,输入输出接口1030为显示器、鼠标、键盘、触摸屏等输入输出设备提供连接接口。网络接口1040为各种联网设备提供连接接口。存储接口1050为sd卡、u盘等外置存储设备提供连接接口。

本发明的实施例还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现前述任意一种选品方法。

本领域内的技术人员应当明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解为可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1