一种标准化产品单元SPU的细化方法及装置与流程

文档序号:11627898阅读:447来源:国知局
一种标准化产品单元SPU的细化方法及装置与流程

本申请涉及电子商务技术领域,尤其涉及一种标准化产品单元spu的细化方法及装置。



背景技术:

在与计算机相关的各项技术领域中,电子商务为人们的生活质量的提高做出了卓越贡献,通常电子商务是通过信息网络技术,来进行商品交换的商务活动。在电子商务的商品交换的过程中,为了便于交换双方查询到自己需要的商品,通常需要对商品进行分类。

目前,电子商务平台对商品的分类一般采用标准化产品单元(standardproductunit,spu)的方法。该方法在同一个电子商务平台中,通过构建一组固定的标准化信息的标签,其中每个标准化信息的标签用于描述商品某个方面的属性;然后根据所构建的这组标准化信息的标签创建多个标准化产品单元spu,使得不同的标准化产品单元spu之间至少有一个标签所对应的商品属性值不同;最后将商品分类到对应的标准化产品单元spu中。

然而,随着电子商务平台中商品的越加丰富,同一个标准化产品单元spu中的商品也出现了区别,例如同一标准化产品单元spu中的手机也有了内存大小之分,同一标准化产品单元spu中的冰箱的容积也可能不同。这样使得在实际应用中,需要对标准化产品单元spu进一步地进行细化,从而适应新的需求。现有技术只能通过人工进行操作,对不同标准化产品单元spu追加各自对应的关键属性项,用以实现标准化产品单元spu的细化。例如,对手机的分类增加内存属性项,对冰箱的分类增加容积属性项。

但是,这种现有技术的问题是,电子商务平台上的标准化产品单元spu 的数量成千上万,这种通过人工干预对不同标准化产品单元spu追加各自对应的关键属性,来细化标准化产品单元spu的方式,由于人自身的认知和辨别能力的局限性,使得该方式效率较低。



技术实现要素:

本申请实施例提供一种标准化产品单元spu的细化方法及装置,用于解决现有技术需要人工操作,对各个标准化产品单元spu增加关键属性项来细化标准化产品单元spu,由于人自身的认知和辨别能力的局限性,使得该方式效率较低的问题。

本申请实施例提供一种标准化产品单元spu的细化方法,该方法包括:

获取指定标准化产品单元spu中各商品的商品价格信息;

通过各所述商品对应的商品价格确定至少一个商品价格聚类中心,所述商品价格聚类中心指通过将各所述商品对应的商品价格进行聚类运算确定的聚类中心;

通过各所述商品价格聚类中心生成至少一个标准化产品单元spu。

优选的,所述通过各所述商品对应的商品价格确定至少一个商品价格聚类中心具体包括:

从各所述商品对应的商品价格中选择k个商品价格作为初始聚类中心并通过每个所述初始聚类中心生成对应的簇,所述k为大于或等于1的正整数;

将各所述商品对应的商品价格分别作为当前商品价格,确定所述当前商品价格与各所述初始聚类中心的距离,将所述当前商品价格分配到距离最小的初始聚类中心对应的簇;

根据k个所述簇中所分配的商品价格,确定k个所述簇分别对应的聚类中心;

将各所述聚类中心作为新初始聚类中心,根据每个所述新初始聚类中心生成对应的新簇用以将各所述商品对应的商品价格重新进行分配,直至第一代价 函数的值收敛,所述第一代价函数用于度量聚类运算的完成情况;

将所述第一代价函数的值收敛时所生成的各簇的聚类中心确定为商品价格聚类中心。

优选的,所述根据k个所述簇中所分配的商品价格,确定k个所述簇分别对应的聚类中心具体包括:

将k个所述簇分别作为当前簇,分别将所述当前簇中各商品价格作为当前商品价格,确定所述当前簇中所述当前商品价格之外的其它商品价格分别与所述当前商品价格的差值;

根据各所述差值确定在所述当前簇中所述当前商品价格对应的第二代价函数值,所述第二代价函数值反应所述当前商品价格与所述当前簇中所述当前商品价格之外的其他商品价格之间的距离;

通过所述当前簇中各商品价格分别对应的第二代价函数值确定所述当前簇的聚类中心。

优选的,所述根据k个所述簇中所分配的商品价格,确定k个所述簇分别对应的聚类中心具体包括:

将k个所述簇分别作为当前簇,将所述当前簇中各商品价格的平均值确定为所述当前簇对应的聚类中心。

优选的,所述方法还包括:

将所述指定标准化产品单元spu中各所述商品分别作为当前商品,通过所述当前商品的商品价格确定所述当前商品与生成的各所述标准化产品单元spu的距离;

基于各所述距离将所述当前商品分类到对应的标准化产品单元spu。

优选的,所述基于各所述距离将所述当前商品分类到对应的标准化产品单元spu具体包括:通过对比各所述距离的大小,将所述当前商品分类到距离最小的标准化产品单元spu。

本申请实施例还提供一种标准化产品单元spu的细化装置,该装置包括: 获取单元、确定单元和生成单元,其中:

获取单元,用于获取指定标准化产品单元spu中各商品的商品价格信息;

确定单元,用于通过各所述商品对应的商品价格确定至少一个商品价格聚类中心,所述商品价格聚类中心指通过将各所述商品对应的商品价格进行聚类运算确定的聚类中心;

生成单元,用于通过各所述商品价格聚类中心生成至少一个标准化产品单元spu。

优选的,所述确定单元具体包括:第一确定子单元、第二确定子单元、第三确定子单元、第四确定子单元、第五确定子单元,其中:

第一确定子单元,用于从各所述商品对应的商品价格中选择k个商品价格作为初始聚类中心并通过每个所述初始聚类中心生成对应的簇,所述k为大于或等于1的正整数;

第二确定子单元,用于将各所述商品对应的商品价格分别作为当前商品价格,确定所述当前商品价格与各所述初始聚类中心的距离,将所述当前商品价格分配到距离最小的初始聚类中心对应的簇;

第三确定子单元,用于根据k个所述簇中所分配的商品价格,确定k个所述簇分别对应的聚类中心;

第四确定子单元,用于将各所述聚类中心作为新初始聚类中心,根据每个所述新初始聚类中心生成对应的新簇用以将各所述商品对应的商品价格重新进行分配,直至第一代价函数的值收敛,所述第一代价函数用于度量聚类运算的完成情况;

第五确定子单元,用于将所述第一代价函数的值收敛时所生成的各簇的聚类中心确定为商品价格聚类中心。

优选的,所述第三确定子单元具体包括:第三确定子单元第一子模块,用于将k个所述簇分别作为当前簇,将所述当前簇中各商品价格的平均值确定为所述当前簇对应的聚类中心。

优选的,所述第三确定子单元具体包括:第三确定子单元第二子模块,用于将k个所述簇分别作为当前簇,分别将所述当前簇中各商品价格作为当前商品价格,确定所述当前簇中所述当前商品价格之外的其它商品价格分别与所述当前商品价格的差值;根据各所述差值确定在所述当前簇中所述当前商品价格对应的第二代价函数值,所述第二代价函数值反应所述当前商品价格与所述当前簇中所述当前商品价格之外的其他商品价格之间的距离;通过所述当前簇中各商品价格分别对应的第二代价函数值确定所述当前簇的聚类中心。

优选的,所述装置还包括:距离确定单元和分类单元,其中:

距离确定单元,用于将所述指定标准化产品单元spu中各所述商品分别作为当前商品,通过所述当前商品的商品价格确定所述当前商品与生成的各所述标准化产品单元spu的距离;

分类单元,用于基于各所述距离将所述当前商品分类到对应的标准化产品单元spu。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果:

由于获取指定标准化产品单元spu中各商品的商品价格信息,然后通过对各商品对应的商品价格进行聚类运算确定至少一个商品价格聚类中心,并通过所确定的各商品价格聚类中心生成至少一个标准化产品单元spu,从而对该指定标准化产品单元spu进行细化。因此解决了现有技术需要人工操作,对各个标准化产品单元spu增加关键属性项来细化标准化产品单元spu,从而导致效率较低的问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:

图1为本申请实施例1提供的一种标准化产品单元spu的细化方法的具 体实现流程示意图;

图2为本申请实施例1提供的聚类运算具体实现流程示意图;

图3为本申请实施例1提供的一种标准化产品单元spu的细化方法在具体应用场景下的实现流程示意图;

图4为本申请实施例1提供的一种标准化产品单元spu的细化方法在另一种具体应用场景下的实现流程示意图;

图5为本申请实施例2提供的一种标准化产品单元spu的细化装置的具体结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

以下结合附图,详细说明本申请各实施例提供的技术方案。

实施例1

如前所述,电子商务平台中有众多的标准化产品单元spu,这些标准化产品单元spu可以通过在电子商务平台中,构建一组固定的标准化信息的标签来建立。例如构建一组固定的标准化信息的标签为“行业、品牌、型号”,然后根据行业、品牌或型号的不同创建多个标准化产品单元spu,这样使得同一个标准化产品单元spu中的各个商品的“行业、品牌、型号”均相同,并且不同标准化产品单元spu中商品“行业、品牌、型号”至少有一个不同。

但是,由于商品种类的越加丰富,这种通过一组固定化的标签来构建标准化产品单元spu,通过会出现同一个标准化产品单元spu中的商品也有区别 的情况。例如,当固定化标签为“行业、品牌、型号”时,iphone6手机的标准化产品单元spu为“手机+苹果+iphone6”,但是iphone6手机内存有16g和64g之分,它们在成本和价格上都存在较大差异。因此,为了适应新的需求,需要对标准化产品单元spu进行细化。现有技术只能通过人工进行操作,对不同标准化产品单元spu追加各自对应的关键属性,从而实现商品的分类的细化。例如,对手机的分类增加内存属性项,使得iphone6手机的标准化产品单元spu细分为“手机+苹果+iphone6+16g”和“手机+苹果+iphone6+64g”。

但是,现有技术的问题是,电子商务平台上的标准化产品单元spu的数量成千上万。并且一般来说,在电子商务平台中同一标准化产品单元spu所包含的多个商品通常都会有差别,这些差别可以是颜色的不同,也可以是内存大小不同,也可以是其它属性的不同。这种通过人工干预,对不同标准化产品单元spu追加各自对应的关键属性,来进行商品细化分类的方式,由于人自身的认知和辨别能力的局限性,通常效率较低。例如,当固定化标签为“行业、品牌、型号”时,对于同一个标准化产品单元spu中不同颜色的衣服,可以增加颜色属性项,对于同一个标准化产品单元spu中的手机,可以增加内存属性项。但是当标准化产品单元spu的数量巨大时,需要人工进行操作,对每一个标准化产品单元spu中的商品逐一增加关键属性项,这种方式通常会由于人自身的认知和辨别能力的局限性,效率较低。

有鉴于此缺陷,所以本发明人提出了一种标准化产品单元spu的细化方法,用于解决现有技术通过人工操作,对各个标准化产品单元spu增加关键属性项来对标准化产品单元spu进行细化,由于人自身的局限性导致对标准化产品单元spu细化的效率低的问题。该方法的流程示意图如图1所示,包括下述步骤:

步骤11:获取指定标准化产品单元spu中各商品的商品价格信息。

在这里,所说的指定标准化产品单元spu可以是电子商务平台中的任意的一个标准化产品单元spu。由于不同的电子商务平台通常都有各自的标准, 因此对于标准化产品单元spu中的标准化信息标签也不同,在如果没有特殊说明的情况下为了便于描述,本申请的标准化信息标签均为“行业、品牌、型号”,本申请的标准化产品单元spu均根据该组标准化信息标签建立。例如,iphone6手机的标准化产品单元spu为“手机+苹果+iphone6”。

商品价格可以是商品交易过程中的即时价格,在实际的应用场景下,也可以是指该商品在一段时间内的平均价格。

在这里,步骤11可以是获取指定电子商务平台中任意一个标准化产品单元spu的各商品的商品价格信息,该指定电子商务平台也可以是任意指定的电子商务平台。在实际应用中,由于电子商务平台通常还会有其它商户入驻,因此在实际应用下获取的商品价格信息所指的商品,也可以包括该电子商务平台内入驻的其它商户的商品。

步骤12:通过各所述商品对应的商品价格确定至少一个商品价格聚类中心。

所述商品价格聚类中心指通过将各所述商品对应的商品价格进行聚类运算确定的聚类中心。

聚类运算是将数据划分为不同的簇的这样一个过程,同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。聚类运算的目标就是将在相似的基础上收集数据来进行分类。在实际应用中,聚类运算通常用于通过分类难以解决的情形。例如,若两个商品色差相差较大,可以根据颜色直接对它们进行分类;若多个商品的颜色连续变化,色差相差肉眼难以辨别,这时候通常可以通过聚类运算的方式来将它们进行分组。

在这里,商品价格聚类中心是指将各商品价格通过聚类运算确定的聚类中心。聚类中心是指聚类运算所分成的簇的中心。

在实际应用中,对商品价格进行聚类运算的方法有多种多样,例如有划分方法、层次方法、基于密度的方法、基于网络的方法和基于模型的方法。一种优选的方案是划分方法,通过构建多个分组并且每个分组代表一个簇,该方法如图2所示,包括步骤121至步骤125。

步骤121:从各所述商品对应的商品价格中选择k个商品价格作为初始聚类中心并通过每个所述初始聚类中心生成对应的簇。

所述k为大于或等于1的正整数。

在实际应用中,可以是从各商品对应的商品价格中随机选择k个商品价格作为初始聚类中心;当然为了具体需要,比如缩短聚类运算的时间,通常也可以选择指定的k个商品价格作为初始聚类中心。

步骤122:将各所述商品对应的商品价格中分别作为当前商品价格,确定所述当前商品价格与各所述初始聚类中心的距离,将所述当前商品价格分配到距离最小的初始聚类中心对应的簇。

将各商品对应的商品价格分别作为当前商品价格;然后分别计算当前商品价格与各初始聚类中心的距离,该距离可以是欧氏距离也可以是曼哈顿距离或者其它距离,在实际应用中为了便于计算,该距离通常也可以用当前价格与初始聚类中心对应价格的差值的绝对值来表示;最后将该当前商品价格分配到距离最小的初始聚类中心所对应的簇。

步骤123:根据k个所述簇中所分配的商品价格,确定k个所述簇分别对应的聚类中心。

在将各商品对应的商品价格分配到各个簇之后,步骤123是确定各个簇分别对应的聚类中心。在实际应用场景下,簇的聚类中心可以通过该簇中数据的平均值来确定,也可以通过其他方式来确定该簇的聚类中心。

因此,一种确定k个簇分别对应的聚类中心的优选方案如步骤1231所示。

步骤1231:将k个所述簇分别作为当前簇,将所述当前簇中各商品价格的平均值确定为所述当前簇对应的聚类中心。

这种通过平均值确定簇的聚类中心的方式时间较快,易于实现。

另一种确定k个簇分别对应的聚类中心的优选方案如步骤1232所示。

步骤1232:将k个所述簇分别作为当前簇,分别将所述当前簇中各商品价格作为当前商品价格,确定所述当前簇中所述当前商品价格之外的其它商品 价格分别与所述当前商品价格的差值;根据各所述差值确定在所述当前簇中所述当前商品价格对应的第二代价函数值;通过所述当前簇中各商品价格分别对应的第二代价函数值确定所述当前簇的聚类中心。

在这里的每一个簇中,所述第二代价函数值反应所述当前商品价格与所述当前簇中所述当前商品价格之外的其他商品价格之间的距离。

在实际应用中,当前簇中当前商品价格的第二代价函数值可以根据其它商品价格分别与该当前商品价格的差值确定。一种确定当前商品价格的第二代价函数值的方式如下所示:

其中,ei为当前簇中第i个商品价格(当前商品价格)的第二代价函数值,︱pij︱为第j个商品价格与第i个商品价格的差值的绝对值,n为该当前簇中不同商品价格的数量。

例如也可以通过如下方式来确定当前商品价格的第二代价函数值:

其中,ei为第i个商品价格(当前商品价格)的第二代价函数值,pij为第j个商品价格与第i个商品价格的差值,n为该当前簇中不同商品价格的数量。

在实际应用中,当确定当前簇中各商品价格对应的第二代价函数值后,通常可以将第二代价函数值最小的商品价格确定为该当前簇的聚类中心。当然在特定应用场景下,也可以将第二代价函数函数值最大的商品价格确定为该当前簇的聚类中心。

通过步骤1232的方法确定当前簇中的聚类中心,可以降低异常数据对结果的干扰。

步骤124:将各所述聚类中心作为新初始聚类中心,根据每个所述新初始聚类中心生成对应的新簇,用以将各所述商品对应的商品价格重新进行分配,直至第一代价函数的值收敛。

在这里,所述第一代价函数用于度量聚类运算的完成情况。

在实际应用中,通常所采用的第一代价函数的形式可以为梯度下降法、固定增量算法或最小平方差准则函数等。为了便于运算,可以采用如下所述的第一代价函数:

其中,d表示第一代价函数值,k表示所述新簇的数量,n为第m个新簇中不同商品价格的数量,bm为第m个新簇中生成的聚类中心,pmi为第m个新簇中的第i个商品价格。

第一代价函数收敛,说明该聚类运算已经完成,也就是说对各商品的商品价格进行分配已经趋于稳定。在实际的聚类运算过程中,通常同时需要对大量的商品价格进行聚类,用以将这些商品价格分成多个组,当第一代价函数收敛时,说明该分组已经完成,各个组中所包含的商品价格在继续进行聚类运算时,已经基本不变。

步骤125:将所述第一代价函数的值收敛时所生成的各簇的聚类中心确定为商品价格聚类中心。

第一代价函数收敛,说明聚类运算最后所生成的各个簇中所包含的商品价格已经基本不变。此时,将各簇分别对应的聚类中心确定为各商品价格聚类中心。

步骤13:通过各所述商品价格聚类中心生成至少一个标准化产品单元spu。

在通过指定标准化产品单元spu中的各商品价格生成至少一个商品价格聚类中心后,可以通过各个商品价格聚类中心生成至少一个标准化产品单元spu。

在实际应用中,通过指定标准化产品单元spu生成的商品价格聚类中心的数量可能会较多,这时候可以将各商品价格聚类中心进行适当的合并,然后生成至少一个标准化产品单元spu。当然,根据实际需要也可以将每一个商品价格聚类中心生成一个标准化产品单元spu。

另外,需要说明的是,由于电子商务平台中商品十分丰富,因此所获取的指定标准化产品单元spu中各商品的商品价格可能会出现连续分布的情况,例如品牌a某一型号的手机在电子商务平台中的价格从3000至5000连续分布,这时候通常并不清楚通过聚类运算需要分成多少组。实际应用中的一种解决方式是,为分组数量设定两个阈值,分别为最大分组数(通常可以为5组或10组)和最小分组数(通常可以为1组或2组),然后先通过聚类运算分成最小分组数,并逐步增大分组的数量直至最大分组数,最后通过标准测度函数的值来确定最终的分组数量。

标准测度函数用于评价聚类运算的效果,它通过结合内聚度和分离度两种因素来评价聚类运算。其中,内聚度用于评价簇的内部各数据是否紧密(通过距离或向量相似度);分离度用于评价各个簇之间是否紧密(也可通过距离或向量相似度)。

在实际应用中,可以作为标准测度函数的函数形式有很多,例如可以用轮廓系数作为标准测度函数,轮廓系数如下所示:

a(i)=average(商品价格i到该商品价格i所属的簇中的其它商品价格的距离);b(i)=min(商品价格i到该商品价格i所属的簇之外的,分别各个其它簇中的商品价格的平均距离);其中,average表示取平均值,min表示取最小值,max表示取最大值。

从上述公式可以看出a(i)的值用于表示内聚度,b(i)值用于表示分离度,因此轮廓系数通过结合a(i)和b(i)来评价聚类运算的效果,s(i)的值介于[-1,1]之间,s(i)的值越大说明聚类运算的效果越好。

当b(i)的值较大时,说明簇之间的分离度较好,s(i)的值为正数;当a(i)的值较大时,说明簇内部之间的数据分离较大(数据不紧密),s(i)的值为负数。特殊情况下,当b(i)=1同时a(i)=0时,s(i)=1,说明该聚类运算的效果最佳; 当b(i)=0同时a(i)=1时,s(i)=-1,说明该聚类运算的效果最差。

另外,为了便于理解,本申请实施例还提供了在一种商品分类的应用场景下,实施所述标准化产品单元spu的细化方法的示意图,如图3所示。具体步骤如下所示:

步骤21:获取指定标准化产品单元spu中各商品的商品价格信息。

步骤22:通过各所述商品对应的商品价格确定至少一个商品价格聚类中心。

步骤23:通过各所述商品价格聚类中心生成至少一个标准化产品单元spu。

步骤24:将所述指定标准化产品单元spu中各所述商品分别作为当前商品,通过所述当前商品的商品价格确定所述当前商品与生成的各所述标准化产品单元spu的距离。

分别将该指定标准化产品单元spu中的各个商品作为当前商品,然后通过该当前商品的商品价格,确定该当前商品与生成的各个所述标准化产品单元spu的距离,该距离可以为欧氏距离,也可以为曼哈顿距离,也可以为其它距离。在实际应用中,通常为了便于计算,可以将该当前商品的商品价格,与各个标准化产品单元spu所对应的商品价格聚类中心相减,再将相减后的结果求绝对值(或者平方),用以确定该当前商品与各个标准化产品单元spu的距离。

步骤25:基于各所述距离将所述当前商品分类到对应的标准化产品单元spu。

在确定当前商品与各个标准化产品单元spu的距离后,基于这些距离可以将当前商品分类到对应的标准化产品单元spu。在实际应用中,通过当前商品与各个标准化产品单元spu的距离进行对该当前商品分类,通常可以比较所确定各个距离的大小,根据大小关系将当前商品分类到对应的标准化产品单元spu。一般情况下可以通过对比各所述距离的大小,将所述当前商品分类到距离最小的标准化产品单元spu,这样使得商品分类过程更加易于实现并且更加合理。

本申请实施例还提供了在另外一种实际应用场景下,实施所述标准化产品单元spu的细化方法的示意图,如图4所示。在实际应用中,电子商务平台上通常会有很多其它的商家入驻,在其它的各个商家入驻时,通常需要对入驻的成本进行预估,而在预估入驻的成本时,如何预估入驻的各商品的成本是关键。本申请的商品分类方法可以在这种应用场景下使用,具体如下所示:

步骤31:获取指定标准化产品单元spu中各商品的商品价格信息。

在该应用场景下,指定标准化产品单元spu可以为在商家入驻电子商务平台时,入驻的各商品分别对应的标准化产品单元spu。例如,商家a准备入驻电子商务平台b,a将要在b中售卖的商品为c(可以为多种商品),这些商品分别对应的标准化产品单元spu用d1、d2、d3至dn表示,其中n表示标准化产品单元spu的数量,该指定标准化产品单元spu可以依次为d1、d2、d3至dn。

步骤32:通过各所述商品对应的商品价格确定至少一个商品价格聚类中心。

通过对该指定标准化产品单元spu下各商品的商品价格进行聚类运算,确定至少一个商品价格聚类中心。在实际应用中对商品价格进行聚类运算的方式有多种,也可以采用本申请前面所提供的聚类运算方法,在这里就再赘叙。

步骤33:通过各所述商品价格聚类中心生成至少一个标准化产品单元spu。

步骤34:通过所生成的各所述标准化产品单元spu,预测所述指定标准化产品单元spu中各商品的成本。

在将指定标准化产品单元spu细化为至少一个标准化产品单元spu后,可以通过细化后的各个标准化产品单元spu,来预测所述指定标准化产品单元spu中各商品的成本。例如,指定标准化产品单元spu为d1,通过将d1细分生成了两个新的标准化产品单元spu,分别为e1和e2,这时候可以通过e1中商品的数量以及e2中商品的数量,来预测d1中所有商品的进货成本。当然,实际应用中还可以分别将d2、d3至dn作为指定标准化产品单元spu,从而预测入驻该电子商务平台的成本。

采用实施例1提供的该方法,由于获取指定标准化产品单元spu中各商品的商品价格,然后通过对各商品价格进行聚类运算确定多个商品价格聚类中心,将该指定标准化产品单元spu中的各商品分类到对应的商品价格聚类中心。从而解决了现有技术需要人工操作,对各个标准化产品单元spu增加关键属性项来对商品进行分类,从而导致对商品分类效率低的问题。

需要说明的是,实施例1所提供方法的各步骤的执行主体均可以是同一设备,或者,该方法的各步骤也可以由不同设备作为执行主体。比如,步骤11和步骤12的执行主体可以为设备1;又比如,步骤11的执行主体可以为设备1,步骤12和的执行主体可以为设备2;等等。

实施例2

基于与实施例1相同的发明构思,实施例2提供了一种标准化产品单元spu的细化装置,用于解决现有技术通过人工操作,对各个标准化产品单元spu增加关键属性项来对标准化产品单元spu进行细化,这种方式由于人自身的局限性导致效率低的问题。如图5所示,该装置20包括:获取单元201、确定单元202和生成单元203,其中:

获取单元201,用于获取指定标准化产品单元spu中各商品的商品价格信息;

确定单元202,用于通过各所述商品对应的商品价格确定至少一个商品价格聚类中心,所述商品价格聚类中心指通过将各所述商品对应的商品价格进行聚类运算确定的聚类中心;

生成单元203,用于通过各所述商品价格聚类中心生成至少一个标准化产品单元spu。

采用实施例2提供的该装置,通过获取单元获取指定标准化产品单元spu中各商品的商品价格信息,确定单元通过对各商品价格进行聚类运算确定至少一个商品价格聚类中心,最后生成单元通过各所述商品价格聚类中心生成至少 一个标准化产品单元spu。从而解决了现有技术通过人工操作,对各个标准化产品单元spu增加关键属性项来实现细化,由于人自身的局限性导致该方法效率低的问题。

在实际应用中,该装置还可以通过添加其它的单元,用以实现新的功能,例如可以通过添加距离确定单元204和分类单元205,来对商品进行分类,其中:

距离确定单元204,用于将所述指定标准化产品单元spu中各所述商品分别作为当前商品,通过所述当前商品的商品价格确定所述当前商品与生成的各所述标准化产品单元spu的距离;

分类单元205,用于基于各所述距离将所述当前商品分类到对应的标准化产品单元spu。

在实际应用中,确定单元中可以通过多种聚类运算的方法,来确定商品价格聚类中心,例如有划分方法、层次方法、基于密度的方法、基于网络的方法和基于模型的方法。在这里,为了便于对各商品价格进行聚类运算,确定单元202可以包括第一确定子单元2021、第二确定子单元2022、第三确定子单元2023、第四确定子单元2024、第五确定子单元2025,通过这些子单元来确定多个商品价格聚类中心,其中:

第一确定子单元2021,用于从各所述商品对应的商品价格中选择k个商品价格作为初始聚类中心并通过每个所述初始聚类中心生成对应的簇,所述k为大于或等于1的正整数;

第二确定子单元2022,用于将各所述商品对应的商品价格分别作为当前商品价格,确定所述当前商品价格与各所述初始聚类中心的距离,将所述当前商品价格分配到距离最小的初始聚类中心对应的簇;

第三确定子单元2023,用于根据k个所述簇中所分配的商品价格,确定k个所述簇分别对应的聚类中心;

第四确定子单元2024,用于将各所述聚类中心作为新初始聚类中心,根据 每个所述新初始聚类中心生成对应的新簇用以将各所述商品对应的商品价格重新进行分配,直至第一代价函数的值收敛,所述第一代价函数用于度量聚类运算的完成情况;

第五确定子单元2025,用于将所述第一代价函数的值收敛时所生成的各簇的聚类中心确定为商品价格聚类中心。

特别的,第三确定子单元2023,用于根据k个所述簇中所分配的商品价格,确定k个所述簇分别对应的聚类中心的方式可以有多种,因此第三确定子单元2023可以包括第三确定子单元第一子模块20231,用于将k个所述簇分别作为当前簇,将所述当前簇中各商品价格的平均值确定为所述当前簇对应的聚类中心。这种确定当前簇中的聚类中心的方式易于实现,运算量较小。

特别的,第三确定子单元2023还可以包括第三确定子单元第二子模块20322,用于将k个所述簇分别作为当前簇,分别将所述当前簇中各商品价格作为当前商品价格,确定所述当前簇中所述当前商品价格之外的其它商品价格分别与所述当前商品价格的差值;根据各所述差值确定在所述当前簇中所述当前商品价格对应的第二代价函数值,所述第二代价函数值反应所述当前商品价格与所述当前簇中所述当前商品价格之外的其他商品价格之间的距离;通过所述当前簇中各商品价格分别对应的第二代价函数值确定所述当前簇的聚类中心。通过第三确定子单元第二子模块20322确定当前簇中的聚类中心,在实际应用中可以降低异常数据对结果的干扰。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产 品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁 磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1