一种关键词分类方法及装置与流程

文档序号:11386783阅读:202来源:国知局
一种关键词分类方法及装置与流程

本发明属于关键词处理技术领域,更具体的说,尤其涉及一种关键词分类方法及装置。



背景技术:

当浏览器获取到关键词,并检测到浏览器的搜索功能被触发时,会触发后台服务器从上亿级别的产品数据中搜索与关键词匹配的产品,并确定关键词所属分类,这样在前台设备(如显示有浏览器的终端设备)上显示与关键词匹配的产品的同时还可以显示关键词所属分类。当关键词所属分类中任意一个分类被触发时,前台设备仅显示被触发的分类下的产品。

目前基于关键词的搜索方法有相关搜索方法和纠偏搜索方法,其中相关搜索方法是:在通过关键词进行搜索时,由后台服务器通过大数据分析方式,确定接近搜索场景且满足搜索关键词需求的所有分类下的产品,但是这种方式需要对后台服务器中的所有产品数据进行分析,从而降低搜索效率。

而纠偏搜索方式是:后台服务器从词库中调取与关键词相关(如语意相关)的词,根据调取的词对所述关键词进行纠正,再根据纠正后的关键词进行二次搜索,得到于纠正后的关键词相匹配的产品,但是这种方式需要有一定的数据积累,若后台服务器的数据分析能力不足或者数据量积累较小,后台服务器不能精准地对关键词进行纠正,得到更精准的关键词(即纠正后的关键词)进行搜索。



技术实现要素:

有鉴于此,本发明的目的在于提供一种关键词分类方法,通过改变关键词所属分类,提高搜索效率和搜索准确率。具体的,技术方案如下:

本发明提供一种关键词分类方法,所述方法包括:

获取关键词所属的每个第n级分类下的产品数量以及获取所述第n级分类下的产品的概要信息,所述n为自然数;

确定每个第n级分类所属的第n-m级分类,所述m为自然数,且n-m的取值大于预设等级或等于预设等级;

根据所述产品数量、所述概要信息和所述第n级分类所属的第n-m级分类,计算所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分;

选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第n级分类为所述关键词的默认分类。

优选地,所述根据所述产品数量、所述概要信息和所述第n级分类所属的第n-m级分类,计算所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分,包括:

分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分;

计算每个所述产品的概要信息与所述关键词的匹配得分以及计算每个第n-m级分类的分类得分;

根据所述产品得分、所述匹配得分和所述分类得分,得到所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分。

优选地,所述获取所述第n级分类下的产品的概要信息,包括:

根据每个所述第n级分类的产品得分,从所获取的所有第n级分类中选取t个所述第n级分类,所述t为自然数;

获取所述t个所述第n级分类下的产品的概要信息。

优选地,所述分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分,包括:

确定每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,第一级别高于第二级别;

根据每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第n级分类的产品得分。

优选地,所述选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第n级分类为所述关键词的默认分类,包括:

根据每个所述第n级分类的第二总得分,对所有所述第n级分类进行排序,得到每个所述第n级分类在所有第n级分类中的排位;

根据每个所述第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类;

判断所选取的多个第n级分类的第二总得分之和是否大于所述第一总得分与预设权重的乘积,若是,则将所选取的多个第n级分类确定为所述关键词的默认分类,若否,则增大所述预设排位的取值,返回执行所述根据每个所述第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类。

本发明还提供一种关键词分类装置,所述装置包括:

获取单元,用于获取关键词所属的每个第n级分类下的产品数量以及获取所述第n级分类下的产品的概要信息,所述n为自然数;

确定单元,用于确定每个第n级分类所属的第n-m级分类,所述m为自然数,且n-m的取值大于预设等级或等于预设等级;

计算单元,用于根据所述产品数量、所述概要信息和所述第n级分类所属的第n-m级分类,计算所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分;

选取单元,用于选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第n级分类为所述关键词的默认分类。

优选地,所述计算单元包括:第一计算子单元,用于分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分;

第二计算子单元,用于计算每个所述产品的概要信息与所述关键词的匹配得分以及计算每个第n-m级分类的分类得分;

第三计算子单元,用于根据所述产品得分、所述匹配得分和所述分类得分,得到所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分。

优选地,所述获取单元获取所述第n级分类下的产品的概要信息,包括:根据每个所述第n级分类的产品得分,从所获取的所有第n级分类中选取t个所述第n级分类,并获取所述t个所述第n级分类下的产品的概要信息,所述t为自然数。

优选地,所述第一计算子单元,用于确定每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,并根据每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第n级分类的产品得分,第一级别高于第二级别。

优选地,所述选取单元包括:排序子单元,用于根据每个所述第n级分类的第二总得分,对所有所述第n级分类进行排序,得到每个所述第n级分类在所有第n级分类中的排位;

选取子单元,用于根据每个所述第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类;

判断子单元,用于判断所选取的多个第n级分类的第二总得分之和是否大于所述第一总得分与预设权重的乘积,若是,则触发所述选取子单元将所选取的多个第n级分类确定为所述关键词的默认分类,若否,则触发所述选取子单元增大所述预设排位的取值,并触发所述选取子单元所述根据每个所述第n级分类在所有第n级分类中的排位,选取排位在增大后的预设排位前的多个第n级分类。

与现有技术相比,本发明提供的上述技术方案具有如下优点:

藉由上述技术方案,对于任意一个关键词来说,可以从关键词所属的每个第n级分类下的产品数量、第n级分类下的产品的概要信息和每个第n级分类所属的第n-m级分类出发,确定出关键词的默认分类,这样在基于关键词进行搜索时可以直接获取默认分类下的各个产品,提高搜索效率。并且从上述多个角度出发确定关键词的默认分类的方式相对于单一角度来说可以提高分类准确率,而相对于现有纠正方式来说无需一定数据积累,这样在数据积累未达到纠正要求时,仍可以通过准确率提高的默认分类进行搜索,提高搜索准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的关键词分类方法的流程图;

图2是本发明实施例提供的关键词分类方法中选取第n级分类的流程图;

图3是本发明实施例提供的关键词分类方法中计算第二总得分的流程图;

图4是本发明实施例提供的关键词分类装置的结构示意图;

图5是本发明实施例提供的关键词分类装置中计算单元的结构示意图;

图6是本发明实施例提供的关键词分类装置中选取单元的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,其示出了本发明实施例提供的关键词分类方法的流程图,用于提高搜索效率和搜索准确率,具体的所述关键词分类方法可以包括以下步骤:

101:获取关键词所属的每个第n级分类下的产品数量以及获取第n级分类下的产品的概要信息,其中n为自然数。可以理解的是:本发明实施例以关键词所属的每个第n级分类为独立单位,获取每个第n级分类下的产品数量以及每个第n级分类下的每个产品的概要信息。

在实际生产过程中可能会生成不同级别的产品,如特权产品和普通产品,因此本发明实施例可以分别获取每个第n级分类下的特权产品的产品数量和每个第n级分类下的普通产品的产品数量,其中特权产品是至少以更先进方式显示和更先进技术生产的产品,普通产品则是以一般技术生产的产品,因此特权产品的级别高于普通产品的级别。

对于每个产品来说,在将产品对外公布时需要为每个产品设置对应的概要信息,以通过这个概要信息可以与对应的关键词进行匹配,其中概要信息是对产品的简要说明,至少用于指示产品的类型、功能和材质等等,概要信息具体包括哪些内容本发明实施例不再一一列举。

102:确定每个第n级分类所属的第n-m级分类,m为自然数,且n-m的取值大于预设等级或等于预设等级。其中预设等级是根据实际应用而预先设定的用于关键词的默认分类的最大等级,其与现有各数据库中所配置的最大等级并不完全相同,如在本发明实施例中,最大等级的取值可以是现有各浏览器中所配置的最大等级,当然最大等级的取值也可以小于现有各浏览器中所配置的最大等级。例如现有各数据库中所配置的最大等级为第一级时,则预设等级可以为第一级或者小于第一级,若现有各浏览器中所配置的最大等级和等级的分级情况发生变化时,本发明实施例中的预设等级也可以根据变化后的最大等级和等级的分级情况而变化。

在这里需要说明的一点是:在本发明实施例中,第n级分类可以是第三级分类,第n-m级分类可以是第一级分类,之所以选用这两个等级是因为目前浏览器在显示产品时最多显示到第三级分类,而通过确定每个第三级分类所属的第一级分类是因为第一级分类下各个分类的差异性较大,通过第一级分类差异补充可以使得第三级分类的准确率提高。当然在准确率允许的情况下,第n-m级分类可以选用第二级分类。

103:根据产品数量、概要信息和第n级分类所属的第n-m级分类,计算所有第n级分类的第一总得分以及每个第n级分类的第二总得分。也就是说可以从产品数量(可以同时考虑不同级别产品的产品数量)、概要信息和第n级分类所属的第n-m级分类出发,计算所有第n级分类的第一总得分以及每个第n级分类的第二总得分。

其中,所有第n级分类的第一总得分是所有第n级分类的第二总得分之和,在计算每个第n级分类的第二总得分时可以以产品数量、概要信息和第n级分类所属的第n-m级分类为三个独立计算单元,得到产品数量对应的得分、概要信息对应的得分和第n级分类所属的第n-m级分类的得分,然后将这三个得分相加得到第二总得分或者根据这三个得分的重要程度(如可以配置权重)得到第二总得分,后续将结合流程图对第二总得分获取过程进行说明。

104:选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于第一总得分与预设权重的乘积的第n级分类为关键词的默认分类。在本发明实施例中,选取第n级分类的一种可行方式如图2所示,可以包括以下步骤:

201:根据每个第n级分类的第二总得分,对所有第n级分类进行排序,得到每个第n级分类在所有第n级分类中的排位。

202:根据每个第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类。其中预设排位是用于选取几个第n级分类为关键词的默认分类,在实际应用中可以根据实际需要,如后续输入关键词后搜索到的产品数量来设置预设排位,对其具体取值本发明实施例不加以限定。

当第n级分类在所有第n级分类中的排位是通过第二总得分得到时,则可以获取预设排位对应的第n级分类的第二总得分,相应的排位在预设排位前的多个第n级分类是指第二总得分大于预设排位对应的第n级分类的第二总得分,如预设排位对应的第n级分类的第二总得分为50(仅作为例子说明,并不限于此),则排位在预设排位前的多个第n级分类是指第二总得分大于50。

203:判断所选取的多个第n级分类的第二总得分之和是否大于第一总得分与预设权重的乘积,若是,执行步骤204;若否,执行步骤205。

与上述预设排位相同,在本发明实施例中预设权重也是用于确定选取几个第n级分类为关键词的默认分类,在实际应用中可以根据实际需要,如后续输入关键词后搜索到的产品数量来设置预设权重,例如预设权重的取值可以是20%(通过实验证明,20%可以平衡后续搜索效率和准确率),对其具体取值本发明实施例不加以限定。

当所选取的多个第n级分类的第二总得分之和大于第一总得分与预设权重的乘积时,说明所选取的多个第n级分类满足后续搜索需求,为此可以直接执行步骤204,以将所选取的多个第n级分类确定为关键词的默认分类,而若所选取的多个第n级分类的第二总得分之和小于或等于第一总得分与预设权重的乘积,则说明所选取的多个第n级分类不满足后续搜索需求,此时则执行步骤205,以增大预设排位进行重新选取。

204:将所选取的多个第n级分类确定为关键词的默认分类。

205:增大预设排位的取值,并返回执行步骤202,在返回执行步骤202时根据每个第n级分类在所有第n级分类中的排位,选取排位在增大后的预设排位前的多个第n级分类。

在这里需要说明的一点是:在本发明实施例还可以设置一预设差值,所述预设差值用于确定关键词的默认分类,其使用过程是:当所选取的多个第n级分类的第二总得分之和大于第一总得分与预设权重的乘积时,判断所选取的多个第n级分类的第二总得分之和与第一总得分与预设权重的乘积之差是否大于预设差值,若是,则减小预设排位的取值,并返回执行步骤202,以选取排位在减小预设排位前的多个第n级分类,这样可以减少关键词的默认分类的数量,以提高后续搜索效率。而在增大预设排位的取值和减小预设排位的取值时,可以以一定差值,如每次增大1和减小1来执行,当然也可以根据所选取的多个第n级分类的第二总得分之和与第一总得分与预设权重的乘积之差来设置,如若两者之差的取值较大,则可以加大两次预设排位之间的差值,若两者之差的取值较小,则可以减小两次预设排位之间的差值。

藉由上述技术方案,对于任意一个关键词来说,可以从关键词所属的每个第n级分类下的产品数量、第n级分类下的产品的概要信息和每个第n级分类所属的第n-m级分类出发,确定出关键词的默认分类,这样在基于关键词进行搜索时可以直接获取默认分类下的各个产品,提高搜索效率。并且从上述多个角度出发确定关键词的默认分类的方式相对于单一角度来说可以提高分类准确率,而相对于现有纠正方式来说无需一定数据积累,这样在数据积累未达到纠正要求时,仍可以通过准确率提高的默认分类进行搜索,提高搜索准确率。

在本发明实施例中,上述计算第n级分类的第二总得分的过程如图3所示,以产品数量、概要信息和第n级分类所属的第n-m级分类为三个独立计算单元进行计算,具体可以包括以下步骤:

301:分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分。由前所述,对于每个第n级分类来说,其下可能具有不同级别的产品,因此在得到产品得分时可以考虑产品级别,则得到产品得分的过程是:确定每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,根据每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第n级分类的产品得分,其中第一级别高于第二级别,如前所述,每个第n级分类下有特权产品和普通产品这两种级别的产品,则特权产品是第一级别产品,普通产品是第二级别产品。

下面以特权产品和普通产品为例说明如何根据每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第n级分类的产品得分:

根据特权产品的计算权重和普通产品的计算权重(特权产品的计算权重高于普通产品的计算权重),设置特权产品的产品数量和普通产品的产品数量之间的对应关系,然后再设置普通产品的得分就可以得到第n级分类的产品得分,如以1个特权产品等于50个普通产品,1个普通产品为1分的计算规则,计算出每个第n级分类的产品得分。

302:计算每个产品的概要信息与关键词的匹配得分。在本发明实施例中,计算匹配得分的一种可行方式是:根据每个产品的概要信息与关键词的匹配程度计算,如设置匹配程度与匹配得分的对应关系,在计算出概要信息与关键词的匹配程度,从对应关系中查找对应的匹配得分即可,而对于匹配程度的计算方式可以参阅现有技术,对此本发明实施例不再阐述。

在本发明实施例中,计算匹配得分的另一种可行方式是:获取每个产品在所有产品中的排序,根据每个产品在所有产品中的排序来计算匹配得分。如可以根据每个产品的销售情况或点击情况得到每个产品在所有产品的排序,并根据由前到后的方式依次减小相对应排序中的产品的匹配得分,如:

排名第1:匹配得分为100分;

排名2~5:匹配得分为90分/个;

排名6~10:匹配得分为80分/个;

排名11~20:匹配得分为70分/个;

排名21~50:匹配得分为60分/个;

排名51~100:匹配得分为50分/个;

排名101~200:匹配得分为40分/个;

……

排名e(最后一个):匹配得分为0分/个。

在这里指出的一点是:计算每个产品的匹配得分会降低处理效率,为此本发明实施例中会选取部分产品来计算匹配得分,也就是说会选取部分产品的概要信息,如根据每个第n级分类的产品得分,从所获取的所有第n级分类中选取t个第n级分类,进而获取t个第n级分类下的产品的概要信息,t为自然数。在根据每个第n级分类的产品得分,从所获取的所有第n级分类中选取t个第n级分类时,所选取的t个第n级分类的产品得分大于未选取的t个第n级分类的产品得分,以得到与关键词相关程度更高的第n级分类。

303:计算每个第n-m级分类的分类得分。在本发明实施例中,计算分类得分的一种可行方式是:获取每个第n-m级分类下与关键词匹配的产品的产品数量,根据产品数量得到分类得分,如设置产品数量与分类得分的对应关系,在获取到第n-m级分类下与关键词匹配的产品的产品数量,从对应关系中查找对应的分类得分即可。

在本发明实施例中,计算分类得分的另一种可行方式是:获取每个第n-m级分类在所有第n-m级分类中的排序,根据每个第n-m级分类在所有第n-m级分类中的排序来计算分类得分。如可以根据每个第n-m级分类下产品的销售情况或点击情况得到每个第n-m级分类在所有第n-m级分类的排序,并根据由前到后的方式依次减小相对应排序中的第n-m级分类的分类得分,如可以采用下述举例,但不限于下述举例:

当第n-m级分类的分类数量≤5时;

排名第一的第n-m级分类:分类得分为1000分;

排名第二的第n-m级分类:分类得分为500分;

排名第三的第n-m级分类:分类得分为300分;

排名第四的第n-m级分类:分类得分为200分;

排名第五的第n-m级分类:分类得分为100分。

当第n-m级分类的分类数量>5时;

排名第一的第n-m级分类:分类得分为1000分;

排名第二的第n-m级分类:分类得分为500分;

排名第三的第n-m级分类:分类得分为300分;

排名第四的第n-m级分类:分类得分为200分;

排名第五的第n-m级分类:分类得分为100分;

排名第六的第n-m级分类:分类得分为100分;

……

排名第f(最后一位)的第n-m级分类:分类得分为100分。

304:根据产品得分、匹配得分和分类得分,得到所有第n级分类的第一总得分以及每个第n级分类的第二总得分。例如可以直接将某个第n级分类的产品得分、匹配得分和分类得分相加得到这个第n级分类的第二总得分或者为这三个得分配置不同的权重,如产品得分的权重为20%、匹配得分的权重为40%、分类得分的权重为40%,然后根据公式a*20%+b*40%+c*40%得到第二总得分,其中a为产品得分,b为匹配得分,c为分类得分。在得到每个第n级分类的第二总得分之后,将这些第二总得分进行加和计算,得到所有第n级分类的第一总得分。

对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。

与上述方法实施例相对应,本发明实施例还提供一种关键词分类装置,用于提高搜索效率和搜索准确率,其结构示意图如图4所示,可以包括:获取单元11、确定单元12、计算单元13和选取单元14。

获取单元11,用于获取关键词所属的每个第n级分类下的产品数量以及获取第n级分类下的产品的概要信息,n为自然数。可以理解的是:本发明实施例以关键词所属的每个第n级分类为独立单位,获取每个第n级分类下的产品数量以及每个第n级分类下的每个产品的概要信息。

在实际生产过程中可能会生成不同级别的产品,如特权产品和普通产品,因此本发明实施例可以分别获取每个第n级分类下的特权产品的产品数量和每个第n级分类下的普通产品的产品数量,其中特权产品是至少以更先进方式显示和更先进技术生产的产品,普通产品则是以一般技术生产的产品,因此特权产品的级别高于普通产品的级别。

对于每个产品来说,在将产品对外公布时需要为每个产品设置对应的概要信息,以通过这个概要信息可以与对应的关键词进行匹配,其中概要信息是对产品的简要说明,至少用于指示产品的类型、功能和材质等等,概要信息具体包括哪些内容本发明实施例不再一一列举。

确定单元12,用于确定每个第n级分类所属的第n-m级分类,m为自然数,且n-m的取值大于预设等级或等于预设等级。

其中预设等级是根据实际应用而预先设定的用于关键词的默认分类的最大等级,其与现有各数据库中所配置的最大等级并不完全相同,如在本发明实施例中,最大等级的取值可以是现有各浏览器中所配置的最大等级,当然最大等级的取值也可以小于现有各浏览器中所配置的最大等级。例如现有各数据库中所配置的最大等级为第一级时,则预设等级可以为第一级或者小于第一级,若现有各浏览器中所配置的最大等级和等级的分级情况发生变化时,本发明实施例中的预设等级也可以根据变化后的最大等级和等级的分级情况而变化。

在这里需要说明的一点是:在本发明实施例中,第n级分类可以是第三级分类,第n-m级分类可以是第一级分类,之所以选用这两个等级是因为目前浏览器在显示产品时最多显示到第三级分类,而通过确定每个第三级分类所属的第一级分类是因为第一级分类下各个分类的差异性较大,通过第一级分类差异补充可以使得第三级分类的准确率提高。当然在准确率允许的情况下,第n-m级分类可以选用第二级分类。

计算单元13,用于根据产品数量、概要信息和第n级分类所属的第n-m级分类,计算所有第n级分类的第一总得分以及每个第n级分类的第二总得分。也就是说可以从产品数量(可以同时考虑不同级别产品的产品数量)、概要信息和第n级分类所属的第n-m级分类出发,计算所有第n级分类的第一总得分以及每个第n级分类的第二总得分。

其中,所有第n级分类的第一总得分是所有第n级分类的第二总得分之和,在计算每个第n级分类的第二总得分时可以以产品数量、概要信息和第n级分类所属的第n-m级分类为三个独立计算单元,得到产品数量对应的得分、概要信息对应的得分和第n级分类所属的第n-m级分类的得分,然后根据这三个得分得到第二总得分,相对应的计算单元13的结构示意图如图5所示,可以包括:第一计算子单元131、第二计算子单元132和第三计算子单元133。

第一计算子单元131,用于分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分。由前所述,对于每个第n级分类来说,其下可能具有不同级别的产品,因此在得到产品得分时可以考虑产品级别,则得到产品得分的过程是:确定每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,根据每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第n级分类的产品得分,其中第一级别高于第二级别,如前所述,每个第n级分类下有特权产品和普通产品这两种级别的产品,则特权产品是第一级别产品,普通产品是第二级别产品。

第二计算子单元132,用于计算每个产品的概要信息与关键词的匹配得分以及计算每个第n-m级分类的分类得分。

第三计算子单元133,用于根据产品得分、匹配得分和分类得分,得到所有第n级分类的第一总得分以及每个第n级分类的第二总得分。

对于第二计算子单元132和第三计算子单元133来说,其计算各个得分的过程请参阅方法实施例中的相关说明,对此本发明实施例不再阐述。

在这里指出的一点是:计算每个产品的匹配得分会降低处理效率,为此本发明实施例中会选取部分产品来计算匹配得分,也就是说获取单元11会选取部分产品的概要信息,如根据每个第n级分类的产品得分,从所获取的所有第n级分类中选取t个第n级分类,进而获取t个第n级分类下的产品的概要信息,t为自然数。在根据每个第n级分类的产品得分,从所获取的所有第n级分类中选取t个第n级分类时,所选取的t个第n级分类的产品得分大于未选取的t个第n级分类的产品得分,以得到与关键词相关程度更高的第n级分类。

选取单元14,用于选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于第一总得分与预设权重的乘积的第n级分类为关键词的默认分类。在本发明实施例中,选取单元14的结构示意图如图6所示,可以包括:排序子单元141、选取子单元142和判断子单元143。

排序子单元141,用于根据每个第n级分类的第二总得分,对所有第n级分类进行排序,得到每个第n级分类在所有第n级分类中的排位。其中预设排位是用于选取几个第n级分类为关键词的默认分类,在实际应用中可以根据实际需要,如后续输入关键词后搜索到的产品数量来设置预设排位,对其具体取值本发明实施例不加以限定。

当第n级分类在所有第n级分类中的排位是通过第二总得分得到时,则可以获取预设排位对应的第n级分类的第二总得分,相应的排位在预设排位前的多个第n级分类是指第二总得分大于预设排位对应的第n级分类的第二总得分,如预设排位对应的第n级分类的第二总得分为50(仅作为例子说明,并不限于此),则排位在预设排位前的多个第n级分类是指第二总得分大于50。

选取子单元142,用于根据每个第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类。

判断子单元143,用于判断所选取的多个第n级分类的第二总得分之和是否大于第一总得分与预设权重的乘积,若是,则触发选取子单元142将所选取的多个第n级分类确定为关键词的默认分类,若否,则触发选取子单元142增大预设排位的取值,并触发选取子单元142根据每个第n级分类在所有第n级分类中的排位,选取排位在增大后的预设排位前的多个第n级分类。

与上述预设排位相同,在本发明实施例中预设权重也是用于确定选取几个第n级分类为关键词的默认分类,在实际应用中可以根据实际需要,如后续输入关键词后搜索到的产品数量来设置预设权重,例如预设权重的取值可以是20%(通过实验证明,20%可以平衡后续搜索效率和准确率),对其具体取值本发明实施例不加以限定。

当所选取的多个第n级分类的第二总得分之和大于第一总得分与预设权重的乘积时,说明所选取的多个第n级分类满足后续搜索需求,为此可以直接触发选取子单元142将所选取的多个第n级分类确定为关键词的默认分类,而若所选取的多个第n级分类的第二总得分之和小于或等于第一总得分与预设权重的乘积,则说明所选取的多个第n级分类不满足后续搜索需求,此时则触发选取子单元142增大预设排位,并进行重新选取。

藉由上述技术方案,对于任意一个关键词来说,可以从关键词所属的每个第n级分类下的产品数量、第n级分类下的产品的概要信息和每个第n级分类所属的第n-m级分类出发,确定出关键词的默认分类,这样在基于关键词进行搜索时可以直接获取默认分类下的各个产品,提高搜索效率。并且从上述多个角度出发确定关键词的默认分类的方式相对于单一角度来说可以提高分类准确率,而相对于现有纠正方式来说无需一定数据积累,这样在数据积累未达到纠正要求时,仍可以通过准确率提高的默认分类进行搜索,提高搜索准确率。

本发明实施例提供一种设备,所述设备可以是服务器、pc、pad、手机等,其中设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取关键词所属的每个第n级分类下的产品数量以及获取所述第n级分类下的产品的概要信息,所述n为自然数;

确定每个第n级分类所属的第n-m级分类,所述m为自然数,且n-m的取值大于预设等级或等于预设等级;

根据所述产品数量、所述概要信息和所述第n级分类所属的第n-m级分类,计算所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分;

选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第n级分类为所述关键词的默认分类。

优选地,所述根据所述产品数量、所述概要信息和所述第n级分类所属的第n-m级分类,计算所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分,包括:

分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分;

计算每个所述产品的概要信息与所述关键词的匹配得分以及计算每个第n-m级分类的分类得分;

根据所述产品得分、所述匹配得分和所述分类得分,得到所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分。

优选地,所述获取所述第n级分类下的产品的概要信息,包括:

根据每个所述第n级分类的产品得分,从所获取的所有第n级分类中选取t个所述第n级分类,所述t为自然数;

获取所述t个所述第n级分类下的产品的概要信息。

优选地,所述分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分,包括:

确定每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,第一级别高于第二级别;

根据每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第n级分类的产品得分。

优选地,所述选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第n级分类为所述关键词的默认分类,包括:

根据每个所述第n级分类的第二总得分,对所有所述第n级分类进行排序,得到每个所述第n级分类在所有第n级分类中的排位;

根据每个所述第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类;

判断所选取的多个第n级分类的第二总得分之和是否大于所述第一总得分与预设权重的乘积,若是,则将所选取的多个第n级分类确定为所述关键词的默认分类,若否,则增大所述预设排位的取值,返回执行所述根据每个所述第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类。

本发明实施例还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取关键词所属的每个第n级分类下的产品数量以及获取所述第n级分类下的产品的概要信息,所述n为自然数;

确定每个第n级分类所属的第n-m级分类,所述m为自然数,且n-m的取值大于预设等级或等于预设等级;

根据所述产品数量、所述概要信息和所述第n级分类所属的第n-m级分类,计算所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分;

选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第n级分类为所述关键词的默认分类。

优选地,所述根据所述产品数量、所述概要信息和所述第n级分类所属的第n-m级分类,计算所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分,包括:

分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分;

计算每个所述产品的概要信息与所述关键词的匹配得分以及计算每个第n-m级分类的分类得分;

根据所述产品得分、所述匹配得分和所述分类得分,得到所有所述第n级分类的第一总得分以及每个所述第n级分类的第二总得分。

优选地,所述获取所述第n级分类下的产品的概要信息,包括:

根据每个所述第n级分类的产品得分,从所获取的所有第n级分类中选取t个所述第n级分类,所述t为自然数;

获取所述t个所述第n级分类下的产品的概要信息。

优选地,所述分别根据每个第n级分类下的产品数量,得到对应的第n级分类的产品得分,包括:

确定每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,第一级别高于第二级别;

根据每个第n级分类下的第一级别产品的产品数量以及第二级别产品的产品数量,得到对应的第n级分类的产品得分。

优选地,所述选取第二总得分大于其他第n级分类的第二总得分,且所选取的所有第n级分类的第二总得分之和大于所述第一总得分与预设权重的乘积的第n级分类为所述关键词的默认分类,包括:

根据每个所述第n级分类的第二总得分,对所有所述第n级分类进行排序,得到每个所述第n级分类在所有第n级分类中的排位;

根据每个所述第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类;

判断所选取的多个第n级分类的第二总得分之和是否大于所述第一总得分与预设权重的乘积,若是,则将所选取的多个第n级分类确定为所述关键词的默认分类,若否,则增大所述预设排位的取值,返回执行所述根据每个所述第n级分类在所有第n级分类中的排位,选取排位在预设排位前的多个第n级分类。

对于本发明实施例提供的设备和计算机程序产品来说,其每个步骤的解释和可行方式请参阅方法实施例中的相关说明,对此本发明实施例不再阐述。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1