一种扩大商品搜索召回的方法及装置与流程

文档序号:17927070发布日期:2019-06-15 00:29阅读:331来源:国知局
一种扩大商品搜索召回的方法及装置与流程

本发明涉及网络搜索技术领域,特别涉及一种扩大商品搜索召回的方法及装置。



背景技术:

随着互联网的普及以及电子商务的迅速发展,电子商务的应用对人们产生越来越大的作用,其中最为突出的是,人们进行网络购物,网络购物属于网络交易,在电子商务中占据极其重要的地位。互联网用户在进行网络购物时必然会先搜索自己想要购买或者感兴趣的商品,并通过电子商务搜索系统得出搜索结果,进而对所搜索到的不同商品进行筛选及对比,挑选其中最合心意或者需要的商品进行购买。

目前行业商品搜索做法通常是针对多个词语的倒排索引找到待检测的多个商品列表,通过多路求交集的方式获取符合所有查询条件的商品集合。

但是对于中小型电子商务企业来说,当商品库总数比较少时,上述做法的缺点是:符合所有查询条件的召回结果比较少,但满足部分查询条件的潜在候选商品集合比较多。从用户的角度看,心理意图与搜索请求之间存在一定偏差,期望最终找到商品,可能需要多次更改搜索请求,体验不好;从商家的角度看,意味着候选商品曝光机会少,间接影响电商平台收益。



技术实现要素:

为了解决现有技术的问题,本发明实施例提供了一种扩大商品搜索召回的方法及装置,以克服现有技术中的符合所有查询条件的召回结果比较少,但满足部分查询条件的潜在候选商品集合比较多,影响展示效果,导致用户体验不好以及候选商品曝光机会少,间接影响电商平台收益等问题。

为解决上述技术问题,本发明采用的技术方案是:

一方面,提供了一种扩大商品搜索召回的方法,所述方法包括如下步骤:

s1:获取搜索请求,根据所述搜索请求中的词匹配关联词;

s2:将所述搜索请求中的词以及所述关联词按照预设的规则拼装成检索单元;

s3:根据所述检索单元匹配商品,获取商品召回结果;

s4:对所述商品召回结果进行分类,其中,分类包括精准召回商品和模糊召回商品;

s5:将搜索展示区划分为精准展示区和模糊展示区,分别展示精准召回商品和模糊召回商品。

进一步的,所述步骤s1包括:

获取所述搜索请求中的词的同义词以及近义词作为关联词;和/或,

根据前台导航分类“键-值”对字典,选取与所述搜索请求属于同分类商品的属性作为关联词;和/或,

将所述搜索请求中的物品词与前台导航分类进行文本匹配,将分类关键字作为关联词;和/或,

获取商品库中相关商品的标签,根据所述标签以及所述搜索请求,将相关的商品标签作为关联词;和/或,

获取搜索引擎的商品点击日志,根据所述搜索请求的共现规律,选取关联词。

进一步的,所述步骤s2具体包括:

判断所述搜索请求是否是单个词,若是,则按单个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成独立检索单元,否则,按照多个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成组合检索单元。

进一步的,所述单个词拼装检索单元的规则包括:

预设关联词数量的上限,获取符合所述上限的关联词,将所述搜索请求中的词与所述关联词按照与的关系进行组合,拼装成独立检索单元。

进一步的,所述单个词拼装检索单元的规则还包括:

若是所述关联词是所述搜索请求中的词的同义词和/或近义词,则所述关联词与所述搜索请求中的词以及其他关联词按照或的关系进行组合。

进一步的,所述多个词拼装检索单元的规则包括:

根据所述搜索请求的长度和所述搜索请求包含的多个词判断是否触发召回,若是,先将所述搜索请求中的每个词按照单个词拼装检索单元的规则拼装成独立检索单元后,再将独立检索单元按照与的关系进行组合,拼装成组合检索单元。

进一步的,所述多个词拼装检索单元的规则还包括:

判断所述搜索请求包含的多个词是核心词还是非核心词,若是非核心词,则将所述非核心词拼装成的独立检索单元与其他独立检索单元按照或的关系进行组合。

进一步的,所述步骤s3还包括:

若是所述搜索请求不是单个词,当商品命中的都是所述关联词时,该商品不应该被召回,若是所述搜索请求是单个词,则该商品可以被召回。

进一步的,所述步骤s4包括:

当所述搜索请求中的词或所述关联词中的同义词均被商品命中时,将该商品划分为精准召回商品;

当所述搜索请求中的词或所述关联词中的同义词没有均被商品命中,但是所述搜索请求中的核心词均被商品命中时,将该商品划分为模糊召回商品;

当只有所述关联词被商品命中时,若是所述搜索请求是单个词,则将该商品划分为模糊召回商品,若是所述搜索请求是多个词,则将该商品丢弃。

另一方面,提供了一种扩大商品搜索召回的装置,所述装置包括:

扩展模块,用于获取搜索请求,根据所述搜索请求中的词匹配关联词;

拼装模块,用于将所述搜索请求中的词以及所述关联词按照预设的规则拼装成检索单元;

召回模块,用于根据所述检索单元匹配商品,获取商品召回结果;

划分模块,用于对所述商品召回结果进行分类,其中,分类包括精准召回商品和模糊召回商品;

展示模块,用于将搜索展示区划分为精准展示区和模糊展示区,分别展示精准召回商品和模糊召回商品。

进一步的,所述拼装模块包括:

判断单元,用于判断所述搜索请求是否是单个词;

拼接单元,用于按单个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成独立检索单元或按照多个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成组合检索单元。

进一步的,所述划分模块包括:

分析单元,用于分析所述搜索请求中的词和所述关联词被商品命中情况;

分类单元,用户根据所述搜索请求中的词和所述关联词被商品命中情况,将该商品划分为精准召回商品或模糊召回商品。

本发明实施例提供的技术方案带来的有益效果是:

1、本发明提供的扩大商品搜索召回的方法及装置,通过按照预设规则为搜索请求配置不同的关联词,提高检索效率,适用于精确召回少但扩展词有较多商品召回的场景,能够在保证相关性的要求下,保证精准召回结果的展示效果,增大关联商品的曝光机会,整体提高单品转化率;

2、本发明提供的扩大商品搜索召回的方法及装置,通过在页面上分割展示精准结果与关联商品结果,一方面,减少了用户查询次数,能更快地找到期望商品,另一方面,增大了候选商品的曝光几率,间接提高电商平台收益。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是根据一示例性实施例示出的扩大商品搜索召回的方法的流程图;

图2是根据一示例性实施例示出的按单个词拼装检索单元的规则将搜索请求中的词和关联词拼装成独立检索单元的流程图;

图3是根据一示例性实施例示出的按照多个词拼装检索单元的规则将搜索请求中的词和关联词拼装成组合检索单元的流程图;

图4是根据一示例性实施例示出的扩大商品搜索召回的装置结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图1是根据一示例性实施例示出的扩大商品搜索召回的方法的流程图,参照图1所示,该方法包括如下步骤:

s1:获取搜索请求,根据所述搜索请求中的词匹配关联词。

具体的,搜索请求是指用户输入到搜索框内的query,其中,搜索请求(即query)可以是单个词组成,也可以是由多个词组成。获取到用户的搜索请求后,根据搜索请求中的每个词进行关联词匹配。这里需要说明的是,本发明实施例中的关联词包括搜索请求中的词的同义词、近义词、扩展词以及同义词的扩展词、近义词的扩展词等中的一种或多种。

作为一种较优的实施方式,本发明实施例中,根据所述搜索请求中的词匹配关联词包括:

获取所述搜索请求中的词的同义词以及近义词作为关联词;和/或,

根据前台导航分类“键-值”对字典,选取与所述搜索请求属于同分类商品的属性作为关联词;和/或,

将所述搜索请求中的物品词与前台导航分类进行文本匹配,将分类关键字作为关联词;和/或,

获取商品库中相关商品的标签,根据所述标签以及所述搜索请求,将相关的商品标签作为关联词;和/或,

获取搜索引擎的商品点击日志,根据所述搜索请求的共现规律,选取关联词。

具体的,本发明实施例中,匹配关联词时,首选搜索请求中的词的同义词以及近义词。前台导航分类是指电商平台首页左侧的导航栏内的导航分内,将与搜索请求涉及的商品属于同一分类商品的属性作为关联词。这里需要说明的是,选择属于同一分类商品的属性作为关联词,可以保证回召的商品与用户意图搜索的商品具有相关性,能够在保证相关商品曝光率的同时保证用户体验。另外,还可以将搜索请求中的物品词与前台导航分类进行文本匹配,将分类关键字作为关联词。以及获取商品库中相关商品的标签,根据标签以及搜索请求,将商品库中与搜索请求涉及的商品相关的商品的标签作为关联词。这里需要说明的是,本发明实施例中,还包括获取搜索引擎中的商品点击日志,然后根据搜索请求中的词的共现规律,选取扩展词作为关联词。比如搜索“苹果”,通过分析商品点击日志,获得这些单品的标题,通过类似wordvec等方法获得“苹果”与“黑色”“白色”“64g”“128g”“联通”“移动”“定制”“行货”等存在共现的可能,然后从搜索请求中分析词的相似性和规律,下次当有用户搜索“苹果64g”的时候,“苹果128g”会作为优先的匹配选择;搜索“苹果定制”的时候,“苹果移动”会作为优先的匹配选择。

除上述几种方式之外,还可以获取搜索引擎的用户行为日志,根据用户session前后输入变化规律,确定最终搜索请求。例如,用户前后输入了多个不同的搜索请求,根据每次输入后,用户在网页上的点击情况,确定最终符合用户意图的搜索请求。

s2:将所述搜索请求中的词以及所述关联词按照预设的规则拼装成检索单元。

作为一种较优的实施方式,本发明实施例中,步骤s2具体包括:

判断所述搜索请求是否是单个词,若是,则按单个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成独立检索单元,否则,按照多个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成组合检索单元。

具体的,拼装检索单元的预设规则包括:单个词拼装检索单元的规则和多个词拼装检索单元的规则。在拼装检索单元时需先确定搜索请求中的词的数量是单个还是多个,确定好搜索请求中的词的数量后,按照相应的预设规则进行检索单元的拼装。

作为一种较优的实施方式,本发明实施例中,单个词拼装检索单元的规则包括:

预设关联词数量的上限,获取符合所述上限的关联词,将所述搜索请求中的词与所述关联词按照与的关系进行组合,拼装成独立检索单元。

具体的,首先需要对关联词的数量预先设置一个上限。然后参照图2所示,执行以下步骤:

s1.1:将所有同义词匹配为关联词;

s1.2:判断关联词的数量是否达到上限,若是,执行步骤s1.5,否则,执行步骤s1.3;

s1.3:将近义词匹配为关联词,并判断近义词匹配为关联词的过程是否完成,若是,则执行步骤s1.4,否则返回步骤s1.2;

s1.4:将扩展词匹配为关联词,并判断扩展词匹配为关联词的过程是否完成,若是,则执行步骤s1.5,否则返回步骤s1.2;

s1.5:将搜索请求中的词与关联词按照与的关系进行组合,拼装成独立检索单元。

作为一种较优的实施方式,本发明实施例中,单个词拼装检索单元的规则还包括:

若是所述关联词是所述搜索请求中的词的同义词和/或近义词,则所述关联词与所述搜索请求中的词以及其他关联词按照或的关系进行组合。

具体的,拼装独立检索单元是默认是与的关系,但是一些特殊情况除外。在本发明实施例中,同义词以及近义词与其他词的组合关系需要设定为或的关系,这样可以保证关联商品的曝光率。例如,用户输入的搜索请求为“尿不湿”,其同义词包括“纸尿裤”,若是将“纸尿裤”与其他词也按照与的关系进行组合,则商品库中一些只打了“尿不湿”或只打了“纸尿裤”标签的商品不能被召回,从而这些关联商品就不能被曝光。因此,为了保证关联商品的曝光率,需将同义词以及近义词与其他词的组合关系设定为或的关系。

作为一种较优的实施方式,本发明实施例中,多个词拼装检索单元的规则包括:

根据所述搜索请求的长度和所述搜索请求包含的多个词判断是否触发召回,若是,先将所述搜索请求中的每个词按照单个词拼装检索单元的规则拼装成独立检索单元后,再将独立检索单元按照与的关系进行组合,拼装成组合检索单元。具体的,首先需要预先对搜索请求中的不同种类的词设置不同的权重。参考标题文档中的词的分布,计算对应的反向文档值idf,这个是词的静态权重,另外参考历史搜索频次,计算出针对每个词的动态权重,然后将两者组合成这个词的权重,最后针对当前搜索请求(query)中的多个词会做权重的平衡。例如,“蜜蜂”“黑色”这两个词的静态权重,蜜蜂这个词比较稀少,静态权重高,但黑色搜索次数多,动态权重高。如果最终搜索“蜜蜂黑色手机”,蜜蜂最终会成为权重最低的,如果搜索“蜜蜂手册黑色”黑色会成为权重最低的,因此,需要对当前搜索请求(query)中的多个词做权重的平衡。然后参照图3所示,执行以下步骤:

s2.1:对搜索请求进行分词处理,获取每个词的权重和场景信息;

s2.2:根据搜索请求的长度和搜索请求包含的多个词的成分判断是否触发召回,若是,则执行步骤s2.3,否则执行步骤s2.4;

具体的,这里主要考虑是否对基础分词生成的新词进行查找的问题。比如“开啡尔”,它的长度不大于6个字节,基础分词采用词典匹配的结果为“开啡/尔”,这两个词的成分分析为无价值词,这样散开召回的文档排序有可能会乱,线上会采用主动合并为一个词的办法来召回文档。类似的词还有“厨房宝”,“虾滑”“白柚”等。s2.3:遍历搜索请求中的每个词,并判断每个词的独立检索单元拼装是否完成,若是,则执行步骤s2.7,否则执行步骤s2.5;

s2.4:选择其他预设的查询策略后执行步骤s2.7;

s2.5:对搜索请求包含的多个词进行核心词分析,将非核心词“丢弃”;

s2.6:将搜索请求中的每个词按照单个词拼装检索单元的规则拼装成独立检索单元后,返回步骤s2.3;

s2.7:将独立检索单元按照与的关系进行组合,拼装成组合检索单元。

这里需要说明的是,步骤s2.5中的“丢弃”并不是传统意义上的去除的意思,这里是指在拼装检索单元时,将非核心词与其他词的组合关系设定为或的关系。非核心词的“丢弃”需要考虑词的成分和权重,指定成分的词和权重小于其他词的加权平均时,该词才会被判定为非核心词。

作为一种较优的实施方式,本发明实施例中,多个词拼装检索单元的规则还包括:

判断所述搜索请求包含的多个词是核心词还是非核心词,若是非核心词,则将所述非核心词拼装成的独立检索单元与其他独立检索单元按照或的关系进行组合。

具体的,拼装组合检索单元也默认是与的关系,但是也有一些特殊情况除外。在本发明实施例中,为了保证关联商品的曝光率,将搜索请求中的非核心词与其他词的组合关系设定为或的关系。非核心词包括对用户实际搜索意图没有具体贡献的词。例如,用户输入的搜索请求为“黑色海尔洗衣机”,则用户的搜索请求中包括“黑色”、“海尔”、“洗衣机”三个词,而目前市场上,海尔洗衣机还没有黑色的,这里就可以将“黑色”判定为非核心词。若是按照默认规则将“黑色”与其他词按照与的关系进行组合,就会导致商品库中没有打上黑色标签的海尔洗衣机不能被召回,从而这些商品就不能被曝光。因此,同样需将非核心词与其他词设定为或的组合关系。

s3:根据所述检索单元匹配商品,获取商品召回结果。

具体的,将满足检索单元(包括独立检索单元和组合检索单元)的条件的商品召回,作为检索结果反馈给用户。若搜索请求是单个词,则当商品命中独立检索单元时,该商品可被召回,若搜索请求不是单个词,则当商品命中组合检索单元时,该商品可被召回。这里需要说明的是,若是组合检索单元中的某个独立检索单元被丢弃,则当商品命中除了该独立检索单元的其他所有独立检索单元时,该商品可被召回。例如,若是检索单元中所有词之间都是与的关系,则将命中检索单元中所有词的商品召回。

另外,商品召回逻辑还可以包括通过标签从语义上建立搜索请求中的词与商品间的映射,增加除了文本匹配之外的潜层语义召回逻辑,扩大关联商品的召回。

作为一种较优的实施方式,本发明实施例中,步骤s3还包括:

若是所述搜索请求不是单个词(即搜索请求包括多个词),当商品命中的都是所述关联词时,该商品不应该被召回,若是所述搜索请求是单个词,则该商品可以被召回。

s4:对所述商品召回结果进行分类,其中,分类包括精准召回商品和模糊召回商品。

具体的,对于部分搜索请求召回的精准结果较少而扩展结果较多时,将精准结果和扩展结果分开向用户展示,可以方便用户进行查看,同时当用户点高级筛选或二次排序时,可以避免因为扩展集的原因导致展示凌乱,降低用户体验。

作为一种较优的实施方式,本发明实施例中,步骤s4包括:

当所述搜索请求中的词或所述关联词中的同义词均被商品命中时,将该商品划分为精准召回商品;

当所述搜索请求中的词或所述关联词中的同义词没有均被商品命中,但是所述搜索请求中的核心词均被商品命中时,将该商品划分为模糊召回商品;

当只有所述关联词被商品命中时,若是所述搜索请求是单个词,则将该商品划分为模糊召回商品,若是所述搜索请求是多个词,则将该商品丢弃。

s5:将搜索展示区划分为精准展示区和模糊展示区,分别展示精准召回商品和模糊召回商品。

具体的,将展示区划分为两个独立的部分,精准展示区和模糊展示区,两者之间可以用分割线区分开来,当召回的精准结果较少而扩展结果较多时,分割线能明显地起到提示作用。

图4是根据一示例性实施例示出的扩大商品搜索召回的装置结构示意图,参照图4所示,该装置包括:

扩展模块,用于获取搜索请求,根据所述搜索请求中的词匹配关联词。

具体的,根据搜索请求中的词匹配关联词包括一下一种或多种:

获取搜索请求中的词的同义词以及近义词作为关联词;

根据前台导航分类“键-值”对字典,选取与搜索请求属于同分类商品的属性作为关联词;

将搜索请求中的物品词与前台导航分类进行文本匹配,将分类关键字作为关联词;

获取商品库中相关商品的标签,根据标签以及搜索请求,将相关的商品标签作为关联词;

获取搜索引擎的商品点击日志,根据搜索请求的共现规律,选取关联词。

拼装模块,用于将所述搜索请求中的词以及所述关联词按照预设的规则拼装成检索单元。

召回模块,用于根据所述检索单元匹配商品,获取商品召回结果。

具体的,若是搜索请求不是单个词,当商品命中的都是关联词时,该商品不应该被召回,若是搜索请求是单个词,则该商品可以被召回。

划分模块,用于对所述商品召回结果进行分类,其中,分类包括精准召回商品和模糊召回商品。

展示模块,用于将搜索展示区划分为精准展示区和模糊展示区,分别展示精准召回商品和模糊召回商品。

作为一种较优的实施方式,本发明实施例中,拼装模块包括:

判断单元,用于判断所述搜索请求是否是单个词;

拼接单元,用于按单个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成独立检索单元或按照多个词拼装检索单元的规则将所述搜索请求中的词和所述关联词拼装成组合检索单元。

具体的,单个词拼装检索单元的规则包括:

预设关联词数量的上限,获取符合上限的关联词,将搜索请求中的词与关联词按照与的关系进行组合,拼装成独立检索单元。若是关联词是搜索请求中的词的同义词和/或近义词,则关联词与搜索请求中的词以及其他关联词按照或的关系进行组合。

多个词拼装检索单元的规则包括:

根据搜索请求的长度和搜索请求包含的多个词判断是否触发召回,若是,先将搜索请求中的每个词按照单个词拼装检索单元的规则拼装成独立检索单元后,再将独立检索单元按照与的关系进行组合,拼装成组合检索单元。需要注意的是,将独立检索单元装成组合检索单元时,还需判断搜索请求包含的多个词是核心词还是非核心词,若是非核心词,则将非核心词拼装成的独立检索单元与其他独立检索单元按照或的关系进行组合。

作为一种较优的实施方式,本发明实施例中,划分模块包括:

分析单元,用于分析所述搜索请求中的词和所述关联词被商品命中情况;

分类单元,用户根据所述搜索请求中的词和所述关联词被商品命中情况,将该商品划分为精准召回商品或模糊召回商品。

具体的,可以按照下述情况对商品进行划分:

当搜索请求中的词或关联词中的同义词均被商品命中时,将该商品划分为精准召回商品;

当搜索请求中的词或关联词中的同义词没有均被商品命中,但是搜索请求中的核心词均被商品命中时,将该商品划分为模糊召回商品;

当只有关联词被商品命中时,若是搜索请求是单个词,则将该商品划分为模糊召回商品,若是搜索请求是多个词,则将该商品丢弃。

综上所述,本发明实施例提供的技术方案带来的有益效果是:

1、本发明提供的扩大商品搜索召回的方法及装置,通过按照预设规则为搜索请求配置不同的关联词,提高检索效率,适用于精确召回少但扩展词有较多商品召回的场景,能够在保证相关性的要求下,保证精准召回结果的展示效果,增大关联商品的曝光机会,整体提高单品转化率;

2、本发明提供的扩大商品搜索召回的方法及装置,通过在页面上分割展示精准结果与关联商品结果,一方面,减少了用户查询次数,能更快地找到期望商品,另一方面,增大了候选商品的曝光几率,间接提高电商平台收益。

需要说明的是:上述实施例提供的扩大商品搜索召回的装置在触发商品召回业务时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的扩大商品搜索召回的装置与扩大商品搜索召回的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1