一种搜索语句处理方法与流程

文档序号:19155607发布日期:2019-11-16 00:43阅读:178来源:国知局
一种搜索语句处理方法与流程

【技术领域】

本发明属于搜索引擎领域,尤其涉及一种搜索语句处理方法。



背景技术:

在进行信息搜索时,搜索引擎根据搜索词从数据库中查询出页面形式的搜索结果后,并不立即将搜索结果向用户展示,而是以搜索结果与搜索词之间的相关性为依据,按照相关性由高至低的顺序对搜索结果进行排序,并将排序后的搜索结果向用户展示,这种将与搜索词之间的相关性作为排序依据的操作称之为依据基础权值进行排序的操作。但是现有技术中的搜索方案并不能反映用户的搜索需求,仍然存在搜索效率低,导致搜索过程占用的系统资源过多的问题。基于上述诸多问题,现在亟需一种新的搜索语句处理方法,本发明能够从搜索语句本身出发来进行搜索效率的提高,对原始的搜索语句进行个性化的处理,在个性化处理的过程中多维度的考虑用户本身的特性,从而获取优化的搜索语句,能够真正的反映用户本身的需求,大大的提高了搜索效率,减少了系统资源的消耗。



技术实现要素:

为了解决现有技术中的上述问题,本发明提出了一种搜索语句处理方法,该方法包括如下步骤:

s1:从搜索语句中提取搜索词队列;

s2:基于用户搜索日志获取用户搜索词队列;

s3:对搜索词队列进行补充以获取补充搜索词队列用于搜索。

进一步的,所述步骤s2具体为,基于用户参数确定约定时间长度,基于所述用户搜索日志,获取约定时间长度内的用户搜索词队列。

进一步的,所述基于用户参数确定约定时间长度,具体为:获取用户参数,基于第一用户参数获取和所述第一用户参数对应的基准约定时间长度;基于第二用户参数对基准约定时间长度进行调整以获取约定时间长度。

进一步的,所述基于第一用户参数获取和所述第一用户参数对应的基准约定时间长度,具体为:基于所述第一用户参数的参数值查找所述关联关系,并获取所有第一用户参数均一致的关联关系条目中的基准约定时间长度。

进一步的,所述所有第一用户参数均一致,具体为:所有第一用户参数的参数值均完全相等或第一用户参数的参数值大致相等。

进一步的,所述第一用户参数的参数值大致相等,具体为:第一用户参数的一部分完全相等而另一部分大致相等。

进一步的,所述大致相等,具体为:第一用户参数的参数值和关联关系条目中对应参数的参数值之间的差异值的绝对值在预设范围内。

进一步的,将所述关联关系以关联关系表的形式保存在第三方服务器上。

本发明的有益效果包括:能够从搜索语句本身出发来进行搜索效率的提高,对原始的搜索语句进行个性化的处理,在个性化处理的过程中多维度的考虑用户本身的特性,从而获取优化的搜索语句,能够真正的反映用户本身的需求,大大的提高了搜索效率,减少了系统资源的消耗。

【附图说明】

此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:

图1是本发明的搜索语句处理方法的流程图。

【具体实施方式】

下面将结合附图以及具体实施例来详细说明本发明,其中的示意性实施例以及说明仅用来解释本发明,但并不作为对本发明的限定。

对本发明所应用的一种搜索语句处理方法进行详细说明,所述方法包含下述步骤:

s1:从用户搜索语句中提取搜索词队列,具体的:将搜索语句内容中包含的一个或多个搜索词按照其在搜索语句中出现的先后顺序存放到搜索词队列中以构成搜索词队列;

所述在搜索语句中出现的先后顺序,具体为:在搜索语句中规定的语法结构中出现的先后顺序;例如:主谓宾顺序等

s2:基于用户搜索日志获取用户搜索词队列,具体的:基于用户参数确定约定时间长度,基于所述用户搜索日志,获取约定时间长度内的用户搜索词队列;

优选的:所述用户搜索日志中包含多个用户搜索语句及其对应的用户搜索词队列;

所述基于用户参数确定约定时间长度,具体为:获取用户参数,基于第一用户参数获取和所述第一用户参数对应的基准约定时间长度;基于第二用户参数对基准约定时间长度进行调整以获取约定时间长度;

所述基于第一用户参数获取和所述第一用户参数对应的基准约定时间长度,具体为:第一用户参数包括:岁数,性别,所在地;预先保存第一用户参数和基准约定时间长度之间的关联关系;基于所述第一用户参数的参数值查找所述关联关系,并获取所有第一用户参数均一致的关联关系条目中的基准约定时间长度;

所述所有第一用户参数均一致,具体为:所有第一用户参数的参数值均完全相等或第一用户参数的参数值大致相等;

所述第一用户参数的参数值大致相等,具体为:第一用户参数的一部分完全相等而另一部分大致相等;优选的:所述一部分为性别和所在地,另一部分为岁数;

所述大致相等,具体为:第一用户参数的参数值和关联关系条目中对应参数的参数值之间的差异值的绝对值在预设范围内;所述预设范围为用户指定;通过对所述预设范围的调整来增加或者减少调整的范围;例如;用户主要参数为32岁,而关联关系条目中对应的参数值为31,预设范围为1岁,则所述用户主要参数的参数值大致相等,从而所述第一用户参数的参数值大致相等;

优选的:将所述关联关系保存在云服务器上;所述关联关系基于大数据统计分析获取;

优选的:将所述关联关系以关联关系表的形式保存在第三方服务器上;

优选的:将所述关联关系保存在分布式数据库中;

优选的:将所述关联关系按照用户的所在地保存在不同的物理服务器上;

所述基于第二用户参数对约定时间长度进行调整,具体为:所述第二用户参数包括:用户日均查询次数n,用户日均上网时长t,用户网龄a;获取所述基准约定时间长度bst,通过下式计算所述约定时间长度st;

其中:bs_t为日均上网时长调整值,bs_a为用户网龄调整值;

优选的:所述调整值为根据当年的网民上网情况的大数据分析获取;

s3:对搜索词队列进行补充以获取补充搜索词队列;具体的:基于约定时间长度内的用户搜索词队列对搜索词队列进行补充;

所述基于约定时间长度内的用户搜索词队列对搜索词队列进行补充,具体为:获取完全包含所述搜索词队列中的所有搜索词的用户搜索词队列,从所述用户搜索词队列中选择长度最长的用户搜索词队列,基于所述长度最长的用户搜索词队列对所述搜索词队列进行补充以生成补充搜索队列;

所述基于所述长度最长的用户搜索词队列对所述搜索词队列进行补充,具体为:将未包含在所述搜索词队列中而包含在所述长度最长的用户搜索词队列中的搜索词补充到所述搜索词队列中的队尾部分;

s4:基于所述补充搜索队列进行搜索。

以上所述仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1