一种检索词调整方法与流程

文档序号:15999340发布日期:2018-11-20 19:15阅读:415来源:国知局

本发明属于数据检索领域,尤其涉及一种检索词调整方法。



背景技术:

资源聚合的数据库中存放了大量的从各个来源收集到的影片信息,用户采用浏览的方式很难快速定位到特定的资源。采用搜索的方式可以较好的解决这一问题,用户只需提供自己已知的各种关键字,如影片名,演员名,导演名甚至影片中角色的名字,由搜索引擎代为找到对应的资源。搜索引擎的作用是帮助用户从海量的数据中检索满足需求的数据,为用户提供更好的数据推荐展现。传统的搜索仅根据关键字的匹配进行检索,检索得到的结果数量很多,不方便用户快速从中选择需要的数据,给用户操作带来不便。基于上述诸多问题,现在亟需一种新的检索词调整方法,本发明能够借助对大量的用户检索词组合的分析,对当前用户输入的用户检索词组合进行纠正,从而可以匹配出最接近的检索词及其检索词组合,用户根据自己需要选择相应的检索结果,此外,还具有简单、快捷,效率高的优点。



技术实现要素:

为了解决现有技术中的上述问题,本发明提出了一种检索词调整方法,该方法包括如下步骤:

S1:对有序检索词组合进行处理以获取最终有序检索词组合;

S2:将最终有序检索词组合输入检索入口进行检索。

进一步的,所述步骤S1具体为,具体为:将所述有序检索词组合和积累组合进行比较以获取最终有序检索词组合。

进一步的,所述将所述有序检索词组合和积累组合进行比较以获取最终有序检索词组合,具体为:计算有序检索词组合和积累组合的积累相似度,如果存在一积累组合,其和有序检索词组合之间的积累相似度大于相似度阈值,则基于所述一积累组合对有序检索词组合进行纠正。

进一步的,所述计算有序检索词组合和积累组合的积累相似度,具体为:对于每个积累组合,获取所述积累组合中和所述有序检索词组合所包含的相同检索词的个数,将所述个数和有序检索词组合中所有检索词的个数的比值作为所述积累相似度。

进一步的,所述相似度阈值为99%。

进一步的,当大于第一相似度阈值的积累组合的个数为多个时,随机选择一个积累组合作为所选择的一个积累组合。

进一步的,当大于第一相似度阈值的积累组合的个数为多个时,选择使用次数最多的积累组合作为所选择的一个积累组合。

进一步的,所述基于所述一积累组合对有序检索词组合进行纠正,具体为:如果有序检索词组合中检索词的个数小于等于所述一积累组合中检索词的个数,则不进行纠正;否则,在所述一积累组合中选择一检索词加入所述有序检索词组合中。

本发明的有益效果包括:能够借助对大量的用户检索词组合的分析,对当前用户输入的用户检索词组合进行纠正,从而可以匹配出最接近的检索词及其检索词组合,用户根据自己需要选择相应的检索结果,此外,还具有简单、快捷,效率高的优点。

【附图说明】

此处所说明的附图是用来提供对本发明的进一步理解,构成本申请的一部分,但并不构成对本发明的不当限定,在附图中:

图1是本发明的检索词调整方法的流程图。

【具体实施方式】

下面将结合附图以及具体实施例来详细说明本发明,其中的示意性实施例以及说明仅用来解释本发明,但并不作为对本发明的限定。

对本发明所应用的一种检索词调整方法进行详细说明,所述方法包含下述步骤:

S1:从用户检索请求中提取有序检索词组合,具体的:将检索请求内容中包含的一个或多个检索词按照其在检索请求中出现的先后顺序存放到检索词组合中以构成有序检索词组合;

S2:对有序检索词组合进行处理,以获取最终有序检索词组合;具体为:将所述有序检索词组合和积累组合进行比较以获取最终有序检索词组合;

所述将所述有序检索词组合和积累组合进行比较以获取最终有序检索词组合,具体为:计算有序检索词组合和积累组合的积累相似度,如果存在一积累组合,其和有序检索词组合之间的积累相似度大于相似度阈值,则基于所述一积累组合对有序检索词组合进行纠正;

所述计算有序检索词组合和积累组合的积累相似度,具体为:对于每个积累组合,获取所述积累组合中和所述有序检索词组合所包含的相同检索词的个数,将所述个数和有序检索词组合中所有检索词的个数的比值作为所述积累相似度;

优选的:所述相似度阈值为99%;

优选的:当大于第一相似度阈值的积累组合的个数为多个时,随机选择一个积累组合作为所选择的一个积累组合;

优选的:当大于第一相似度阈值的积累组合的个数为多个时,选择使用次数最多的积累组合作为所选择的一个积累组合;

所述基于所述一积累组合对有序检索词组合进行纠正,具体为:如果有序检索词组合中检索词的个数小于等于所述一积累组合中检索词的个数,则不进行纠正;否则,在所述一积累组合中选择一检索词加入所述有序检索词组合中;

所述选择一检索词加入所述积累组合中,具体为:在所述一积累组合中包含的相同检索词相邻的所有检索词中,选择排序最靠前的相邻检索词作为所选择的检索词;将所述所选择的检索词放入所述有序检索词组合中尾部的位置;

可替换的:当所述有序检索词组合中检索词的个数多于个数阈值时,将所述所选择的检索词放入所述有序检索词组合中首部的位置;

所述个数阈值为预设值;

当检索词本身很多时,通过将检索词放入首部的位置,加强对用户输入的检索词的调整力度;

优选的:所述积累组合为基于大数据获取,通过对多用户检索请求进行分析,将预定时间长度内出现次数较多的有序检索词组合作为积累组合;

优选的:所述积累组合的个数为一个或多个;

其中:预定时间长度为用户设置或者根据用户的检索偏好设置;

所述根据用户的检索偏好设置,具体为:当判断用户为年轻用户时,将所述预定时间长度设置为第一时间长度,当判断用户为年老用户时,将所述预定时间长度设置为第三时间长度,否则,将所述预定时间长度设置为第二时间长度;其中:第一时间长度小于第二时间长度,第二时间长度小于第三时间长度;

优选的:所述年轻用户的焦点转移较快;所述年老为焦点转移很慢,焦点具有怀旧情绪;

S3:将所述最终有序检索词组合输入检索入口进行检索。

以上所述仅是本发明的较佳实施方式,故凡依本发明专利申请范围所述的构造、特征及原理所做的等效变化或修饰,均包括于本发明专利申请范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1