一种搜索建议提供方法及装置的制造方法

文档序号:9217222阅读:197来源:国知局
一种搜索建议提供方法及装置的制造方法
【技术领域】
[0001]本申请涉及网络技术领域,尤其是涉及一种搜索建议提供方法及装置。
【背景技术】
[0002]搜索引擎是一种常用的信息搜索系统,通过搜索引擎等信息搜索系统,能够帮助用户搜索到需要的信息。例如,当用户在搜索网页上输入搜索词“雾霾口罩”,搜索引擎会查找出若干个与搜索词“雾霾口罩”相关的网址或者应用。
[0003]为了使得用户能够方便快捷地进行搜索,当用户输入搜索词后,会自动生成若干个与搜索词相关的搜索建议提供给用户选择。目前,在生成搜索建议时,主要是基于该用户的历史搜索,例如,用户之前曾经搜索过“雾霾口罩价格”,“雾霾口罩型号”等词,则在用户输入“雾霾口罩”后,搜索网页上将通过自动下拉栏等方式提供“雾霾口罩价格”、“雾霾口罩型号”等搜索建议供用户选择。
[0004]然而,在这种基于搜索历史提供搜索建议的方式中,显然搜索建议可供选择的范围比较小,用户往往需要多次搜索才能获得所需的内容,耗费的时间和流量较多。

【发明内容】

[0005]本申请解决的技术问题在于提供一种搜索建议提供方法及装置,以实现增大提供的搜索建议的选择范围,从而减少用户搜索次数,进一步减少搜索耗费的时间和流量。
[0006]为此,本申请解决技术问题的技术方案是:
[0007]本申请提供了一种搜索建议提供方法,所述方法包括:
[0008]获取当前用户输入的第一搜索词;
[0009]将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议;
[0010]在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供;
[0011]其中,所述离线列表中任一关键词对应的搜索建议的获取方式具体为:
[0012]获取日志记录中与该关键词相关的历史用户行为;
[0013]获取所述历史用户行为所产生的文档;
[0014]对所述文档进行分词,得到至少一个候选建议;
[0015]根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
[0016]可选的,所述获取当前用户输入的第一搜索词之前还包括:
[0017]获取当前用户输入的第二搜索词;
[0018]向当前用户提供与所述第二搜索词对应的搜索建议;
[0019]所述获取当前用户输入的第一搜索词具体为:
[0020]获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。
[0021]可选的,所述候选建议的重要度特征基于预设时间点之前的相关数据获取得到。
[0022]可选的,所述候选建议的重要度特征还基于所述预设时间点之后的相关数据,每隔预设周期进行修正。
[0023]可选的,所述相关数据包括以下参数中的至少一项:
[0024]所述候选建议的T F — I D F值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。
[0025]可选的,所述获取日志记录中与该关键词相关的历史用户行为,包括:
[0026]获取日志记录中历史用户使用的搜索词;
[0027]对所述历史用户使用的搜索词进行聚类;
[0028]确定该关键词所对应的聚类;
[0029]根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
[0030]可选的,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。
[0031]可选的,所述对所述文档进行分词具体为:对所述文档的标题和/或属性内容进行分词。
[0032]本申请提供了一种搜索建议提供装置,所述装置包括:
[0033]第一搜索词获取单元,用于获取当前用户输入的第一搜索词;
[0034]关键词匹配单元,用于将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议;
[0035]第一建议提供单元,用于在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供;
[0036]用户行为获取单元,用于获取日志记录中与所述离线列表中任一关键词相关的历史用户行为;
[0037]文档获取单元,用于获取所述历史用户行为所产生的文档;
[0038]分词单元,用于对所述文档进行分词,得到至少一个候选建议;
[0039]筛选单元,用于根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
[0040]可选的,所述装置还包括:第二搜索词获取单元和第二建议提供单元;
[0041]所述第二搜索词获取单元用于获取当前用户输入的第二搜索词;
[0042]所述第二建议提供单元用于向当前用户提供与所述第二搜索词对应的搜索建
[0043]所述第一搜索词获取单元用于获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的所述第一搜索词。
[0044]可选的,所述候选建议的重要度特征由所述筛选单元基于预设时间点之前的相关数据获取得到。
[0045]可选的,所述候选建议的重要度特征还由所述筛选单元基于所述预设时间点之后的相关数据,每隔预设周期进行修正。
[0046]可选的,所述相关数据包括以下参数中的至少一项:
[0047]所述候选建议的T F — I D F值、所述候选建议与所述第一搜索词共同被搜索的次数和/或频率、所述候选建议与所述历史用户行为相关的次数和/或频率、所述候选建议的词语属性值、以及所述候选建议的标注属性值。
[0048]可选的,所述用户行为获取单元包括:
[0049]搜索词获取子单元,用于获取日志记录中历史用户使用的搜索词;
[0050]聚类子单元,用于对所述历史用户使用的搜索词进行聚类;
[0051]聚类确定子单元,用于确定该关键词所对应的聚类;
[0052]用户行为确定子单元,用于根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
[0053]可选的,所述离线列表中的任一关键词对应的搜索建议具体为经过同义词和/或停用词过滤的搜索建议。
[0054]可选的,所述分词单元用于对所述文档进行分词具体为:
[0055]所述分词单元用于对所述文档的标题和/或属性内容进行分词。
[0056]通过上述技术方案可知,本申请实施例不再是从当前用户自己的搜索历史中提供搜索建议,而是将当前用户输入的第一搜索词与离线列表相匹配,以从离线列表中选取至少一个关键词,并向当前用户提供离线列表中与选取的关键词对应的搜索建议。其中,离线列表中的每个关键词对应的搜索建议是从日志记录中与该关键词相关的历史用户行为所产生的文档,经过分词、重要度筛选后获取到的,显然搜索建议可供选择的范围更大,提高了搜索建议贴合用户需求的概率,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。此外,离线列表中的每个关键词对应的搜索建议都是在当前用户输入第一搜索词之前就离线计算好的,因此也不会影响到向当前用户提供搜索建议的速度。
【附图说明】
[0057]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0058]图1为本申请提供的搜索建议提供方法的第一实施例的具体流程图;
[0059]图2为本申请提供的方法第一实施例中的任一关键词的获取过程;
[0060]图3为本申请提供的搜索建议提供方法的第二实施例的具体流程图;
[0061]图4为一种向用户提供第二搜索词对应的搜索建议的示意图;
[0062]图5为本申请提供的方法第二实施例中的任一关键词的获取过程;
[0063]图6为一种向用户提供第一搜索词对应的搜索建议的示意图;
[0064]图7为本申请提供的搜索建议提供装置的第一实施例的具体结构图;
[0065]图8为本申请提供的搜索建议提供装置的第二实施例的具体结构图。
【具体
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1