一种搜索结果的推送方法及系统的制作方法

文档序号:6492266阅读:139来源:国知局
一种搜索结果的推送方法及系统的制作方法
【专利摘要】本发明提供了一种搜索结果的推送方法,包括:当用户搜索的关键词为需求触发词时,依据预设的需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户;所述行业需求词依据预设的行业标签从用户的搜索日志中提取;所述需求触发词为与所述行业需求词之间相关度大于预设阈值的关键词;本发明还提供一种搜索结果的推送系统。根据本发明提供的技术方案,能够提高推送搜索结果的准确度以及关键词的召回率。
【专利说明】一种搜索结果的推送方法及系统
【【技术领域】】
[0001]本发明涉及互联网领域的搜索技术,尤其涉及一种搜索结果的推送方法及系统。【【背景技术】】
[0002]目前,依据关键词向用户提供搜索结果的方式主要有以下两种,一种是基于根词,推送的搜索结果都是包含关键词的搜索结果,例如,对于关键词“宝马”,推送个搜索结果都是包含根词“宝马”的搜索结果,是字面上的直接关联。另一种是基于用户行为,例如,获取搜索过“宝马”的用户还搜索了哪些关键词,将这些关键词作为拓展出的关键词,只要用户在搜索服务器中搜索这些关键词中任意一个关键词,就会将“宝马”的搜索结果也推送给用户。
[0003]对于第一种方法,仅将包含关键词的搜索结果提供给用户,因此提供的搜索结果数量较少,存在较大的局限性,无法满足用户的搜索需求。对于第二种方法,通过所有拓展出的关键词推送搜索结果给用户,使得推送的搜索结果的精确度较低,不能有针对性的推送搜索结果给真正需要的用户,推送效率较低,造成搜索服务器的资源浪费,而且推送的搜索结果也会给用户带来较强的侵入性,影响用户体验。

【发明内容】

[0004]本发明提供了一种搜索结果的推送方法及系统,能够提高推送搜索结果的准确度以及关键词的召回率。
[0005]本发明的具体技术方案如下:
[0006]根据本发明一优选实施例,一种搜索结果的推送方法,包括:
[0007]当用户搜索的关键词为需`求触发词时,依据预设的需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户;
[0008]所述行业需求词依据预设的行业标签从用户的搜索日志中提取;所述需求触发词为与所述行业需求词之间相关度大于预设阈值的关键词。
[0009]上述方法中,依据预设的行业标签从用户的搜索日志中提取行业需求词的方法为:
[0010]用户的搜索日志预先保存关键词与行业标签的对应关系;
[0011]依据行业标签从所述用户的搜索日志中提取出对应的用户搜索过的关键词,将提取出的关键词作为行业需求词;
[0012]对提取出的行业需求词进行去重处理。
[0013]上述方法中,获得关键词与所述行业需求词之间相关度的方法为:
[0014]依据搜索时间对从用户的搜索日志中提取出的关键词进行排序,生成用户行为序列;
[0015]将提取的行业需求词在所述用户行为序列中进行匹配,将匹配到的关键词之前最近的关键词作为潜在触发词;[0016]利用潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率,除以潜在触发词在用户行为序列中被搜索的概率,得到潜在触发词与所述行业需求词之间的相关度。
[0017]上述方法中,所述潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率为:在用户行为序列中匹配到的关键词之前的关键词中所述潜在触发词被搜索的次数与用户行为序列中匹配到的关键词之前关键词的总数的比值。
[0018]上述方法中,所述潜在触发词在用户行为序列中被搜索的概率为:潜在触发词在整个用户行为序列中被搜索的次数与整个用户行为序列中关键词的总数的比值。
[0019]上述方法中,将所述行业需求词的搜索结果提供给用户的方法为:
[0020]如果存在一个关联的行业需求词,将所述行业需求词的搜索结果作为需求触发词的搜索结果提供给用户;
[0021]如果存在两个以上关联的行业需求词,对需求触发词与行业需求词的相关度进行排序,向用户优先提供相关度最高的行业需求词的搜索结果。
[0022]一种搜索结果的推送系统,包括:提取单元、推送单元;其中,
[0023]提取单元,用于依据预设的行业标签从用户的搜索日志中提取行业需求词;
[0024]推送单元,用于当用户搜索的关键词为需求触发词时,依据预设的需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户;所述需求触发词为与所述行业需求词之间相关度大于预设阈值的关键词。
[0025]上述系统中,所述提取单元依据预设的行业标签从用户的搜索日志中提取行业需求词具体为:
[0026]用户的搜索日志预先保存关键词与行业标签的对应关系;
[0027]依据行业标签从所述用户的搜索日志中提取出对应的用户搜索过的关键词,将提取出的关键词作为行业需求词;
[0028]对提取出的行业需求词进行去重处理。
[0029]上述系统中,该系统还包括统计单元,所述统计单元获得关键词与所述行业需求词之间相关度具体为:
[0030]依据搜索时间对从用户的搜索日志中提取出的关键词进行排序,生成用户行为序列;
[0031]将提取的行业需求词在所述用户行为序列中进行匹配,将匹配到的关键词之前最近的关键词作为潜在触发词;
[0032]利用潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率,除以潜在触发词在用户行为序列中被搜索的概率,得到潜在触发词与所述行业需求词之间的相关度。
[0033]上述系统中,所述潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率为:在用户行为序列中匹配到的关键词之前的关键词中所述潜在触发词被搜索的次数与用户行为序列中匹配到的关键词之前关键词的总数的比值。
[0034]上述系统中,所述潜在触发词在用户行为序列中被搜索的概率为:潜在触发词在整个用户行为序列中被搜索的次数与整个用户行为序列中关键词的总数的比值。
[0035]上述系统中,所述推送单元将所述行业需求词的搜索结果提供给用户具体为:[0036]如果存在一个关联的行业需求词,将所述行业需求词的搜索结果作为需求触发词的搜索结果推送给用户;
[0037]如果存在两个以上关联的行业需求词,对需求触发词与行业需求词的相关度进行排序,向用户优先推送相关度最高的行业需求词的搜索结果。
[0038]由以上技术方案可以看出,本发明提供的具有以下有益效果:
[0039]对选出的关键词进行进一步的筛选判断处理,仅向搜索满足筛选条件的关键词的用户推送行业需求词的搜索结果,而不是向所有用户都推送行业需求词的搜索结果,能够有针对性的向用户推送搜索结果,提高推送搜索结果的准确率,减少搜索服务器的资源浪费。此外,还能够向用户提供更多的关键词的搜索结果,能够提高搜索结果的召回率。
【【专利附图】

【附图说明】】
[0040]图1是本发明实现搜索结果的推送方法的优选实施例的流程示意图;
[0041]图2是本发明实现搜索结果的推送系统的优选实施例的结构示意图。
【【具体实施方式】】
[0042]本发明的基本思想是:当用户搜索的关键词为需求触发词时,依据预设的需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户;所述行业需求词依据预设的行业标签从用户的搜索日志中提取;所述需求触发词为与所述行业需求词之间相关度大于预设阈值的关键词。
[0043]为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
[0044]本发明提供一种搜索结果的推送方法,图1是本发明实现搜索结果的推送方法的优选实施例的流程示意图,如图1所示,该优选实施例包括以下步骤:
[0045]步骤101,依据预设的行业标签,从用户的搜索日志中提取行业需求词。
[0046]具体的,当用户在搜索服务器中基于自身需求输入关键词并进行搜索时,搜索服务器会依据用户输入的关键词,将该关键词的搜索时间记录到数据库中,数据库中预设的用户的搜索日志统一保存用户输入的关键词及对应的搜索时间;搜索服务器对该关键词进行机器学习以获取该关键词的特征,依据特征在行业特征库中找到该关键词所属的行业,然后依据预设的标签库中行业标签与行业的对应关系,为输入的关键词配置对应的行业标签,关键词与行业标签的对应关系也保存到所述用户的搜索日志中,用户的搜索日志中具有同样行业标签的关键词为属于同一行业的关键词;其中所述标签库可以预先设置在数据库中。
[0047]可以依据行业标签从用户的搜索日志中提取出行业标签对应的用户搜索过的关键词,提取出的关键词即为行业需求词,对提取出的行业需求词进行去重处理,利用去重后的行业需求词组成行业需求词包,行业需求词包中就保存有该行业的所有关键词。
[0048]可以在搜索服务器中配置一个周期,依据配置的周期搜索服务器可以定期的自动执行各个行业的行业需求词的提取操作,提取的行业需求词为距离上一次提取操作之间这段时间内的行业需求词。
[0049]步骤102,依据预设的时间段从用户的搜索日志中提取关键词,并依据搜索时间对提取出的关键词进行排序,生成用户行为序列;将行业需求词在所述用户行为序列中进行匹配,确定匹配到的关键词之前最近的关键词为潜在触发词。
[0050]具体的,搜索服务器从数据库中记录的用户搜索日志中步骤101中配置的周期,提取距离上个周期的时间段内用户搜索过的关键词,将提取的关键词按照搜索时间的先后顺序进行排序,生成一个用户行为序列。
[0051]对行业需求词包中的行业需求词进行遍历,将遍历到的行业需求词与用户行为序列中的关键词进行匹配,可以依据预设的匹配策略进行匹配,例如,匹配策略可以是具有一个相同字或具有两个相同字等;如果遍历到的行业需求词能够在用户行为序列中匹配到相同或相似的关键词,则用户行为序列中的该匹配到的关键词就作为触发关键词;然后,在用户行为序列中,将该触发关键词之前搜索时间最近的一个关键词作为潜在触发词,后续需要对该潜在触发词进行是否为需求触发词的判断,从而筛选出真正的需求触发词;如果遍历到的行业需求词在用户行为序列中没有匹配到关键词,则继续对行业需求词包中其他行业需求词进行遍历;
[0052]需要说明的是,由于用户行为序列中的关键词为真实的用户搜索的关键词,没有进行去重处理,而且用户可能会在搜索服务器中重复搜索同一个关键词,那么用户行为序列中就会有搜索时间不同的同一关键词,如此在进行匹配时,如果在用户行为序列中匹配到多个搜索时间不同的两个以上相同的关键词,本优选实施例中,以其中搜索时间最靠前的关键词作为触发关键词;此外,在将遍历到的行业需求词与用户行为序列中的关键词进行匹配时,如果匹配到的关键词为用户行为序列中的前若干个关键词时,该匹配结果无效,继续遍历其他行业需求词,其中前若干个关键词的具体数值可以依据需求进行配置。
[0053]这里,将匹配到的关键词之前最近的关键词作为潜在触发词,是因为用户在搜索服务器中搜索时,一般不会直接找到准确的关键词,而是需要反复修改关键词才能找到满意的关键词和搜索结果,因此本优选实施例中,匹配到关键词的行业需求词与该关键词之前最近的关键词之间具有一定的相关性,如果该相关性符合预设的条件,就可以认为该行业需求词与匹配的关键词之前最近的关键词之间确实存在较大的相关性。
[0054]步骤103,获取潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率,记为第一概率。
[0055]具体的,在确定潜在触发词后,需要判断该潜在触发词是否为需求触发词,首先,在用户行为序列中匹配到的关键词之前的关键词中,统计该潜在触发词被搜索的次数,然后统计用户行为序列中匹配到的关键词之前关键词的总数;利用统计出的用户行为序列中匹配到的关键词之前所述潜在触发词被搜索的次数,除以用户行为序列中匹配到的关键词之前关键词的总数,得到潜在触发词在用户行为序列中匹配的关键词之前被搜索的概率,将获得的概率记为第一概率。
[0056]步骤104,获取潜在触发词在用户行为序列中被搜索的概率,记为第二概率。
[0057]具体的,统计潜在触发词在整个用户行为序列中被搜索的次数,并统计整个用户行为序列中关键词的总数,用统计的整个用户行为序列中潜在触发次被搜索的次数除以整个用户行为序列中关键词的总数,得到潜在触发词在用户行为序列中被搜索的概率,将获得的概率记为第二概率。
[0058]步骤105,当第一概率与第二概率的比值大于预设的阈值时,确定所述潜在触发词为所述行业需求词的需求触发词,建立所述需求触发词与行业需求词之间的关联关系。
[0059]具体的,用潜在触发词在用户行为序列中所述关键词之前被搜索的概率除以潜在触发词在用户行为序列中被搜索的概率,得到潜在触发词与触发关键词之间的相关度,如果该相关度的数值大于1,即所述第一概率大于所述第二概率,就认为潜在触发词在用户行为序列中所述关键词之前被搜索的概率明显大于潜在触发词在用户行为序列中被搜索的概率,则该潜在触发词与触发关键词关联,该潜在触发词就为触发关键词的需求触发词,由于行业需求词包中存在与触发关键词匹配的行业需求词,因此该潜在触发词也是该行业需求词的需求触发词,与该行业需求词之间存在相关性,获得的相关度也可以表征需求触发词与行业需求词之间的相关度,因此,将该行业需求词及对应的相关度保存在数据库中预设的关联关系表中。
[0060]步骤106,当用户搜索的关键词为需求触发词时,依据需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户。
[0061]具体的,当用户在搜索服务器中搜索的关键词为预先设置的需求触发词时,将与该需求触发词关联的行业需求词的搜索结果也作为该需求触发词的搜索结果提供给用户,除了利用常规的内容匹配算法获得需求触发词的搜索结果外,还需要依据建立的需求触发词与行业需求词之间的关联关系,判断该需求触发词是否存在关联的行业需求词,如果存在一个关联的行业需求词,则利用内容匹配算法获得该行业需求词的搜索结果,然后将该搜索结果作为需求触发词的搜索结果提供给用户,从而能够向用户提供更多的需求触发词的搜索结果,提高搜索结果的召回率;如果不存在关联的行业需求词,则仅向用户提供该需求触发词自身的搜索结果;如果存在两个以上关联的行业需求词,则对需求触发词与行业需求词的相关度进行排序,向用户优先提供相关度最高的行业需求词的搜索结果。其中,向用户提供的搜索结果可以是关键词的推送信息或自然搜索结果,返回的内容按内容形态划分为网页链接、音乐、地图位置信息以及开放平台提供的网页应用等。
[0062]可选的,可以将该需求触发词添加到行业需求词包中,作为行业需求词包中的行业需求词。因为在行业需求词包中加入过多的需求触发词,就会降低行业需求词包中行业需求词之间的相关性,因此可以设置一个阈值,当行业需求词包中行业需求词的数量超过该阈值,就不再向行业需求词包中添加需求触发词,这样在提高搜索结果的召回率同时也能够保持行业需求词包的相关性。
[0063]例如,当用户搜索“有油菜花的旅游区”时,搜索服务器将提取核心关键词“油菜花”和“旅游区”,如果使用现有技术,则搜索服务器将显示包含核心关键词的搜索结果;但使用本发明的技术方案,根据需求触发词,确认“有油菜花的旅游区”是“婺源”的需求触发词,则可以在“有油菜花的旅游区”的搜索结果中优先显示“婺源”的搜索结果,直接满足用户的搜索需求,节省用户反复尝试不同关键词的使用成本,也提高了召回率。
[0064]本优选实施例中,所述行业需求词为搜索服务器中搜索需求量较大,且搜索意图明确的一类关键词,因此行业需求词更容易与其他关键词产生关联;关联得出的关键词的搜索意图其实是想得到行业需求词的搜索结果,但基于关联得出的关键词的表达形式与行业需求词存在差异,因此通过上述技术方案将关键词与行业需求词关联,就可以在搜索关联的关键词时就直接提供行业需求词的搜索结果,减少用户的搜索次数,也能够降低搜索服务器的工作负担。[0065]本优选实施例中,对选出的潜在触发词进行进一步的筛选判断处理,以获取满足条件的潜在触发词,而不是向所有的潜在触发词都发送行业需求词的搜索结果,因此,能够有针对性的向用户推送搜索结果,提高推送搜索结果的准确率,减少搜索服务器的资源浪费。而且,由于需求触发词与行业需求词之间的关联关系是依据用户的搜索行为特征确定的,因此在用户搜索需求触发词时,向用户推送行业需求词的搜索结果是依据用户需求提供的搜索结果,不会给用户带来较强的侵入性,具有良好的用户体验;依据用户搜索的需求触发词,及时向用户推送行业需求词的搜索结果,能够减少用户的搜索次数,带来良好的用户体验。
[0066]为实现上述方法,本发明还提供一种搜索结果的推送系统,该推送系统可设置于搜索服务器中,图2是本发明实现搜索结果的推送系统的优选实施例的结构示意图,该系统包括:提取单元20、统计单元21和推送单元22 ;其中,
[0067]提取单元20,用于依据预设的行业标签从用户的搜索日志中提取行业需求词;
[0068]统计单元21,用于获得关键词与所述行业需求词之间相关度;
[0069]推送单元22,用于当用户搜索的关键词为需求触发词时,依据预设的需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户;所述需求触发词为与所述行业需求词之间相关度大于预设阈值的关键词。
[0070]其中,所述提取单元20依据预设的行业标签从用户的搜索日志中提取行业需求词具体为:用户的搜索日志预先保存关键词与行业标签的对应关系;依据行业标签从所述用户的搜索日志中提取出对应的用户搜索过的关键词,将提取出的关键词作为行业需求词;对提取出的行业需求词进行去重处理。
[0071]其中,所述统计单元21获得关键词与所述行业需求词之间相关度具体为:依据搜索时间对从用户的搜索日志中提取出的关键词进行排序,生成用户行为序列;将提取的行业需求词在所述用户行为序列中进行匹配,将匹配到的关键词之前最近的关键词作为潜在触发词;利用潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率,除以潜在触发词在用户行为序列中被搜索的概率,得到潜在触发词与所述行业需求词之间的相关度。
[0072]其中,所述潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率为:在用户行为序列中匹配到的关键词之前的关键词中所述潜在触发词被搜索的次数与用户行为序列中匹配到的关键词之前关键词的总数的比值。所述潜在触发词在用户行为序列中被搜索的概率为:潜在触发词在整个用户行为序列中被搜索的次数与整个用户行为序列中关键词的总数的比值。
[0073]其中,所述推送单元22将所述行业需求词的搜索结果提供给用户具体为:如果存在一个关联的行业需求词,将所述行业需求词的搜索结果作为需求触发词的搜索结果推送给用户;如果存在两个以上关联的行业需求词,对需求触发词与行业需求词的相关度进行排序,向用户优先推送相关度最高的行业需求词的搜索结果。
[0074]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
【权利要求】
1.一种搜索结果的推送方法,其特征在于,该方法包括: 当用户搜索的关键词为需求触发词时,依据预设的需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户; 所述行业需求词依据预设的行业标签从用户的搜索日志中提取;所述需求触发词为与所述行业需求词之间相关度大于预设阈值的关键词。
2.根据权利要求1所述的方法,其特征在于,依据预设的行业标签从用户的搜索日志中提取行业需求词的方法为: 用户的搜索日志预先保存关键词与行业标签的对应关系; 依据行业标签从所述用户的搜索日志中提取出对应的用户搜索过的关键词,将提取出的关键词作为行业需求词; 对提取出的行业需求词进行去重处理。
3.根据权利要求1所述的方法,其特征在于,获得关键词与所述行业需求词之间相关度的方法为: 依据搜索时间对从用户的搜索日志中提取出的关键词进行排序,生成用户行为序列; 将提取的行业需求词在所述用户行为序列中进行匹配,将匹配到的关键词之前最近的关键词作为潜在触发词;` 利用潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率,除以潜在触发词在用户行为序列中被搜索的概率,得到潜在触发词与所述行业需求词之间的相关度。
4.根据权利要求3所述的方法,其特征在于,所述潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率为:在用户行为序列中匹配到的关键词之前的关键词中所述潜在触发词被搜索的次数与用户行为序列中匹配到的关键词之前关键词的总数的比值。
5.根据权利要求3所述的方法,其特征在于,所述潜在触发词在用户行为序列中被搜索的概率为:潜在触发词在整个用户行为序列中被搜索的次数与整个用户行为序列中关键词的总数的比值。
6.根据权利要求1所述的方法,其特征在于,将所述行业需求词的搜索结果提供给用户的方法为: 如果存在一个关联的行业需求词,将所述行业需求词的搜索结果作为需求触发词的搜索结果提供给用户; 如果存在两个以上关联的行业需求词,对需求触发词与行业需求词的相关度进行排序,向用户优先提供相关度最高的行业需求词的搜索结果。
7.一种搜索结果的推送系统,其特征在于,该系统包括:提取单元、推送单元;其中, 提取单元,用于依据预设的行业标签从用户的搜索日志中提取行业需求词; 推送单元,用于当用户搜索的关键词为需求触发词时,依据预设的需求触发词与行业需求词之间的关联关系,将所述需求触发词的搜索结果和所述行业需求词的搜索结果提供给用户;所述需求触发词为与所述行业需求词之间相关度大于预设阈值的关键词。
8.根据权利要求7所述的系统,其特征在于,所述提取单元依据预设的行业标签从用户的搜索日志中提取行业需求词具体为: 用户的搜索日志预先保存关键词与行业标签的对应关系; 依据行业标签从所述用户的搜索日志中提取出对应的用户搜索过的关键词,将提取出的关键词作为行业需求词; 对提取出的行业需求词进行去重处理。
9.根据权利要求7所述的系统,其特征在于,该系统还包括统计单元,所述统计单元获得关键词与所述行业需求词之间相关度具体为: 依据搜索时间对从用户的搜索日志中提取出的关键词进行排序,生成用户行为序列; 将提取的行业需求词在所述用户行为序列中进行匹配,将匹配到的关键词之前最近的关键词作为潜在触发词; 利用潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率,除以潜在触发词在用户行为序列中被搜索的概率,得到潜在触发词与所述行业需求词之间的相关度。
10.根据权利要求9所述的系统,其特征在于,所述潜在触发词在用户行为序列中匹配到的关键词之前被搜索的概率为:在用户行为序列中匹配到的关键词之前的关键词中所述潜在触发词被搜索的次数与用户行为序列中匹配到的关键词之前关键词的总数的比值。
11.根据权利要求9所述的系统,其特征在于,所述潜在触发词在用户行为序列中被搜索的概率为:潜在触发词在整个用户行为序列中被搜索的次数与整个用户行为序列中关键词的总数的比值。
12.根据权利要求7所述的系统,其特征在于,所述推送单元将所述行业需求词的搜索结果提供给用户具体为: 如果存在一个关联的行 业需求词,将所述行业需求词的搜索结果作为需求触发词的搜索结果推送给用户; 如果存在两个以上关联的行业需求词,对需求触发词与行业需求词的相关度进行排序,向用户优先推送相关度最高的行业需求词的搜索结果。
【文档编号】G06F17/30GK103853771SQ201210511393
【公开日】2014年6月11日 申请日期:2012年12月3日 优先权日:2012年12月3日
【发明者】韩博 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1