一种搜索建议提供方法及装置的制造方法_3

文档序号:9217222阅读:来源:国知局
n g r am模型进行分词。
[0107]步骤S 204:根据所述候选建议的重要度特征对所述候选建议进行筛选,筛选后的候选建议作为该关键词对应的搜索建议。
[0108]在根据重要度特征进行筛选时,可以是选择重要度特征最高的一个或多个候选建议,也可以是设置一个特征阈值,选择大于特征阈值的一个或多个候选建议。
[0109]由于离线列表是在用户输入搜索词之前就已经制作好的,因此可以设置一个预设时间点,在获取候选建议的重要度特征时,具体可以是基于预设时间点之前的相关数据。例如,该步骤中候选建议的重要度特征可以基于当天之前的相关数据获取得到。
[0110]为了使得重要度特征能够具有实时性,本申请实施例中的候选建议的重要度特征还可以基于所述预设时间点之后的相关数据,每隔预设周期进行修正。例如,首先基于当天之前的相关数据初步获取到候选建议的重要度特征,而在当天则每隔预设周期(例如2个小时),根据当天的相关数据对候选建议的重要度特征进行修正。
[0111]其中,重要度特征用于表示候选建议的重要性,而获取重要度特征时基于的相关数据可以包括以下参数中的至少一项:
[0112]候选建议的T F — I D F值、候选建议与第一搜索词共同被搜索的次数和/或频率、候选建议与所述历史用户行为相关的次数和/或频率、候选建议的词语属性值、以及候选建议的标注属性值。
[0113]下面分别对上述参数进行说明。
[0114]候选建议的TF— IDF(Term Frequency -1nverse Document Frequency,词频一逆向文件频率)值:T F — I DF值是基于T F— I D F算法计算出的表示重要度的特征值。其中,T F— I D F算法是一种用于资讯检索与文本挖掘的统计算法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。具体地,本实施例的候选建议的T F-1DF值具体可以为候选建议在所属的文档中的T F — I D F值。
[0115]候选建议与第一搜索词共同被搜索的次数和/或频率:该参数指的是候选建议与第一搜索词在同一次搜索中同时作为搜索词的次数和/或频率,表示了候选建议和第一搜索词的共现率。
[0116]候选建议与历史用户行为相关的次数和/或频率:表示用户对包含候选建议的链接的点击、收藏、复制、购买等用户行为的次数和/或频率。其中,可以对不同的历史用户行为设置不同的权重,例如对于点击行为设置相对较低的权重,而对于购买行为设置相对较高的权重。
[0117]候选建议的词语属性值:可以将候选建议与预置词表进行匹配,判断出候选建议的词性(例如名词、形容词等)以及是否属于品牌词等等,并且分别设置对应的词语属性值。
[0118]候选建议的标注属性值:可以基于候选建议的属性,或者通过人工标注的方式设置标注属性值。
[0119]其中,在计算重要度特征时,还可以对上述每个参数设置不同的权重。
[0120]在本申请实施例中,离线列表中的任一关键词对应的搜索建议具体可以为经过同义词和/或停用词过滤的搜索建议,具体可以是步骤S 203之后,对分词得到的候选建议进行同义词和/或停用词过滤。或者也可以在步骤S 204中,对筛选后的候选建议进行同义词和/或停用词过滤。
[0121]通过上述技术方案可知,本申请实施例不再是从当前用户自己的搜索历史中提供搜索建议,而是将当前用户输入的第一搜索词与离线列表相匹配,以从离线列表中选取至少一个关键词,并向当前用户提供离线列表中与选取的关键词对应的搜索建议。其中,离线列表中的每个关键词对应的搜索建议是从日志记录中与该关键词相关的历史用户行为所产生的文档,经过分词、重要度筛选后获取到的。显然本申请实施例提供的搜索建议,不再仅仅局限于用户自己的搜索历史,而是基于相关的历史用户行为,因此提供的搜索建议可供选择的范围更大,提高了搜索建议贴合用户需求的概率,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。此外,离线列表中的每个关键词对应的搜索建议都是在当前用户输入第一搜索词之前就离线计算好的,因此也不会影响到向当前用户提供搜索建议的速度。
[0122]值得说明的是,由于本申请实施例中日志记录中可以记录有多个用户的历史用户行为,因此本申请实施例中提供的搜索建议也不仅仅局限于当前用户自己对搜索词的主观理解。例如,当前用户想查一个专业术语时,只需输入自己对这个术语的理解,而由于其他用户很有可能获知这个术语的具体名称,因此根据其他用户的历史用户行为,增大了向当前用户提供搜索建议具体为这个术语具体名称的概率,也实现了减少当前用户重复查询的次数。
[0123]此外,由于本申请实施例中的搜索建议不再基于当前用户的搜索历史,尤其是搜索的高频词,使得生成的搜索建议不会只局限在固定的搜索词,从而能够起到分散流量的作用,很好地减少马太效应。再加上本申请实施例中搜索建议是通过获取与关键词相关的历史用户行为所产生的文档、并且经过分词、重要度筛选后得到的,因此提供的搜索建议与历史用户行为的相关性更高,与用户需求的切合度更高,并且更贴近数据库已有的数据,因此搜索出的内容更丰富具体,能够有效减少当前用户的搜索次数。
[0124]在本实施例的步骤S 101中获取了当前用户输入的第一搜索词,实际上,这里第一搜索词可以是当前用户直接输入的搜索词,例如,用户可以通过键盘或者语音设备等方式输入“雾霾”,此时“雾霾”作为第一搜索词。而第一搜索词还可以是根据搜索词生成的一级或者多级搜索建议,下面通过一个实施例重点说明这种情况。
[0125]实施例二
[0126]请参阅图3,示出了本申请实施例的搜索建议提供方法的第二实施例。与方法第一实施例不同的是,在本实施例中,第一搜索词具体为当前用户选择的搜索建议。
[0127]本实施例具体包括:
[0128]步骤S 301:获取当前用户输入的第二搜索词。
[0129]其中,当前用户可以通过多种方式输入第二搜索词,例如,可以向当前用户提供搜索框,使得当前用户在搜索框中通过键盘或者语音设备等输入设备输入第二搜索词。又例如,也可以向当前用户提供选择钮、下拉栏等,使得当前用户通过单击、双击、悬停等方式选择输入的第二搜索词。
[0130]需要说明的是,第二搜索词可以是当前用户直接输入的搜索词,当然也可以是根据当前用户直接输入的搜索词生成的搜索建议。
[0131]步骤S 302:向当前用户提供与所述第二搜索词对应的搜索建议。
[0132]这里向当前用户提供与第二搜索词对应的搜索建议的具体方式不受限定,例如当前用户输入第二搜索词“雾霾”之后,可以通过方法实施例一中的步骤S 102和步骤S 103,实现向当前用户提供第二搜索词对应的搜索建议:“雾霾口罩”、“雾霾专用口罩”、“雾霾口罩3 mm”等等。当然,这里也可以采用现有技术的任一种提供搜索建议的方式,例如基于当前用户的搜索历史向当前用户提供对应的搜索建议等等,本申请实施例不再详述。
[0133]其中,向当前用户提供第二搜索词对应的搜索建议时具体可以通过自动下拉栏、自动侧边框等方式,本申请实施例对此不做限定。
[0134]步骤S 303:获取当前用户在所述第二搜索词对应的搜索建议中选择的优选建议,将所述优选建议作为当前用户输入的第一搜索词。
[0135]当向当前用户提供第二搜索词对应的搜索建议之后,使得当前用户能够通过单击、双击、悬停等方式选择输入的第一搜索词。例如图4所示,当用户输入第二搜索词“雾霾”之后,通过自动下拉栏的方式向用户提供第二搜索词对应的搜索建议:“雾霾口罩”、“雾霾专用口罩”、“雾霾口罩3 mm”等等,而当检测到用户在自动下拉栏中通过悬停等方式选择了一个搜索建议,例如“雾霾口罩”时,获取该搜索建议,并作为当前用户输入的第一搜索词。
[0136]步骤S 304:将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议。
[0137]若步骤S 303中获取到第一搜索词“雾霾口罩”,此时将“雾霾口罩”与离线列表中的关键词进行匹配。例如离线列表中存在关键词“雾霾口罩”,此时匹配获得选取的关键词
“雾霾口罩”。
[0138]步骤S 305:在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。
[0139]在离线列表中,每个关键词都分别对应至少一个搜索建议。若步骤S 304中选取到关键词“雾霾口罩”,则将离线列表中“雾霾口罩”对应的搜索建议作为第一搜索词“雾霾口罩”的搜索建议向当前用户提供。
[0140]需说明的是,本实施例中的步骤S 304和S 305与实施例一中的步骤S 102和步骤S 103类似,因此描述较简单,相关之处请具体参见实施例一。
[0141]其中,离线列表中每个关键词对应
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1