一种搜索建议提供方法及装置的制造方法_2

文档序号:9217222阅读:来源:国知局
实施方式】
[0066]为了使得用户能够更加方便快捷进行搜索,当用户输入搜索词后,会自动生成若干个与搜索词相关的搜索建议提供给用户选择。目前,在生成搜索建议时,主要是基于该用户的历史搜索词,例如,用户在之前曾经搜索过“雾霾口罩价格”,“雾霾口罩型号”等词,则在用户输入“雾霾口罩”后,网页上将通过自动下拉栏等方式提供“雾霾口罩价格”、“雾霾口罩型号”等搜索建议供用户选择。
[0067]然而,在这种提供搜索建议的方式中,基于的是用户自己的搜索历史,不仅搜索建议可供选择的范围比较小,而且还限制在用户自己对搜索词的主观理解中,例如用户可能想查一个专业术语时,只能想起这个专业术语的大致意思,但想不起具体名称,用户只能根据自己的理解,不断重复查询,直至查到这个词的具体术语。因此导致了搜索耗费的时间和流量较多。
[0068]而在本申请实施例中,提供了一种搜索建议提供方法及装置,以实现增大提供的搜索建议的选择范围,从而减少了用户搜索次数,进一步减少了搜索耗费的时间和流量。
[0069]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0070]本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
[0071]本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0072]实施例一
[0073]请参阅图1,示出了本申请实施例的搜索建议提供方法的第一实施例。本实施例具体包括:
[0074]步骤S 101:获取当前用户输入的第一搜索词。
[0075]当前用户想要搜索需要的信息时,会输入一个或多个搜索词,因此该步骤中获取当前用户输入的一个或多个搜索词,并作为第一搜索词。当然,第一搜索词也可以是对当前用户输入的语句或者词组分词后得到的。
[0076]其中,当前用户可以通过多种方式输入第一搜索词,例如,可以向当前用户提供搜索框,使得当前用户在搜索框中通过键盘或者语音设备等输入设备输入第一搜索词。又例如,也可以向当前用户提供选择钮、下拉栏等,使得当前用户通过单击、双击、悬停等方式选择输入的第一搜索词。
[0077]步骤S 102:将所述第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词;所述离线列表中的每个关键词分别对应至少一个搜索建议。
[0078]在本申请实施例中,离线列表中包括有至少一个关键词。这些关键词可以是历史用户搜索的高频词。并且,离线列表中每个关键词分别对应至少一个搜索建议。例如离线列表中可以包括关键词“雾霾口罩”,关键词“雾霾口罩”对应三个搜索建议:“防二手烟”、“防病菌”和“流感”。其中,离线列表可以预存在搜索服务器中,因此本申请实施例中的历史用户可以不仅局限于当前用户,而包括搜索服务器中的部分用户或者全部用户。
[0079]在该步骤中,将第一搜索词与离线列表中的至少一个关键词相匹配,以从所述离线列表中选取至少一个关键词。该步骤具体执行时可以是从离线列表中选取与第一搜索词匹配度最高的一个或多个关键词,或者也可以设置一个匹配度阈值,选取离线列表中与第一搜索词的匹配度大于匹配度阈值的一个或多个关键词。例如,用户输入的第一搜索词具体为“雾霾”,由于“雾霾”与离线列表中的“雾霾口罩”的匹配度最高,因此将“雾霾口罩”作为选取的关键词。其中具体计算匹配度的方式与现有技术相同,本申请实施例不再详述。
[0080]步骤S 103:在所述离线列表中获取与选取的至少一个关键词对应的搜索建议,作为所述第一搜索词的搜索建议向当前用户提供。
[0081]在本申请实施例中,离线列表中的每个关键词分别对应至少一个搜索建议。例如,从离线列表中选取的关键词为“雾霾口罩”,而在离线列表中,“雾霾口罩”对应三个搜索建议:“防二手烟”、“防病菌”和“流感”,因此,向当前用户提供这三个搜索建议中的任一个或多个搜索建议。
[0082]在本申请实施例中,向当前用户提供搜索建议时具体可以通过自动下拉栏、自动侧边框等方式,本申请实施例对此不做限定。
[0083]需要格外说明的是,本申请实施例提供的方法可以用于搜索服务器中,也就是说,本申请实施例中步骤S 101至步骤S 103的执行主体可以是搜索服务器,搜索服务器根据当前用户输入的第一搜索词从离线列表中选取关键词及该关键词对应的搜索建议,之后可以通过用户终端向用户提供搜索建议。其中,本申请所说的搜索服务器可以为搜索引擎使用的任一种服务器。
[0084]在本申请实施例中,离线列表中包括有至少一个关键词,而且每个关键词分别对应至少一个搜索建议。其中,离线列表中每个关键词对应的搜索建议可以由搜索服务器获取得到。
[0085]实际上,离线列表是离线制作好的,下面对制作离线列表的过程进行说明。
[0086]如图2所示,离线列表中任一关键词对应的搜索建议的获取方式包括步骤 S201 - S 204。
[0087]步骤S 201:获取日志记录中与该关键词相关的历史用户行为。
[0088]为了加大统计的数据基数,该步骤中的历史用户行为具体可以为搜索服务器的日志记录中所记录的所有用户、或者与输入第一搜索词的当前用户具有相同属性的用户(例如同城用户、同一性别的用户等等)的历史用户行为。
[0089]与该关键词相关的历史用户行为则具体可以包括:对包含该关键词的链接的点击、收藏、复制、或者购买等用户行为。
[0090]需要说明的是,在本步骤中获取与该关键词相关的历史用户行为时,还可以进一步扩大获取的范围,以增大搜索建议可供选择的范围。具体请见本步骤的以下子步骤。
[0091]本步骤具体可以包括:
[0092]子步骤S 2011,获取日志记录中历史用户使用的搜索词。
[0093]离线列表中的关键词可以选自历史用户使用过的搜索词。
[0094]子步骤S 2012,对所述历史用户使用的搜索词进行聚类。
[0095]对搜索词的聚类可以基于现有技术中的P L S A语义聚类模型进行。
[0096]子步骤S 2013,确定该关键词所对应的聚类。
[0097]本实施可以通过子步骤S 2012中对历史用户使用的搜索词的聚类,以得到该关键词的同义词或相似词。
[0098]子步骤S 2014,根据所述日志记录确定与该关键词所对应的聚类包含的搜索词相关的用户行为,将所述相关的用户行为作为与该关键词相关的历史用户行为。
[0099]该子步骤具体包括:确定该关键词所对应的聚类包含的搜索词,以及根据日志记录确定与该包含的搜索词相关的用户行为。
[0100]例如,以关键词为“刘德华”为例,聚类后能够得到同义词或相似词“A n d y La u”,因此在获取历史用户行为时实际上获取的是与“刘德华”和“An d y La u”相关的历史用户行为。
[0101]可见,在本步骤中,可以通过聚类得到关键词的同义词或者相似词,之后基于聚类得到的同义词或者相似词获取历史用户行为,从而能够实现增大搜索建议可提供选择的范围,以减少用户搜索次数,因此进一步减少搜索耗费的时间和流量。
[0102]步骤S 202:获取所述历史用户行为所产生的文档。
[0103]在步骤S 201中获取到与该关键词相关的历史用户行为之后,获取该历史用户行为产生的文档。实际上,每个用户行为都对应产生一个文档,例如,当用户点击包含该关键词的链接后,将打开一个新的链接,该链接中的所有文字、图片、语音等信息可以形成一个文档。其中可以将图片、语音等信息利用语音识别、文字识别等技术转换为对应的文字信肩、O
[0104]步骤S 203:对所述文档进行分词,得到至少一个候选建议。
[0105]为了减小分词的工作量,本申请实施例还可以是仅对所述文档的标题和/或属性内容进行分词,从而得到至少一个候选建议。其中,属性内容用于表示文档的属性。例如,若文档具体为一篇文章,属性内容可以为文章摘要、文章总结等等,若文档具体为商品信息时,属性内容可以为商品介绍等等。
[0106]在对文档,或者文档的标题和/或属性内容进行分词时,可以基于现有的分词工具、还可以基于词典、或者基于分词模型等统计方法,例如基于
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1