用于提供与查询序列相对应的搜索建议的方法、装置与设备的制作方法

文档序号:6383580阅读:130来源:国知局
专利名称:用于提供与查询序列相对应的搜索建议的方法、装置与设备的制作方法
技术领域
本发明涉及互联网信息提供领域,尤其涉及一种用于提供与查询序列相对应的搜索建议的方法、装置与设备。
背景技术
当今,搜索引擎在人们的生活中扮演越来越重要的角色,人们可随时随地通过搜索引擎在互联网中进行信息搜索。现有技术中,网络设备根据用户输入的查询序列,在搜索建议库中进行精确匹配来获得与该查询序列相匹配的搜索建议,但当用户输入的查询序列中包括口语化或表意不清的字词时,将会导致网络设备无法在搜索建议库中匹配到与该查询序列精确匹配的搜索建议,因此无法向用户提供搜索建议,从而降低用户搜索效率,影响用户搜索体验。

发明内容
本发明的目的是提供一种用于提供与查询序列相对应的搜索建议的方法、装置与设备。根据本发明的一个方面,提供了一种用于提供与查询序列相对应的搜索建议的方法,该方法包括以下步骤a对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段;b在所述多个切分片段中选择片段分值大于预定阈值的多个切分片段;c将所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词;d根据所述一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议;e将所述一个或多个搜索建议提供至所述用户设备。根据本发明的另一方面,还提供了一种用于提供与查询序列相对应的搜索建议的提供装置,该提供装置包括切分片段获取装置,用于对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段;选择装置,用于在所述多个切分片段中选择片段分值大于预定阈值的多个切分片段;拼接装置,用于将所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词;搜索建议获取装置,用于根据所述一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议;
搜索建议提供装置,用于将所述一个或多个搜索建议提供至所述用户设备。与现有技术相比,本发明具有以下优点1)由于网络设备对用户输入的查询序列进行切分处理,并将片段分值大于预定阈值的多个切分片段进行拼接处理,并根据拼接后的拼接查询关键词进行匹配查询来获取搜索建议,使得当用户输入的查询序列中包含口语化或表意不清的无意义词时,网络设备可将真正与用户查询意图相关的切分片段筛选出来,而忽略查询序列中的无意义词,从而实现了准确地为用户提供与其查询意图相匹配的搜索建议,进一步,可使得用户能够从网络设备提供的搜索建议中快速获取到与其搜索意图相一致搜索建议进行搜索,提高用户的搜索效率,提升用户搜索体验;2)通过对拼接查询关键词的扩展处理,一方面较为精确地扩充了最终获得的搜索建议的数量,为用户提供更多的搜索建议选择;另一方面也避免了由于用户输入的查询序列中关键词使用不当而造成的搜索建议匹配错误或无法匹配到搜索建议的情形。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图1示出本发明一个方面的用于提供与查询序列相对应的搜索建议的提供装置的结构不意图;图2示出根据本发明一个优选实施例的用于获取所述一个或多个搜索建议的搜索建议获取装置的设备示意图;图3示出根据本发明另一个方面的用于提供与查询序列相对应的搜索建议的方法流程图;图4示出根据本发明一个优选实施例的用于获取所述一个或多个搜索建议的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1示出本发明一个方面的用于提供与查询序列相对应的搜索建议的提供装置的结构示意图;本实施例的提供装置包含于网络设备中;该提供装置包括切分片段获取装置1、选择装置2、拼接装置3、搜索建议获取装置4及搜索建议提供装置5。其中,所述网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述网络设备仅为举例,其他现有的或今后可能出现的网络设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。首先,切分片段获取装置I对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段;其中,所述切分处理的方式包括但不限于正向最大匹配,反向最大匹配,双向最大匹配,语言模型方法,最短路径算法等。其中,所述用户设备包括但不限于,计算机、智能手机、PDA等任何具有上网浏览搜索功能的设备。在一示例中,首先,用户借助用户设备的交互装置,包括但不限于键盘、触摸板、或手写设备,与用户设备的浏览器软件或客户端软件进行交互。以键盘为例,用户在浏览器软件的搜索栏输入框中进行输入时,用户设备实时地获取用户通过键盘输入的按键序列,并记录为与该用户输入操作相对应的查询序列为“婴儿用湿巾什么”;用户设备将该用户所输入的该查询序列发送给网络设备;网络设备接收该查询序列,接着,提供装置的切分片段获取装置I通过例如正向最大匹配法,对来自该用户设备的查询序列进行切分处理,以获取多个切分片段分别为“婴儿”、“用”、“湿巾”及“什么”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段的实现方式,均应包含在本发明的范围内。随后,选择装置2在切分片段获取装置I获取的多个切分片段中选择片段分值大于预定阈值的多个切分片段。其中,所述切分片段的片段分值可在网络设备或第三方设备中的预置的片段分值列表中获取,所述片段分值列表中包括切分片段及其所对应的分值。在一示例中,已获取的多个切分片段分别为“婴儿”、“用”、“湿巾”及“什么”,选择装置2在预置的片段分值列表进行匹配查询,获取“婴儿”的片段分值为1. 5077、“用”的片段分值为O. 2693、“湿巾”的片段分值为1. 4003、“什么”的片段分值为O. 8566 ;接着,选择装置2将该四个切分片段的片段分值与预定阈值进行比较,如预定阈值为1,则从该四个切分片段中选择片段分值大于预定阈值的片段分值为“婴儿”和“湿巾”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何在多个切分片段中选择片段分值大于预定阈值的多个切分片段的实现方式,均应包含在本发明的范围内。随后,拼接装置3将选择装置2所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词。其中,所述拼接处理的方式包括将多个切分片段合并以作为拼接查询关键词。在一示例中,当已获得的片段分值大于预定阈值的片段分值为“婴儿”和“湿巾”,则拼接装置3将该两个切分片段进行拼接处理,已获得一个拼接查询关键词为“婴儿+湿巾”。在另一示例中,当已获得的片段分值大于预定阈值的片段分值为“婴儿”、“湿巾”和“品牌”,则拼接装置3将该三个切分片段进行拼接处理,已获得四个拼接查询关键词为“婴儿+湿巾+品牌”、“婴儿+湿巾”、“婴儿+品牌”和“湿巾+品牌”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词的实现方式,均应包含在本发明的范围内。接着,搜索建议获取装置4根据拼接装置3拼接获得的一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议。其中,所述搜索建议库中包括与拼接查询关键词相对应的一个或多个搜索建议;优选地,所述搜索建议库包括但不限于关系数据库、Key-Value存储系统或文件系统等;所述搜索建议库存储于提供装置所在的网络设备中,或存储于与该网络设备通过网络连接的其他第三方设备。在此,所述获取搜索建议的方式包括但不限于I)根据一个或多个拼接查询关键词,直接在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议;2)基于拼接查询关键词中切分片段的同义词和/或近义词、拼接查询关键词的查询联想信息、拼接查询关键词的语义分析结果,对一个或多个拼接查询关键词进行扩展处理,以获取与该一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词;根据该一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;该实施方式将在后续具体实施例中进行详述。在一示例中,根据拼接装置3所获取的拼接查询关键词“婴儿+湿巾+品牌”和“婴儿+湿巾”,搜索建议获取装置4在本地或第三方设备的建议信息库中进行匹配查询,获得与“婴儿+湿巾+品牌”相匹配的搜索建议为“婴儿湿巾什么品牌好”,与“婴儿+湿巾”相匹配的搜索建议为“婴儿可以用湿巾吗”及“婴儿湿巾配方”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议的实现方式,均应包含在本发明的范围内。随后,搜索建议提供装置5将搜索建议获取装置4获取的一个或多个搜索建议提供至所述用户设备。具体地,搜索建议提供装置5将已获取的一个或多个搜索建议发送至用户设备;用户设备通过页面技术将一个或多个搜索建议按一定顺序和格式,如在搜索框下拉菜单、悬浮窗口、搜索页面空白侧等中提供给用户,供用户进行浏览选择。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将一个或多个搜索建议提供至所述用户设备的实现方式,均应包含在本发明的范围内。由于网络设备对用户输入的查询序列进行切分处理,并将片段分值大于预定阈值的多个切分片段进行拼接处理,并根据拼接后的拼接查询关键词进行匹配查询来获取搜索建议,使得当用户输入的查询序列中包含口语化或表意不清的无意义词时,网络设备可将真正与用户查询意图相关的切分片段筛选出来,而忽略查询序列中的无意义词,从而实现了准确地为用户提供与其查询意图相匹配的搜索建议,进一步,可使得用户能够从网络设备提供的搜索建议中快速获取到与其搜索意图相一致搜索建议进行搜索,提高用户的搜索效率,提升用户搜索体验。作为本实施例的优选方案之一(参照图2),搜索建议获取装置4包括扩展装置41和第一获取装置42。扩展装置41对所述一个或多个拼接查询关键词进行扩展处理,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词;第一获取装置42根据所述一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。具体地,扩展装置41基于拼接查询关键词中切分片段的同义词和/或近义词、拼接查询关键词的查询联想信息、拼接查询关键词的语义分析结果,对一个或多个拼接查询关键词进行扩展处理,以获取与该一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词I)扩展装置41基于拼接查询关键词中切分片段的同义词和/或近义词,对一个或多个拼接查询关键词进行扩展处理;其中,拼接查询关键词中切分片段的同义词和/或近义词包括根据该拼接查询关键词,通过查询预置词库或开放词库等方式,获得与该拼接查询关键词中切分片段相对应的同义词和/或近义词。其中,所述预置词库或开放词库包括多个词条的同义和/或近义映射;所述预置词库或开放词库存储于提供装置所在的网络设备中,或存储于与该网络设备通过网络连接的搜索引擎或其他第三方设备。例如,已获取的拼接查询关键词为“周董+新歌”,其包含的切分片段为“周董”和“新歌”,扩展装置41通过查询预置词库,获得“周董”相应的同义词“周杰伦”,扩展装置41根据该同义词对该拼接查询关键词进行扩展处理,如将“周董”替换为“周杰伦”,获得相应的拼接扩展关键词“周杰伦+新歌”。2)扩展装置41基于拼接查询关键词的查询联想信息,对一个或多个拼接查询关键词进行扩展处理;在此,查询联想信息包括预定的与拼接查询关键词相关联的关键词,如拼接查询关键词由影星姓名及切分片段“电影”组成,则其预定的查询联想信息为该影星具有代表性或搜索频率较高的电影名称;扩展装置41通过对拼接查询关键词进行语义分析、字符串识别或数据库匹配等方式,检测该拼接查询关键词是否满足具有预定的查询联想信息的条件,再通过对该拼接查询关键词添加预定的查询联想信息,进行扩展处理,来获得相应的拼接扩展关键词。例如,拼接查询关键词为“刘德华+电影”,扩展装置41检测出该拼接查询关键词由影星姓名及切分片段“电影”组成,则对该拼接查询关键词添加预定的查询联想信息,进行扩展处理,得到拼接扩展关键词“刘德华+电影+无间道”、“刘德华+电影+桃姐”等。3)扩展装置41基于对拼接查询关键词的语义分析结果,对一个或多个拼接查询关键词进行扩展处理;扩展装置41通过诸如从搜索引擎或者第三方设备直接获取该拼接查询关键词的语义分析结果,或者对该拼接查询关键词进行语义分析或字符串识别等,获得相应的语义分析结果。例如,拼接查询关键词为“宝洁+牌子”,扩展装置41对该拼接查询关键词进行语义分析,得到相应的语义分析结果,如得到关键词“宝洁”和“旗下品牌”,据此获得相应的拼接扩展关键词为“宝洁+旗下品牌”。随后,第一获取装置42根据扩展装置41扩展获得的一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。其方式与参照图1所示搜索建议获取装置4根据一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与该一个或多个拼接查询关键词分别相对应的一个或多个搜索建议的方式相同或相似,在此不再赘述。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对一个或多个拼接查询关键词进行扩展处理,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词,接着根据所述一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议的实现方式,均应包含在本发明的范围内。通过对拼接查询关键词的扩展处理,一方面较为精确地扩充了最终获得的搜索建议的数量,为用户提供更多的选择;另一方面也避免了由于用户输入的查询序列中关键词使用不当而造成的搜索建议匹配错误或无法匹配到搜索建议的情形。作为本实施例的优选方案之一(参照图1),提供装置还包括确定装置(图未示);确定装置根据与搜索建议获取装置4所获取的搜索建议相对应的建议相关信息,确定该等搜索建议的优选级信息;搜索建议提供装置5根据该等优选级信息,将该等搜索建议进行排序并提供至用户设备。其中,所述建议相关信息包括以下至少任一项I)搜索建议包括的切分片段个数;2)搜索建议的点击频次;3)搜索建议的来源信息。具体地,确定装置根据搜索建议获取装置4所获取的一个或多个搜索建议,通过分词处理,或者通过与搜索引擎或建议信息库等的交互,获取与所述搜索建议相对应的建议相关信息,如搜索建议包括的切分片段个数、搜索建议的点击频次、搜索建议的来源信息等,进而,根据上述建议相关信息或其任意结合,及根据预设的或用户所设置的优先级规贝U,确定所述搜索建议的优选级信息。其中,所述建议信息库中存储有搜索建议与诸如点击频次、来源信息等建议相关信息的映射关系,该建议信息库既可以位于提供装置所在的网络设备中,也可以位于与该网络设备通过网络相连接的第三方设备中。其中,确定装置确定优选级信息的方式包括但不限于I)当与搜索建议相对应的建议相关信息包括搜索建议包括的切分片段个数时,则根据该切分片段个数,确定搜索建议的优先级信息,例如切分片段个数越多的搜索建议优先级越高;2)当与搜索建议相对应的建议相关信息包括搜索建议的点击频次时,则根据该点击频次,确定搜索建议的优先级信息,例如点击频次越高的搜索建议优先级越高;3)当与搜索建议相对应的建议相关信息包括搜索建议的来源信息时,则根据该来源信息,确定搜索建议的优先级信息,例如根据拼接查询关键词所获取的搜索建议优先级高,而根据扩展查询关键词来获取的搜索建议优先级低。随后,搜索建议提供装置5根据确定装置所确定的该等搜索建议的优选级信息,将该等搜索建议进行排序并提供至用户设备。例如,搜索建议提供装置5根据该等搜索建议的优选级信息,将该等搜索建议按照优先级由高到低的顺序进行排序,并将排序后的搜索建议提供至用户设备。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据与搜索建议相对应的建议相关信息,确定该等搜索建议的优选级信息,接着根据该等优选级信息,将该等搜索建议进行排序并提供至用户设备的实现方式,均应包含在本发明的范围内。
通过根据优先级对搜索建议进行排序,使得更加符合用户查询需求的搜索建议能够排在更能引起用户注意的显著位置,从而缩短用户对搜索建议的选择时间,提供搜索效率。作为本实施例的优选方案之一(参照图1),搜索建议获取装置4根据所述一个或多个拼接查询关键词,并结合用户相关信息,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。其中,所述用户相关信息包括以下至少任一项I)用户的个人属性;2)用户的历史搜索记录;3)用户的地域特征信息。具体地,提供装置通过在用户信息库中匹配查询或通过获取IP地址等方式,获取该用户的个人属性、历史搜索记录、地域特征信息等用户相关信息,接着,搜索建议获取装置4根据已获取的一个或多个拼接查询关键词,再结合上述一个或任意多个用户相关信息,在搜索建议库中进行匹配查询,或对该(等)拼接查询关键词进行扩展处理,获得与该(等)拼接查询关键词相对应的一个或多个搜索建议。在此,所述用户信息库中存储有用户的用户相关信息,该用户信息库既可以位于用户设备端,也可以位于提供装置所在的网络设备中或与该提供装置通过网络相连接的第三方设备中。其中,搜索建议获取装置4结合用户相关信息获取搜索建议的方式包括I)当用户相关信息包括用户的个人属性,则根据一个或多个拼接查询关键词,并结合用户的个人属性,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;例如,拼接查询关键词为“玫瑰+红酒”,若用户相关信息示出该用户为男性,则搜索建议获取装置4获取搜索建议为“玫瑰红酒在线预订送货上门”,若用户相关信息示出该用户为女性,则搜索建议获取装置4获取搜索建议为“玫瑰红酒面膜的护肤效果”;2)当用户相关信息包括用户的历史搜索记录,则根据一个或多个拼接查询关键词,并结合用户的历史搜索记录,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;例如,提供装置通过查询用户信息库,获取该用户的搜索历史记录,若用户的搜索历史记录示出该用户曾经输入查询序列“电影无间道”进行搜索,当拼接查询关键词为“刘德华+电影”时,则搜索建议获取装置4将搜索建议“刘德华的电影无间道下载”、“刘德华的电影无间道在线观看”作为搜索建议;3)当用户相关信息包括用户的地域特征信息,则根据一个或多个拼接查询关键词,并结合用户的地域特征信息,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;例如,拼接查询关键词为“723路+公交车”,提供装置通过在用户信息库中匹配查询或通过获取该用户的IP地址,获得该用户的地域特征信息,如北京,随后搜索建议获取装置4在搜索建议库中进行匹配查询,以获得搜索建议“北京的723路公交车路线图”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述一个或多个拼接查询关键词,并结合用户相关信息,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议的实现方式,均应包含在本发明的范围内。由于用户相关信息能够一定程度的反应该用户的个人特定需求,因此通过结合用户相关信息,使得获得到的搜索建议更能符合该用户个人的特定查询需求,确保提供至用户的搜索建议具有较高的用户相关度,从而进一步提供用户搜索效率。作为本实施例的优选方案之一(参照图1),该提供装置还包括接收装置(图未示)和更新装置(图未示)。接收装置接收来自所述用户设备发送的所述用户对所述一个或多个搜索建议的选择;更新装置根据所述用户对所述一个或多个搜索建议的选择,更新所述搜索建议库。具体地,用户通过与用户设备的交互,在提供给用户的一个或多个第一搜索建议中通过单击、滑动、悬停或双击等方式,对该一个或多个搜索建议的进行选择,接收装置通过调用该用户设备的应用程序接口(API)或通过诸如JSP、ASP或PHP等动态网页技术,获取该用户对该等一个或多个搜索建议的选择。随后,更新装置根据该用户对该一个或多个搜索建议的选择,通过例如数据库更新的方式,将用户选择的搜索建议与用户输入的查询序列的映射关系存入搜索建议库,以更新该搜索建议库。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何接收来自所述用户设备发送的所述用户对所述一个或多个搜索建议的选择,接着根据所述用户对所述一个或多个搜索建议的选择,更新所述搜索建议库的实现方式,均应包含在本发明的范围内。图3示出根据本发明另一个方面的用于提供与查询序列相对应的搜索建议的方法流程图;根据本优选实施例的方法包括步骤S1、步骤S2、步骤S3、步骤S4和步骤S5。其中,本发明的方法主要通过网络设备来实现。其中,所述网络设备包括但不限于网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本领域技术人员应能理解上述网络设备仅为举例,其他现有的或今后可能出现的网络设备如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。首先,在步骤SI中,网络设备对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段;其中,所述切分处理的方式包括但不限于正向最大匹配,反向最大匹配,双向最大匹配,语言模型方法,最短路径算法等。其中,所述用户设备包括但不限于,计算机、智能手机、PDA等任何具有上网浏览搜索功能的设备。在一示例中,首先,用户借助与用户设备的交互方式,包括但不限于键盘、触摸板、或手写设备,与用户设备的浏览器软件或客户端软件进行交互。以键盘为例,用户在浏览器软件的搜索栏输入框中进行输入时,用户设备实时地获取用户通过键盘输入的按键序列,并记录为与该用户输入操作相对应的查询序列为“婴儿用湿巾什么”;用户设备将该用户所输入的该查询序列发送给网络设备;网络设备接收该查询序列,接着,在步骤Si中,网络设备通过例如正向最大匹配法,对来自该用户设备的查询序列进行切分处理,以获取多个切分片段分别为“婴儿”、“用”、“湿巾”及“什么”。
需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段的实现方式,均应包含在本发明的范围内。随后,在步骤S2中,网络设备在已获取的多个切分片段中选择片段分值大于预定阈值的多个切分片段。其中,所述切分片段的片段分值可在网络设备或第三方设备中的预置的片段分值列表中获取,所述片段分值列表中包括切分片段及其所对应的分值。在一示例中,已获取的多个切分片段分别为“婴儿”、“用”、“湿巾”及“什么”,在步骤S2中,网络设备在预置的片段分值列表进行匹配查询,获取“婴儿”的片段分值为1. 5077、“用”的片段分值为O. 2693、“湿巾”的片段分值为1. 4003、“什么”的片段分值为O. 8566 ;接着,网络设备将该四个切分片段的片段分值与预定阈值进行比较,如预定阈值为1,则从该四个切分片段中选择片段分值大于预定阈值的片段分值为“婴儿”和“湿巾”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何在多个切分片段中选择片段分值大于预定阈值的多个切分片段的实现方式,均应包含在本发明的范围内。随后,在步骤S3中,网络设备将其在步骤S2中所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词。其中,所述拼接处理的方式包括将多个切分片段合并以作为拼接查询关键词。在一示例中,当已获得的片段分值大于预定阈值的片段分值为“婴儿”和“湿巾”,则在步骤S3中,网络设备将该两个切分片段进行拼接处理,已获得一个拼接查询关键词为“婴儿+湿巾”。在另一示例中,当已获得的片段分值大于预定阈值的片段分值为“婴儿”、“湿巾”和“品牌”,则在步骤S3中,网络设备将该三个切分片段进行拼接处理,已获得四个拼接查询关键词为“婴儿+湿巾+品牌”、“婴儿+湿巾”、“婴儿+品牌”和“湿巾+品牌”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词的实现方式,均应包含在本发明的范围内。接着,在步骤S4中,网络设备根据其在步骤S3中拼接获得的一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议。其中,所述搜索建议库中包括与拼接查询关键词相对应的一个或多个搜索建议;优选地,所述搜索建议库包括但不限于关系数据库、Key-Value存储系统或文件系统等;所述搜索建议库存储于网络设备中,或存储于与该网络设备通过网络连接的其他第三方设备。在此,所述获取搜索建议的方式包括但不限于I)根据一个或多个拼接查询关键词,直接在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议;2)基于拼接查询关键词中切分片段的同义词和/或近义词、拼接查询关键词的查询联想信息、拼接查询关键词的语义分析结果,对一个或多个拼接查询关键词进行扩展处理,以获取与该一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词;根据该一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;该实施方式将在后续具体实施例中进行详述。在一示例中,根据网络设备在步骤S3中所获取的拼接查询关键词“婴儿+湿巾+品牌”和“婴儿+湿巾”,在步骤S4中,网络设备在本地或第三方设备的建议信息库中进行匹配查询,获得与“婴儿+湿巾+品牌”相匹配的搜索建议为“婴儿湿巾什么品牌好”,与“婴儿+湿巾”相匹配的搜索建议为“婴儿可以用湿巾吗”及“婴儿湿巾配方”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议的实现方式,均应包含在本发明的范围内。随后,在步骤S5中,网络设备将其在步骤S4中获取的一个或多个搜索建议提供至所述用户设备。具体地,在步骤S5中,网络设备将已获取的一个或多个搜索建议发送至用户设备;用户设备通过页面技术将一个或多个搜索建议按一定顺序和格式,如在搜索框下拉菜单、悬浮窗口、搜索页面空白侧等中提供给用户,供用户进行浏览选择。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何将一个或多个搜索建议提供至所述用户设备的实现方式,均应包含在本发明的范围内。由于网络设备对用户输入的查询序列进行切分处理,并将片段分值大于预定阈值的多个切分片段进行拼接处理,并根据拼接后的拼接查询关键词进行匹配查询来获取搜索建议,使得当用户输入的查询序列中包含口语化或表意不清的无意义词时,网络设备可将真正与用户查询意图相关的切分片段筛选出来,而忽略查询序列中的无意义词,从而实现了准确地为用户提供与其查询意图相匹配的搜索建议,进一步,可使得用户能够从网络设备提供的搜索建议中快速获取到与其搜索意图相一致搜索建议进行搜索,提高用户的搜索效率,提升用户搜索体验。作为本实施例的优选方案之一(参照图4),步骤S4包括步骤S41和步骤S42。在步骤S41中,网络设备对所述一个或多个拼接查询关键词进行扩展处理,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词;在步骤S42中,网络设备根据所述一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。具体地,在步骤S41中,网络设备基于拼接查询关键词中切分片段的同义词和/或近义词、拼接查询关键词的查询联想信息、拼接查询关键词的语义分析结果,对一个或多个拼接查询关键词进行扩展处理,以获取与该一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词I)在步骤S41中,网络设备基于拼接查询关键词中切分片段的同义词和/或近义词,对一个或多个拼接查询关键词进行扩展处理;其中,拼接查询关键词中切分片段的同义词和/或近义词包括根据该拼接查询关键词,通过查询预置词库或开放词库等方式,获得与该拼接查询关键词中切分片段相对应的同义词和/或近义词。其中,所述预置词库或开放词库包括多个词条的同义和/或近义映射;所述预置词库或开放词库存储于网络设备中,或存储于与该网络设备通过网络连接的搜索引擎或其他第三方设备。例如,已获取的拼接查询关键词为“周董+新歌”,其包含的切分片段为“周董”和“新歌”,在步骤S41中,网络设备通过查询预置词库,获得“周董”相应的同义词“周杰伦”,网络设备根据该同义词对该拼接查询关键词进行扩展处理,如将“周董”替换为“周杰伦”,获得相应的拼接扩展关键词“周杰伦+新歌”。2)在步骤S41中,网络设备基于拼接查询关键词的查询联想信息,对一个或多个拼接查询关键词进行扩展处理;在此,查询联想信息包括预定的与拼接查询关键词相关联的关键词,如拼接查询关键词由影星姓名及切分片段“电影”组成,则其预定的查询联想信息为该影星具有代表性或搜索频率较高的电影名称;网络设备通过对拼接查询关键词进行语义分析、字符串识别或数据库匹配等方式,检测该拼接查询关键词是否满足具有预定的查询联想信息的条件,再通过对该拼接查询关键词添加预定的查询联想信息,进行扩展处理,来获得相应的拼接扩展关键词。例如,拼接查询关键词为“刘德华+电影”,在步骤S41中,网络设备检测出该拼接查询关键词由影星姓名及切分片段“电影”组成,则对该拼接查询关键词添加预定的查询联想信息,进行扩展处理,得到拼接扩展关键词“刘德华+电影+无间道”、“刘德华+电影+桃
姐”等。3)在步骤S41中,网络设备基于对拼接查询关键词的语义分析结果,对一个或多个拼接查询关键词进行扩展处理;在步骤S41中,网络设备通过诸如从搜索引擎或者第三方设备直接获取该拼接查询关键词的语义分析结果,或者对该拼接查询关键词进行语义分析或字符串识别等,获得相应的语义分析结果。例如,拼接查询关键词为“宝洁+牌子”,在步骤S41中,网络设备对该拼接查询关键词进行语义分析,得到相应的语义分析结果,如得到关键词“宝洁”和“旗下品牌”,据此获得相应的拼接扩展关键词为“宝洁+旗下品牌”。随后,在步骤S42中,网络设备根据其在步骤S41中扩展获得的一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。其方式与参照图3所示网络设备在步骤S4中根据一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与该一个或多个拼接查询关键词分别相对应的一个或多个搜索建议的方式相同或相似,在此不再赘述。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何对一个或多个拼接查询关键词进行扩展处理,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词,接着根据所述一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议的实现方式,均应包含在本发明的范围内。通过对拼接查询关键词的扩展处理,一方面较为精确地扩充了最终获得的搜索建议的数量,为用户提供更多的选择;另一方面也避免了由于用户输入的查询序列中关键词使用不当而造成的搜索建议匹配错误或无法匹配到搜索建议的情形。作为本实施例的优选方案之一(参照图3),该方法还包括步骤S6(图未示);在步骤S6中,网络设备根据与其在步骤S4中所获取的搜索建议相对应的建议相关信息,确定该等搜索建议的优选级信息;在步骤S5中,网络设备根据该等优选级信息,将该等搜索建议进行排序并提供至用户设备。其中,所述建议相关信息包括以下至少任一项I)搜索建议包括的切分片段个数;2)搜索建议的点击频次;3)搜索建议的来源信息。具体地,在步骤S6中,网络设备根据其在步骤S4中所获取的一个或多个搜索建议,通过分词处理,或者通过与搜索引擎或建议信息库等的交互,获取与所述搜索建议相对应的建议相关信息,如搜索建议包括的切分片段个数、搜索建议的点击频次、搜索建议的来源信息等,进而,根据上述建议相关信息或其任意结合,及根据预设的或用户所设置的优先级规则,确定所述搜索建议的优选级信息。其中,所述建议信息库中存储有搜索建议与诸如点击频次、来源信息等建议相关信息的映射关系,该建议信息库既可以位于所在的网络设备中,也可以位于与该网络设备通过网络相连接的第三方设备中。其中,在步骤S42中,网络设备确定优选级信息的方式包括但不限于I)当与搜索建议相对应的建议相关信息包括搜索建议包括的切分片段个数时,则根据该切分片段个数,确定搜索建议的优先级信息,例如切分片段个数越多的搜索建议优先级越高;2)当与搜索建议相对应的建议相关信息包括搜索建议的点击频次时,则根据该点击频次,确定搜索建议的优先级信息,例如点击频次越高的搜索建议优先级越高;3)当与搜索建议相对应的建议相关信息包括搜索建议的来源信息时,则根据该来源信息,确定搜索建议的优先级信息,例如根据拼接查询关键词所获取的搜索建议优先级高,而根据扩展查询关键词来获取的搜索建议优先级低。随后,在步骤S5中,网络设备根据其在步骤S4中所确定的该等搜索建议的优选级信息,将该等搜索建议进行排序并提供至用户设备。例如,在步骤S5中,网络设备根据该等搜索建议的优选级信息,将该等搜索建议按照优先级由高到低的顺序进行排序,并将排序后的搜索建议提供至用户设备。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据与搜索建议相对应的建议相关信息,确定该等搜索建议的优选级信息,接着根据该等优选级信息,将该等搜索建议进行排序并提供至用户设备的实现方式,均应包含在本发明的范围内。通过根据优先级对搜索建议进行排序,使得更加符合用户查询需求的搜索建议能够排在更能引起用户注意的显著位置,从而缩短用户对搜索建议的选择时间,提供搜索效率。作为本实施例的优选方案之一(参照图3),在步骤S4中,网络设备根据所述一个或多个拼接查询关键词,并结合用户相关信息,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。其中,所述用户相关信息包括以下至少任一项I)用户的个人属性;2)用户的历史搜索记录;
3)用户的地域特征信息。具体地,在步骤S6中,网络设备通过在用户信息库中匹配查询或通过获取IP地址等方式,获取该用户的个人属性、历史搜索记录、地域特征信息等用户相关信息,接着,在步骤S4中,网络设备根据已获取的一个或多个拼接查询关键词,再结合上述一个或任意多个用户相关信息,在搜索建议库中进行匹配查询,或对该(等)拼接查询关键词进行扩展处理,获得与该(等)拼接查询关键词相对应的一个或多个搜索建议。在此,所述用户信息库中存储有用户的用户相关信息,该用户信息库既可以位于用户设备端,也可以位于网络设备中或与该网络设备通过网络相连接的第三方设备中。其中,在步骤S4中,网络设备结合用户相关信息获取搜索建议的方式包括I)当用户相关信息包括用户的个人属性,则根据一个或多个拼接查询关键词,并结合用户的个人属性,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;例如,拼接查询关键词为“玫瑰+红酒”,若用户相关信息示出该用户为男性,则在步骤S4中,网络设备获取搜索建议为“玫瑰红酒在线预订送货上门”,若用户相关信息示出该用户为女性,则在步骤S4中,网络设备获取搜索建议为“玫瑰红酒面膜的护肤效果”;2)当用户相关信息包括用户的历史搜索记录,则根据一个或多个拼接查询关键词,并结合用户的历史搜索记录,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;例如,在步骤S6中,网络设备通过查询用户信息库,获取该用户的搜索历史记录,若用户的搜索历史记录示出该用户曾经输入查询序列“电影无间道”进行搜索,则当拼接查询关键词为“刘德华+电影”时,在步骤S4中,网络设备将搜索建议“刘德华的电影无间道下载”、“刘德华的电影无间道在线观看”作为搜索建议;3)当用户相关信息包括用户的地域特征信息,则根据一个或多个拼接查询关键词,并结合用户的地域特征信息,在搜索建议库中进行匹配查询,以获取一个或多个搜索建议;例如,拼接查询关键词为“723路+公交车”,在步骤S6中,网络设备通过在用户信息库中匹配查询或通过获取该用户的IP地址,获得该用户的地域特征信息,如北京,随后在步骤S4中,网络设备在搜索建议库中进行匹配查询,以获得搜索建议“北京的723路公交车路线图”。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何根据所述一个或多个拼接查询关键词,并结合用户相关信息,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议的实现方式,均应包含在本发明的范围内。由于用户相关信息能够一定程度的反应该用户的个人特定需求,因此通过结合用户相关信息,使得获得到的搜索建议更能符合该用户个人的特定查询需求,确保提供至用户的搜索建议具有较高的用户相关度,从而进一步提供用户搜索效率。作为本实施例的优选方案之一(参照图3),该方法还包括步骤S7(图未示)和步骤S8(图未示)。在步骤S7中,网络设备接收来自所述用户设备发送的所述用户对所述一个或多个搜索建议的选择;在步骤S8中,网络设备根据所述用户对所述一个或多个搜索建议的选择,更新所述搜索建议库。具体地,用户通过与用户设备的交互,在提供给用户的一个或多个第一搜索建议中通过单击、滑动、悬停或双击等方式,对该一个或多个搜索建议的进行选择,在步骤S7中,网络设备通过调用该用户设备的应用程序接口(API)或通过诸如JSP、ASP或PHP等动态网页技术,获取该用户对该等一个或多个搜索建议的选择。随后,在步骤S8中,网络设备根据该用户对该一个或多个搜索建议的选择,通过例如数据库更新的方式,将用户选择的搜索建议与用户输入的查询序列的映射关系存入搜索建议库,以更新该搜索建议库。需要说明的是,上述举例仅为更好地说明本发明的技术方案,而非对本发明的限制,本领域技术人员应该理解,任何接收来自所述用户设备发送的所述用户对所述一个或多个搜索建议的选择,接着根据所述用户对所述一个或多个搜索建议的选择,更新所述搜索建议库的实现方式,均应包含在本发明的范围内。需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,其中的硬件可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括” 一词不排除其他步骤,单数不排除复数。装置权利要求中陈述的多个装置也可以由一个装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
权利要求
1.一种用于提供与查询序列相对应的搜索建议的方法,该方法包括以下步骤 a对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段; b在所述多个切分片段中选择片段分值大于预定阈值的多个切分片段; c将所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词; d根据所述一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述 一个或多个拼接查询关键词分别相对应的一个或多个搜索建议; e将所述一个或多个搜索建议提供至所述用户设备。
2.根据权利要求1所述的方法,其中,所述步骤d包括 -对所述一个或多个拼接查询关键词进行扩展处理,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词; -根据所述一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。
3.根据权利要求2所述的方法,其中,所述扩展操作基于以下至少任一项以获取所述一个或多个拼接扩展关键词 -所述拼接查询关键词中切分片段的同义词和/或近义词; -所述拼接查询关键词的查询联想信息; -所述拼接查询关键词的语义分析结果。
4.根据权利要求1至3任一项所述的方法,其中,该方法还包括 -根据与所述搜索建议相对应的建议相关信息,确定所述搜索建议的优选级信息; 其中,所述步骤e包括 -根据所述优选级信息,将所述搜索建议进行排序并提供至所述用户设备。
5.根据权利要求4所述的方法,其中,所述建议相关信息包括以下至少任一项 -所述搜索建议包括的切分片段个数; -所述搜索建议的点击频次; -所述搜索建议的来源信息。
6.根据权利要求1至5任一项所述的方法,其中,所述步骤d包括 -根据所述一个或多个拼接查询关键词,并结合用户相关信息,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。
7.根据权利要求6所述的方法,其中,所述用户相关信息包括以下至少任一项 -所述用户的个人属性; -所述用户的历史搜索记录; -所述用户的地域特征信息。
8.根据权利要求1至7任一项所述的方法,该方法还包括 -接收来自所述用户设备发送的所述用户对所述一个或多个搜索建议的选择; -根据所述用户对所述一个或多个搜索建议的选择,更新所述搜索建议库。
9.一种用于提供与查询序列相对应的搜索建议的提供装置,该提供装置包括 切分片段获取装置,用于对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段; 选择装置,用于在所述多个切分片段中选择片段分值大于预定阈值的多个切分片段;拼接装置,用于将所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词;搜索建议获取装置,用于根据所述一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议;搜索建议提供装置,用于将所述一个或多个搜索建议提供至所述用户设备。
10.根据权利要求9所述的提供装置,其中,所述搜索建议获取装置包括扩展装置,用于对所述一个或多个拼接查询关键词进行扩展处理,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个拼接扩展关键词;第一获取装置,用于根据所述一个或多个拼接扩展关键词,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。
11.根据权利要求10所述的提供装置,其中,所述扩展操作基于以下至少任一项以获取所述一个或多个拼接扩展关键词-所述拼接查询关键词中切分片段的同义词和/或近义词;-所述拼接查询关键词的查询联想信息;-所述拼接查询关键词的语义分析结果。
12.根据权利要求9至11任一项所述的提供装置,其中,该提供装置还包括确定装置,用于根据与所述搜索建议相对应的建议相关信息,确定所述搜索建议的优选级信息;其中,所述搜索建议提供装置用于根据所述优选级信息,将所述搜索建议进行排序并提供至所述用户设备。
13.根据权利要求12所述的提供装置,其中,所述建议相关信息包括以下至少任一项-所述搜索建议包括的切分片段个数;-所述搜索建议的点击频次;-所述搜索建议的来源信息。
14.根据权利要求9至13任一项所述的提供装置,其中,所述搜索建议获取装置用于根据所述一个或多个拼接查询关键词,并结合用户相关信息,在搜索建议库中进行匹配查询,以获取所述一个或多个搜索建议。
15.根据权利要求14所述的提供装置,其中,所述用户相关信息包括以下至少任一项-所述用户的个人属性;-所述用户的历史搜索记录;-所述用户的地域特征信息。
16.根据权利要求9至15任一项所述的提供装置,该提供装置还包括接收装置,用于接收来自所述用户设备发送的所述用户对所述一个或多个搜索建议的选择;更新装置,用于根据所述用户对所述一个或多个搜索建议的选择,更新所述搜索建议库。
17.一种网络设备,包括如权利要求9至15中至少一项所述的提供装置。
全文摘要
本发明的目的是提供一种用于提供与查询序列相对应的搜索建议的方法、装置与设备。其中,本发明对来自用户通过用户设备输入的查询序列进行切分处理,以获取多个切分片段;接着在所述多个切分片段中选择片段分值大于预定阈值的多个切分片段;接着将所选择的多个切分片段进行拼接处理,以获取一个或多个拼接查询关键词;随后根据所述一个或多个拼接查询关键词,在搜索建议库中进行匹配查询,以获取与所述一个或多个拼接查询关键词分别相对应的一个或多个搜索建议;随后将所述一个或多个搜索建议提供至所述用户设备。
文档编号G06F17/30GK103049495SQ201210526110
公开日2013年4月17日 申请日期2012年12月7日 优先权日2012年12月7日
发明者连茂泉, 叶靖, 李露平, 罗竞佳 申请人:百度在线网络技术(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1