一种基于纠错相关度对查询序列进行纠错的设备和方法

文档序号:6358295阅读:343来源:国知局
专利名称:一种基于纠错相关度对查询序列进行纠错的设备和方法
技术领域
本发明涉及互联网搜索领域,尤其涉及互联网搜索中对网络用户输入进行纠错的技术。
背景技术
在现有技术中,当用户输入查询序列进行搜索时,有时会出现因打字错误或输入法选词不当而生成错误字符串或词组的情形,如果直接将这些错误字符串或词组作为查询关键词来进行搜索,目前绝大多数搜索引擎一般会主动给出经过简单纠错后的查询序列, 其提示形式诸如,“你要搜索的是不是XXX”。此时,用户只能被动地接受以“XXX”作为查询关键词而搜索出来的结果,在这一搜索过程中,用户既无法知晓期望键入的查询序列与经过简单纠错后的查询序列之间相关度如何,也无法选择除了上述简单纠错的查询序列之外的其他可能适用的备选序列,由上述可知,当前搜索引擎所提供的纠错方式相对比较单一,而且很有可能会因纠错准确率不高给用户带来负面的搜索体验,降低用户对于搜索引擎的依赖性。有鉴于此,如何对查询序列进行纠错,提供相对应的纠错序列,从而增强用户与搜索引擎之间的交互性,提升用户的搜索体验,是相关技术人员亟待解决的一项课题。

发明内容
本发明的目的是提供一种用于基于纠错相关度对查询序列进行纠错的设备和方法。根据本发明的一个方面,提供一种用于对查询序列进行纠错的方法,其中,该方法包括以下步骤a获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;b根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列;c根据所述纠错序列,获取与所述纠错序列相对应的查询结果;d将所述查询结果提供至所述用户设备。根据本发明的另一个方面,还提供了一种用于对查询序列进行纠错的设备,其中, 所述设备包括第一获取装置,用于获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;选取装置,用于根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列;第二获取装置,用于根据所述纠错序列,获取与所述纠错序列相对应的查询结果;提供装置,用于将所述查询结果提供至所述用户设备。
根据本发明的再一个方面,还提供了一种搜索引擎,其中,该搜索引擎包括本发明的一个方面所述的用于对查询序列进行纠错的设备。与现有技术相比,本发明通过候选纠错序列的纠错相关度来合理地选择对应的纠错序列,并将所述纠错序列对应的查询结果提供给用户,既提高了搜索引擎对于用户输入的查询序列的纠错准确率,又增强了用户与搜索引擎之间的交互性,进而提升了用户的搜索体验。


通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显图1示出依据本发明一个方面的用于基于纠错相关度对查询序列进行纠错的设备示意图;图2示出依据本发明一优选实施例的用于基于纠错相关度对查询序列进行纠错的设备示意图;图3示出依据本发明另一方面的用于基于纠错相关度对查询序列进行纠错的方法流程图;图4示出依据本发明一优选实施例的用于基于纠错相关度对查询序列进行纠错的方法流程图。附图中相同或相似的附图标记代表相同或相似的部件。
具体实施例方式下面结合附图对本发明作进一步详细描述。图1示出依据本发明一个方面的用于基于纠错相关度对查询序列进行纠错的设备示意图。其中,所述纠错设备1包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等,其中,云计算是分布式计算的一种,它可以看作是由一群松散耦合的计算机集组成的一个超级虚拟计算机。参照图1,所述纠错设备1包括第一获取装置11、选取装置12、第二获取装置13和提供装置14。具体地,纠错设备1的第一获取装置11获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;然后,选取装置12根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列;接着,第二获取装置13根据所述纠错序列,获取与所述纠错序列相对应的查询结果;最后,提供装置14将所述查询结果提供给所述用户设备。第一获取装置11用于获取与用户通过用户设备输入的查询序列相对应的候选纠错序列。具体地,第一获取装置11例如通过搜索引擎等第三方设备所提供的应用程序接口 (API)或约定的通信方式,从该第三方设备获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备输入的查询序列,并通过同音匹配、模糊音匹配或形近字匹配等方式,获取与该查询序列相对应的候选纠错序列;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备获取用户通过该用户设备输入的查询序列,并通过同音匹配、模糊音匹配或形近字匹配等方式,获取与该查询序列相对应的候选纠错序列。例如,当用户通过用户设备键入查询序列“福容花”时,第一获取装置11从所述用户设备获取该查询序列“福容花”,并通过同音匹配,基于与“福容”同音的“芙蓉”而得到候选纠错序列“芙蓉花”;又如,当用户通过用户设备键入查询序列“戍戌变法”时,第一获取装置 11从所述用户设备获取该查询序列“戍戌变法”,并通过形近字匹配,基于与“戍戌”字形相近的“戊戌”而得到候选纠错序列“戊戌变法”。又如,当用户通过用户设备输入查询序列包括英语单词或单词组合时,第一获取装置11通过诸如检查所述英语单词的拼写错误并且查找与这些英语单词拼写序列相近的其他单词,获取与所述查询序列相对应的候选纠错序列。本领域技术人员应能理解上述获取与用户通过用户设备输入的查询序列相对应的候选纠错序列的方式仅为举例,其他现有的或今后可能出现的获取与用户通过用户设备输入的查询序列相对应的候选纠错序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。选取装置12用于根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列。具体地,当第一获取装置11获取所述候选纠错序列后,选取装置12根据所述候选纠错序列的纠错相关度,通过诸如排序、纠错相关度阈值比较等方式,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列。例如,第一获取装置11获取与所述查询序列相对应的10个候选纠错序列,其中,1个候选纠错序列对应的纠错相关度为0. 9,其余9个候选纠错序列对应的纠错相关度均介于0. 4 0. 6之间,则选取装置12根据这10个候选纠错序列各自的纠错相关度,选取纠错相关度为0. 9的候选纠错序列作为与所述查询序列相对应的纠错序列。在此,选取装置12通过第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备直接获取候选纠错序列相对该查询序列的纠错相关度,或者,根据所述候选纠错序列的查询次数、查询频率等信息,确定该候选纠错序列相对该查询序列的纠错相关度。本领域技术人员应能理解上述选取与所述查询序列相对应的纠错序列的方式仅为举例,其他现有的或今后可能出现的选取与所述查询序列相对应的纠错序列的方式如可适用于本发明,也应包含在本发明保护范围以内, 并以引用方式包含于此。第二获取装置13用于根据所述纠错序列,获取与所述纠错序列相对应的查询结果。具体地,在所述选取装置12从所述候选纠错序列中选取与所述查询序列相对应的纠错序列后,第二获取装置13根据所选取的纠错序列,通过诸如搜索引擎服务器的搜索索引库来获取与所述纠错序列相对应的查询结果。例如,在上例中,选取装置12根据这10个候选纠错序列各自的纠错相关度,选取纠错相关度为0.9的候选纠错序列作为与所述查询序列相对应的纠错序列后,则第二获取装置13根据纠错相关度为0. 9的纠错序列,如“鲜花快递”,在搜索索引库中进行匹配查询,以获取对应的查询结果,该查询结果可以是与“鲜花快递”相匹配的多个页面搜索结果。又如,第一获取装置11获取10个候选纠错序列,这10个候选纠错序列各自的纠错相关度均介于0. 5 0. 7之间,此时选取装置12将所有10个候选纠错序列均作为纠错序列,第二获取装置13分别根据这10个纠错序列,在搜索索引库中进行匹配查询,以获取所有10个纠错序列中每一个纠错序列对应的查询结果。本领域技术人员应能理解上述获取与所述纠错序列相对应的查询结果的方式仅为举例,其他现有的或今后可能出现的获取与所述纠错序列相对应的查询结果的方式如可适用于本发明,也应包
7含在本发明保护范围以内,并以引用方式包含于此。提供装置14用于将所述查询结果提供至所述用户设备。具体地,通过第二获取装置13获取与所述纠错序列相对应的查询结果后,提供装置14通过诸如直接展现查询结果、提供与所述查询结果相对应的超链接等方式,将所述查询结果提供至所述用户设备。在此,所述查询结果包括但不限于一个网页、一个图片、一个电子邮件地址、一个文件,甚至是一个应用程序。而所述超链接包括但不限于文字超链接、图片超链接或logo超链接等。例如,当所述提供装置14将与所述查询结果相对应的超链接提供至所述用户设备时,用户点击所述超链接后,查询结果将显示在浏览器上,诸如,网页、图片、电子邮件地址、文件、应用程序。本领域技术人员应能理解上述将所述查询结果提供至所述用户设备的方式仅为举例,其他现有的或今后可能出现的将所述查询结果提供至所述用户设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,所述第一获取装置11还根据所述查询序列,结合预设纠错规则,获取所述候选纠错序列。更优选地,所述预设纠错规则基于以下至少任一项-所述查询序列的同音匹配;-所述查询序列的模糊音匹配;-所述查询序列的形近字匹配;-与所述查询序列相对应的编辑距离阈值。以所述查询序列的同音匹配为例,当用户通过用户设备键入所述查询序列时,第一获取装置11根据键入的查询序列获取与所述查询序列相对应的拼音字符串,通过诸如切词处理将所述拼音字符串划分为若干个子字符串,对其中的子字符串进行同音匹配,来获取与所述查询序列相对应的候选纠错序列。例如,当用户键入“鸭梨试验”时,第一获取装置11基于查询序列的同音匹配,获取候选纠错序列“压力试验”、“压力实验”、“压力时延” 等。以所述查询序列的模糊音匹配为例,当用户通过用户设备键入所述查询序列时,第一获取装置11根据键入的查询序列获取与所述查询序列相对应的拼音字符串,通过诸如切词处理将所述拼音字符串划分为若干个子字符串,对其中的子字符串进行模糊音匹配,来获取与所述查询序列相对应的候选纠错序列。例如,当用户键入“栓甜苦辣”时,第一获取装置11基于查询序列的模糊音匹配,获取候选纠错序列“酸甜苦辣”。以所述查询序列的形近字匹配为例,当用户通过用户设备键入所述查询序列时,第一获取装置11根据键入的查询序列,通过诸如切词处理将所述查询序列划分为若干个子字符串,对其中的子字符串进行形近字匹配,来获取与所述查询序列相对应的候选纠错序列。例如,当用户键入“游戈空间” 时,第一获取装置11基于查询序列的形近字匹配,可获取候选纠错序列“游弋空间”。以所述查询序列对应的编辑距离阈值为例,假定该编辑距离阈值为3,例如,当用户键入查询序列“福容花”时,将其中的“福”改写为“芙”,“容”改写为“蓉”,可以得到另一查询序列“芙蓉花”,由于这两个查询序列之间的编辑距离为2,小于上述编辑距离阈值3,则可以将“芙蓉花”作为所述查询序列“福容花”的候选纠错序列。又如,当用户键入查询序列“hllo”时, 一种可能的方式是在h与1之间插入e,得到“hello”,另一种可能的方式是在h与1之间插入0,在ο后面添加w,得到“hollow”,由于查询序列“hllo”与查询序列“hello”之间的编辑距离以及查询序列“hllo”与查询序列“hollow”之间的编辑距离均为2,小于上述编辑距离阈值3,则可以将“hello”和“hollow”同时作为所述查询序列“hllo”的候选纠错序列。在一个优选实施例中(参照图1),所述纠错设备1还包括第三获取装置(未示出),该第三获取装置基于预设的相关度规则,根据所述候选纠错序列,获取所述候选纠错序列的纠错相关度。以下参照图1对该优选实施例进行详细描述,其中,第一获取装置11 获取与用户通过用户设备输入的查询序列相对应的候选纠错序列,其具体过程与前述参照图1所描述的实施例中第一获取装置11所执行的过程相同,为简明起见,以引用方式包含于此,而不做赘述。优选地,所述预设的相关度规则包括基于以下至少任一项来获取所述候选纠错序列的纠错相关度-所述查询序列与所述候选纠错序列的共现频率;-所述查询序列与所述候选纠错序列之间的共现词数量;-所述候选纠错序列的查询次数;-所述查询序列的查询结果与所述候选纠错序列的查询结果的匹配度。以所述查询序列与所述候选纠错序列的共现频率为例,当用户输入的查询序列与所获取的候选纠错序列的共现频率越高,所述候选纠错序列的纠错相关度越高,反之,所述候选纠错序列的纠错相关度越低。在此,查询序列与候选纠错序列共现频率是指查询序列与候选纠错序列同时出现的频率高低。例如,输入查询序列“苍蝇”,欲搜索其在疾病症状方面的信息,则候选纠错序列可从其共现词典中选择“传播疾病”“肠胃病”“伤寒”“霍乱”“呕吐” “除四害”等。以所述查询序列与所述候选纠错序列之间的共现词数量为例,当用户输入的查询序列与所述候选纠错序列之间的共现词个数越多时,所述候选纠错序列的纠错相关度越高,反之,所述候选纠错序列的纠错相关度越低。以所述候选纠错序列的查询次数为例,当所述候选纠错序列的查询次数越大时,所述候选纠错序列的纠错相关度越高,反之, 所述候选纠错序列的纠错相关度越低。最后,以所述查询序列的查询结果与所述候选纠错序列的查询结果的匹配度为例,当所述查询序列的查询结果与所述候选纠错序列的查询结果之间的匹配度较高时,所述候选纠错序列的纠错相关度越高,反之,所述候选纠错序列的纠错相关度越低。此外,本发明还可以基于上述预设的相关度规则中各条规则之间的任意组合,来得到所述候选纠错序列的纠错相关度。在此,第三获取装置通过搜索引擎等第三方设备提供的应用程序接口(API)或其他约定的通信方式,从该第三方设备获取上述预设的相关度规则,或者,通过对搜索引擎的搜索日志进行统计分析,获取上述预设的相关度规则。本领域技术人员应能理解上述预设的相关度规则仅为举例,其他现有的或今后可能出现的预设的相关度规则如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。本领域技术人员应能理解,上述第一获取装置11与第三获取装置仅为示例,在本发明的其他优选实施例中,它们可以是两个独立的模块,也可全部集成在一个模块中。在一个优选实施例中(参照图1),所述选取装置12还根据所述候选纠错序列的纠错相关度,对所述候选纠错序列进行排序,以获取所述经排序的候选纠错序列;从所述经排序的候选纠错序列中选取所述纠错序列。例如,每个候选纠错序列均对应于各自的纠错相关度,选取装置12根据所述纠错相关度的数值大小对所述候选纠错序列进行排序,然后从经过排序的候选纠错序列中选取纠错序列。诸如,5个候选纠错序列各自的纠错相关度分别为0. 4,0. 8,0. 5,0. 9和0. 6,选取装置12根据这5个候选纠错序列的纠错相关度的数值大
9小,对所述候选纠错序列进行排序,依次为纠错相关度分别为0. 4、0. 5、0. 6、0. 8和0. 9所对应的候选纠错序列;或者,依次为纠错相关度分别为0. 9,0. 8,0. 6、0. 5和0. 4所对应的候选纠错序列。由于候选纠错序列已根据纠错相关度的数值大小进行排序,从而更加容易从中选取纠错序列。在另一个优选实施例中(参照图1),所述选取装置12还根据所述候选纠错序列的纠错相关度,结合预设的纠错相关度阈值,确定与所述候选纠错序列相对应的纠错等级; 根据所述纠错等级,从所述候选纠错序列中选取所述纠错序列。例如,假设所述预设的纠错相关度阈值为0. 5,所述选取装置12将所述候选纠错序列基于纠错相关度划分为高级和低级,然后将纠错等级为高级的候选纠错序列作为纠错序列。又如,假设所述预设的纠错相关度阈值为0. 2和0. 8,所述选取装置12将所述候选纠错序列基于纠错相关度划分为高级、中级和低级,然后将纠错等级为高级和中级的候选纠错序列作为纠错序列。由于候选纠错序列已根据预设的纠错相关度阈值确定与所述候选纠错序列相对应的纠错等级,也更加方便地根据纠错等级来选取纠错序列。在另一个优选实施例中(参照图1),所述提供装置14还基于预设提供规则,将与所述纠错序列相对应的查询结果提供至所述用户设备;其中,所述预设提供规则包括基于以下至少任一项将所述查询结果提供给所述用户设备-所述查询结果的提供区域;-所述查询结果的边界标注;-所述查询结果的显示颜色;-所述查询结果的提供顺序。以所述查询结果的提供区域为例,当用户输入查询序列后,所述纠错设备1的第一获取装置11首先获取与所述查询序列相对应的候选纠错序列,然后,选择装置12根据该候选纠错序列的纠错相关度来选取纠错序列,接着,第二获取装置13根据所选取的纠错序列,获取与所述纠错序列相对应的查询结果,最后,提供装置14根据所述查询结果的提供区域将与所述纠错序列相对应的查询结果提供至所述用户设备。以所述查询结果的边界标注为例,所述提供装置14根据所述查询结果的边界标注将与所述纠错序列相对应的查询结果提供至所述用户设备。例如,所述提供装置14将查询结果提供给用户设备时,在不同的查询结果之间进行边界标注,以明确表明边界相对两侧的查询结果来自于不同的纠错序列和/或查询序列。以所述查询结果的显示颜色为例,所述提供装置14根据所述查询结果的显示颜色将与所述纠错序列相对应的查询结果提供至所述用户设备。以所述查询结果的提供顺序为例,所述提供装置14在提供与多个纠错序列相对应的查询结果时,基于纠错序列的纠错相关度高低来顺序地提供所述查询结果;或者,在提供至少一个纠错序列相对应的查询结果以及用户输入的查询序列相对应的查询结果时,先提供用户所输入的查询序列的查询结果随后提供纠错序列相对应的查询结果,或者,在提供用户输入的查询序列相对应的查询结果以及至少一个纠错序列相对应的查询结果时,先提供纠错序列相对应的查询结果随后提供用户所输入的查询序列的查询结果。在此,提供装置14通过搜索引擎等第三方设备提供的应用程序接口(API)或其他约定的提供方式,从该第三方设备获取上述预设提供规则,或者,通过对搜索引擎的搜索日志进行统计分析,获取上述预设提供规则。本领域技术人员应能理解上述预设提供规则仅为举例,其他现有的或今后可能出现的预设提供规则如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,所述提供装置14还提供与所述纠错序列相对应的所述纠错相关度以及所述纠错序列相对应的查询结果至所述用户设备。具体地,所述提供装置14在提供所述纠错序列相对应的查询结果时,通过页面技术,如JSP、ASP或PHP等,将与所述纠错序列相对应的纠错相关度与所述查询结果一并提供给用户设备。采用该提供方式,本发明在将纠错相关度和查询结果提供给用户设备时,用户还可以借助于纠错相关度来确定搜索引擎对于当前输入的查询序列的纠错准确率,进一步增强了用户与搜索引擎之间的交互体验。图2示出依据本发明一优选实施例的用于基于纠错相关度对查询序列进行纠错的设备的结构示意图。其中,所述纠错设备1’包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等,其中,云计算是分布式计算的一种,它可以看作是由一群松散耦合的计算机集组成的一个超级虚拟计算机。参照图2,所述纠错设备1’包括第一获取装置11’、选取装置12’、第二获取装置 13’、提供装置14’和第四获取装置15’。具体地,纠错设备1’的第一获取装置11’获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;接着,选取装置12’根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列,并行可操作地,第四获取装置15’根据所述查询序列,获取与所述查询序列相对应的查询结果;然后,第二获取装置13’根据所述纠错序列,获取与所述纠错序列相对应的查询结果;最后,提供装置14’将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供给所述用户设备。为描述简便起见,在图2所示的纠错设备1’中,第一获取装置11’、选取装置12’、 第二获取装置13’分别与图1所示的第一获取装置11、选取装置12、第二获取装置13相同, 故此处不再赘述,并通过引用的方式包含于此。第四获取装置15’用于根据所述查询序列,获取与所述查询序列相对应的查询结果。具体地,第四获取装置15’通过诸如查询序列的切词处理、减小所述查询序列的检索粒度等方式,并以切词后的若干词条或更小的检索粒度作为新查询序列来获取与所述查询序列相对应的查询结果。例如,当用户输入“福容花”时,第四获取装置15’通过将所述查询序列切词为“/福容/花/”,然后以“福容”作为新的查询序列来获取与所述查询序列相对应的查询结果,诸如可能出现的查询结果为“福容大饭店”,“福容小学”等等。本领域技术人员应能理解上述获取与所述查询序列相对应的查询结果的方式仅为举例,其他现有的或今后可能出现的获取与所述查询序列相对应的查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。然后,提供装置14’提供与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果至所述用户设备。具体地,第二获取装置13’获取与所述纠错序列相对应的查询结果,以及第四获取装置15’获取与所述查询序列相对应的查询结果后,提供装置14’通过诸如直接展现所述查询序列和所述纠错序列各自的查询结果、提供与所述查询序列和所述纠错序列各自的查询结果相对应的超链接等方式将所述查询序列和所述纠错序列各自所对应的查询结果提供至所述用户设备。在此,所述查询结果包括但不限于一个网页、一个图片、一个电子邮件地址、一个文件,甚至是一个应用程序。而所述超链接包括但不限于文字超链接、图片超链接或logo超链接等。例如,当所述提供装置14’将与所述纠错序列和/或所述查询序列各自的查询结果相对应的超链接提供至所述用户设备时,用户点击所述超链接后,查询结果将显示在浏览器上,诸如,网页、图片、电子邮件地址、文件、应用程序。当利用所述提供装置14’提供所述查询序列对应的查询结果以及所述纠错序列对应的查询结果时,所述用户不仅能够得到用户查询序列本身所对应的查询结果,还能够得到经纠错处理后的纠错序列所对应的查询结果,因而用户可以根据自身需求来选择查看所述查询序列或所述纠错序列对应的查询结果。例如,当所述第一获取装置11’所获取的候选纠错序列的纠错相关度均不高,所述选取装置12’将所有的候选纠错序列作为纠错序列时,所述第二获取装置13’通过搜索索引库中的匹配查询而得到所有纠错序列对应的查询结果,在此情形下,所述提供装置14’提供所述查询序列对应的查询结果,因而用户可将该查询序列的查询结果与所有纠错序列的查询结果进行比较,以选择查看基于纠错前的查询序列或纠错后的纠错序列得到的查询结果,提升了用户的搜索体验。本领域技术人员应能理解上述将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备的方式仅为举例,其他现有的或今后可能出现的将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。本领域技术人员应能理解,上述第二获取装置13’与第四获取装置15’仅为示例, 在本发明的其他优选实施例中,它们可以是两个独立的模块,也可全部集成在一个模块中。在另一个优选实施例中(参照图2),所述提供装置14’还基于预设提供规则,将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备;其中,所述预设提供规则包括基于以下至少任一项将所述查询结果提供给所述用户设备-所述查询结果的提供区域;-所述查询结果的边界标注;-所述查询结果的显示颜色;-所述查询结果的提供顺序。以所述查询结果的提供区域为例,提供装置14’根据所述查询结果的提供区域将与所述纠错序列相对应的查询结果以及与所述查询序列相对应的查询结果提供至所述用户设备,例如,将所述纠错序列相对应的查询结果提供在用户设备的浏览器的左侧,而将所述查询序列相对应的查询结果提供在用户设备的浏览器的右侧。以所述查询结果的边界标注为例,所述提供装置14’根据所述查询结果的边界标注将与所述纠错序列相对应的查询结果以及与所述查询序列相对应的查询结果提供至所述用户设备。例如,所述提供装置14’ 将这些查询结果提供给用户设备时,在不同的查询结果之间进行边界标注,以明确表明边界相对两侧的查询结果来自于纠错序列或查询序列。以所述查询结果的显示颜色为例,所述提供装置14’根据所述查询结果的显示颜色将与所述纠错序列相对应的查询结果以及与所述查询序列相对应的查询结果提供至所述用户设备。以所述查询结果的提供顺序为例, 所述提供装置14在提供所述纠错序列相对应的查询结果以及所述查询序列相对应的查询结果时,先提供所述查询序列的查询结果随后提供所述纠错序列相对应的查询结果,或者, 先提供纠错序列相对应的查询结果随后提供所述查询序列的查询结果。在此,提供装置14’ 通过搜索引擎等第三方设备提供的应用程序接口(API)或其他约定的提供方式,从该第三方设备获取上述预设提供规则,或者,通过对搜索引擎的搜索日志进行统计分析,获取上述预设提供规则。本领域技术人员应能理解上述预设提供规则仅为举例,其他现有的或今后可能出现的预设提供规则如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,所述提供装置14’还提供与所述纠错序列相对应的所述纠错相关度以及所述纠错序列相对应的查询结果至所述用户设备。具体地,所述提供装置14’在提供所述纠错序列相对应的查询结果时,通过页面技术,如JSP、ASP或PHP等,将与所述纠错序列相对应的纠错相关度与所述查询结果一并提供给用户设备。采用该提供方式,本发明在将纠错相关度和查询结果提供给用户设备时,用户还可以借助于纠错相关度来确定搜索引擎对于当前输入的查询序列的纠错准确率,进一步增强了用户与搜索引擎之间的交互体验。此外,上述用于基于纠错相关度对查询序列进行纠错的纠错设备可以与现有的搜索引擎相结合,构成一种新的搜索引擎,现有的搜索引擎可以采用已知的如百度、Google、 Yahoo等搜索引擎。图3示出依据本发明另一方面的用于基于纠错相关度对查询序列进行纠错的方法流程图。其中,用于基于纠错相关度对查询序列进行纠错的纠错设备包括但不限于,单个网络服务器、多个网络服务器集、基于云计算的计算机集合等,其中,云计算是分布式计算的一种,它可以看作是由一群松散耦合的计算机集组成的一个超级虚拟计算机。参照图3,在步骤Sl中,所述纠错设备获取与用户通过用户设备输入的查询序列相对应的候选纠错序列。具体地,所述纠错设备例如通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;或者,通过搜索引擎等第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备获取该用户通过用户设备输入的查询序列, 并通过同音匹配、模糊音匹配或形近字匹配等方式,获取与该查询序列相对应的候选纠错序列;或者,通过页面技术,如ASP、JSP、PHP等,从用户设备获取用户通过该用户设备输入的查询序列,并通过同音匹配、模糊音匹配或形近字匹配等方式,获取与该查询序列相对应的候选纠错序列。例如,当用户通过用户设备键入查询序列“福容花”时,所述纠错设备从所述用户设备获取该查询序列“福容花”,并通过同音匹配,基于与“福容”同音的“芙蓉”而得到候选纠错序列“芙蓉花”;又如,当用户通过用户设备键入查询序列“戍戌变法”时,所述纠错设备从所述用户设备获取该查询序列“戍戌变法”,并通过形近字匹配,基于与“戍戌” 字形相近的“戊戌”而得到候选纠错序列“戊戌变法”。又如,当用户通过用户设备输入查询序列包括英语单词或单词组合时,所述纠错设备通过诸如检查所述英语单词的拼写错误并且查找与这些英语单词拼写序列相近的其他单词,获取与所述查询序列相对应的候选纠错序列。本领域技术人员应能理解上述获取与用户通过用户设备输入的查询序列相对应的候选纠错序列的方式仅为举例,其他现有的或今后可能出现的获取与用户通过用户设备输入的查询序列相对应的候选纠错序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。在步骤S2中,所述纠错设备根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列。具体地,当通过所述步骤Sl获取所述候选纠错序列后,所述纠错设备在步骤S2中根据所述候选纠错序列的纠错相关度,通过诸如排序、纠错相关度阈值比较等方式,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列。例如,所述纠错设备获取与所述查询序列相对应的10个候选纠错序列,其中,1 个候选纠错序列对应的纠错相关度为0. 9,其余9个候选纠错序列对应的纠错相关度均介于0. 4 0. 6之间,然后根据这10个候选纠错序列各自的纠错相关度,选取纠错相关度为 0.9的候选纠错序列作为与所述查询序列相对应的纠错序列。在此,所述纠错设备通过第三方设备所提供的应用程序接口(API)或约定的通信方式,从该第三方设备直接获取候选纠错序列相对该查询序列的纠错相关度,或者,根据所述候选纠错序列的查询次数、查询频率等信息,确定该候选纠错序列相对该查询序列的纠错相关度。本领域技术人员应能理解上述选取与所述查询序列相对应的纠错序列的方式仅为举例,其他现有的或今后可能出现的选取与所述查询序列相对应的纠错序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。在步骤S3中,所述纠错设备根据所述纠错序列,获取与所述纠错序列相对应的查询结果。具体地,在所述步骤S2从所述候选纠错序列中选取与所述查询序列相对应的纠错序列后,所述纠错设备根据所选取的纠错序列,通过诸如搜索引擎服务器的搜索索引库来获取与所述纠错序列相对应的查询结果。例如,在上例中,所述纠错设备根据这10个候选纠错序列各自的纠错相关度,选取纠错相关度为0.9的候选纠错序列作为与所述查询序列相对应的纠错序列后,然后根据纠错相关度为0. 9的纠错序列,如“鲜花快递”,在搜索索引库中进行匹配查询,以获取对应的查询结果,该查询结果可以是与“鲜花快递”相匹配的多个页面搜索结果。又如,所述纠错设备获取10个候选纠错序列,这10个候选纠错序列各自的纠错相关度均介于0. 5 0. 7之间,此时将所有10个候选纠错序列均作为纠错序列,然后分别根据这10个纠错序列,在搜索索引库中进行匹配查询,以获取所有10个纠错序列中每一个纠错序列对应的查询结果。本领域技术人员应能理解上述获取与所述纠错序列相对应的查询结果的方式仅为举例,其他现有的或今后可能出现的获取与所述纠错序列相对应的查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。在步骤S4中,所述纠错设备将所述查询结果提供至所述用户设备。具体地,通过所述步骤S3获取与所述纠错序列相对应的查询结果后,所述纠错设备通过诸如直接展现查询结果、提供与所述查询结果相对应的超链接等方式,将所述查询结果提供至所述用户设备。在此,所述查询结果包括但不限于一个网页、一个图片、一个电子邮件地址、一个文件,甚至是一个应用程序。而所述超链接包括但不限于文字超链接、图片超链接或logo超链接等。例如,当所述纠错设备将与所述查询结果相对应的超链接提供至所述用户设备时, 用户点击所述超链接后,查询结果将显示在浏览器上,诸如,网页、图片、电子邮件地址、文件、应用程序。本领域技术人员应能理解上述将所述查询结果提供至所述用户设备的方式仅为举例,其他现有的或今后可能出现的将所述查询结果提供至所述用户设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,在所述步骤Sl中,所述纠错设备还根据所述查询序列,结合预设纠错规则,获取所述候选纠错序列。更优选地,所述预设纠错规则基于以下至少任一项-所述查询序列的同音匹配;-所述查询序列的模糊音匹配;
-所述查询序列的形近字匹配;-与所述查询序列相对应的编辑距离阈值。以所述查询序列的同音匹配为例,当用户通过用户设备键入所述查询序列时,所述纠错设备根据键入的查询序列获取与所述查询序列相对应的拼音字符串,通过诸如切词处理将所述拼音字符串划分为若干个子字符串,对其中的子字符串进行同音匹配,来获取与所述查询序列相对应的候选纠错序列。例如,当用户键入“鸭梨试验”时,所述纠错设备基于查询序列的同音匹配,获取候选纠错序列“压力试验”、“压力实验”、“压力时延”等。以所述查询序列的模糊音匹配为例,当用户通过用户设备键入所述查询序列时,所述纠错设备根据键入的查询序列获取与所述查询序列相对应的拼音字符串,通过诸如切词处理将所述拼音字符串划分为若干个子字符串,对其中的子字符串进行模糊音匹配,来获取与所述查询序列相对应的候选纠错序列。例如,当用户键入“栓甜苦辣”时,所述纠错设备基于查询序列的模糊音匹配,获取候选纠错序列“酸甜苦辣”。以所述查询序列的形近字匹配为例, 当用户通过用户设备键入所述查询序列时,所述纠错设备根据键入的查询序列,通过诸如切词处理将所述查询序列划分为若干个子字符串,对其中的子字符串进行形近字匹配,来获取与所述查询序列相对应的候选纠错序列。例如,当用户键入“游戈空间”时,所述纠错设备基于查询序列的形近字匹配,可获取候选纠错序列“游弋空间”。以所述查询序列对应的编辑距离阈值为例,假定该编辑距离阈值为3,例如,当用户键入查询序列“福容花”时,将其中的“福”改写为“芙”,“容”改写为“蓉”,可以得到另一查询序列“芙蓉花”,由于这两个查询序列之间的编辑距离为2,小于上述编辑距离阈值3,则可以将“芙蓉花”作为所述查询序列“福容花”的候选纠错序列。又如,当用户键入查询序列“hllo”时,一种可能的方式是在h与1之间插入e,得到“hello”,另一种可能的方式是在h与1之间插入0,在ο后面添加w,得到“hollow”,由于查询序列“hllo”与查询序列“hello”之间的编辑距离以及查询序列“hllo”与查询序列“hollow”之间的编辑距离均为2,小于上述编辑距离阈值3,则可以将“hello”和“hoilow”同时作为所述查询序列“hiΙο”的候选纠错序列。在一个优选实施例中(参照图幻,该方法还包括步骤S6 (未示出),在所述步骤S6 中,所述纠错设备基于预设的相关度规则,根据所述候选纠错序列,获取所述候选纠错序列的纠错相关度。优选地,所述预设的相关度规则包括基于以下至少任一项来获取所述候选纠错序列的纠错相关度-所述查询序列与所述候选纠错序列的共现频率;-所述查询序列与所述候选纠错序列之间的共现词数量;-所述候选纠错序列的查询次数;-所述查询序列的查询结果与所述候选纠错序列的查询结果的匹配度。以所述查询序列与所述候选纠错序列的共现频率为例,当用户输入的查询序列与所获取的候选纠错序列的共现频率越高,所述候选纠错序列的纠错相关度越高,反之,所述候选纠错序列的纠错相关度越低。以所述查询序列与所述候选纠错序列之间的共现词数量为例,当用户输入的查询序列与所述候选纠错序列之间的共现词个数越多时,所述候选纠错序列的纠错相关度越高,反之,所述候选纠错序列的纠错相关度越低。以所述候选纠错序列的查询次数为例,当所述候选纠错序列的查询次数越大时,所述候选纠错序列的纠错相关度越高,反之,所述候选纠错序列的纠错相关度越低。最后,以所述查询序列的查询结果与所述候选纠错序列的查询结果的匹配度为例,当所述查询序列的查询结果与所述候选纠错序列的查询结果之间的匹配度较高时,所述候选纠错序列的纠错相关度越高,反之,所述候选纠错序列的纠错相关度越低。此外,本发明还可以基于上述预设的相关度规则中各条规则之间的任意组合,来得到所述候选纠错序列的纠错相关度。在此,所述纠错设备通过搜索引擎等第三方设备提供的应用程序接口(API)或其他约定的通信方式,从该第三方设备获取上述预设的相关度规则,或者,通过对搜索引擎的搜索日志进行统计分析,获取上述预设的相关度规则。本领域技术人员应能理解上述预设的相关度规则仅为举例,其他现有的或今后可能出现的预设的相关度规则如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。在一个优选实施例中(参照图幻,所述步骤S2中,所述纠错设备还根据所述候选纠错序列的纠错相关度,对所述候选纠错序列进行排序,以获取所述经排序的候选纠错序列;从所述经排序的候选纠错序列中选取所述纠错序列。例如,每个候选纠错序列均对应于各自的纠错相关度,所述纠错设备根据所述纠错相关度的数值大小对所述候选纠错序列进行排序,然后从经过排序的候选纠错序列中选取纠错序列。诸如,5个候选纠错序列各自的纠错相关度分别为0. 4,0. 8,0. 5,0. 9和0. 6,所述纠错设备根据这5个候选纠错序列的纠错相关度的数值大小,对所述候选纠错序列进行排序,依次为纠错相关度分别为0. 4,0. 5、 0. 6,0. 8和0. 9所对应的候选纠错序列;或者,依次为纠错相关度分别为0. 9,0. 8,0. 6,0. 5 和0.4所对应的候选纠错序列。由于候选纠错序列已根据纠错相关度的数值大小进行排序,从而更加容易从中选取纠错序列。在另一个优选实施例中(参照图幻,所述步骤S2中,所述纠错设备还根据所述候选纠错序列的纠错相关度,结合预设的纠错相关度阈值,确定与所述候选纠错序列相对应的纠错等级;根据所述纠错等级,从所述候选纠错序列中选取所述纠错序列。例如,假设所述预设的纠错相关度阈值为0. 5,所述纠错设备将所述候选纠错序列基于纠错相关度划分为高级和低级,然后将纠错等级为高级的候选纠错序列作为纠错序列。又如,假设所述预设的纠错相关度阈值为0. 2和0. 8,所述纠错设备将所述候选纠错序列基于纠错相关度划分为高级、中级和低级,然后将纠错等级为高级和中级的候选纠错序列作为纠错序列。由于候选纠错序列已根据预设的纠错相关度阈值确定与所述候选纠错序列相对应的纠错等级,也更加方便地根据纠错等级来选取纠错序列。在另一个优选实施例中(参照图3),所述步骤S4中,所述纠错设备还基于预设提供规则,将与所述纠错序列相对应的查询结果提供至所述用户设备;其中,所述预设提供规则包括基于以下至少任一项将所述查询结果提供给所述用户设备-所述查询结果的提供区域;-所述查询结果的边界标注;-所述查询结果的显示颜色;-所述查询结果的提供顺序。以所述查询结果的提供区域为例,当用户输入查询序列后,所述纠错设备首先获取与所述查询序列相对应的候选纠错序列;然后,根据该候选纠错序列的纠错相关度来选取纠错序列;接着,根据所选取的纠错序列,获取与所述纠错序列相对应的查询结果;最后,根据所述查询结果的提供区域将与所述纠错序列相对应的查询结果提供至所述用户设
16备。以所述查询结果的边界标注为例,所述纠错设备根据所述查询结果的边界标注将与所述纠错序列相对应的查询结果提供至所述用户设备。例如,所述纠错设备将查询结果提供给用户设备时,在不同的查询结果之间进行边界标注,以明确表明边界相对两侧的查询结果来自于不同的纠错序列和/或查询序列。以所述查询结果的显示颜色为例,所述纠错设备根据所述查询结果的显示颜色将与所述纠错序列相对应的查询结果提供至所述用户设备。以所述查询结果的提供顺序为例,所述纠错设备在提供与多个纠错序列相对应的查询结果时,基于纠错序列的纠错相关度高低来顺序地提供所述查询结果;或者,在提供至少一个纠错序列相对应的查询结果以及用户输入的查询序列相对应的查询结果时,先提供用户所输入的查询序列的查询结果随后提供纠错序列相对应的查询结果,或者,在提供用户输入的查询序列相对应的查询结果以及至少一个纠错序列相对应的查询结果时,先提供纠错序列相对应的查询结果随后提供用户所输入的查询序列的查询结果。在此,所述纠错设备通过搜索引擎等第三方设备提供的应用程序接口(API)或其他约定的提供方式,从该第三方设备获取上述预设提供规则,或者,通过对搜索引擎的搜索日志进行统计分析,获取上述预设提供规则。本领域技术人员应能理解上述预设提供规则仅为举例,其他现有的或今后可能出现的预设提供规则如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,在所述步骤S4中,所述纠错设备还提供与所述纠错序列相对应的所述纠错相关度以及所述纠错序列相对应的查询结果至所述用户设备。具体地,所述纠错设备在提供所述纠错序列相对应的查询结果时,通过页面技术,如JSP、ASP或PHP等,将与所述纠错序列相对应的纠错相关度与所述查询结果一并提供给用户设备。采用该提供方式,本发明在将纠错相关度和查询结果提供给用户设备时,用户还可以借助于纠错相关度来确定搜索引擎对于当前输入的查询序列的纠错准确率,进一步增强了用户与搜索引擎之间的交互体验。图4示出依据本发明一优选实施例的用于基于纠错相关度对查询序列进行纠错的方法流程图。其中,用于基于纠错相关度对查询序列进行纠错的纠错设备包括但不限于, 单个网络服务器、多个网络服务器集、基于云计算的计算机集合等,其中,云计算是分布式计算的一种,它可以看作是由一群松散耦合的计算机集组成的一个超级虚拟计算机。为描述简便起见,在图4所示的纠错方法中,步骤Si’、步骤S2’、步骤S3’分别与图3所示的步骤Si、步骤S2、步骤S3相同或相似,故此处不再赘述,并通过引用的方式包含于此。在步骤S5’中,所述纠错设备根据所述查询序列,获取与所述查询序列相对应的查询结果。具体地,所述纠错设备通过诸如查询序列的切词处理、减小所述查询序列的检索粒度等方式,并以切词后的若干词条或更小的检索粒度作为新查询序列来获取与所述查询序列相对应的查询结果。例如,当用户输入“福容花”时,所述纠错设备通过将所述查询序列切词为“/福容/花/”,然后以“福容”作为新的查询序列来获取与所述查询序列相对应的查询结果,诸如可能出现的查询结果为“福容大饭店”,“福容小学”等等。本领域技术人员应能理解上述获取与所述查询序列相对应的查询结果的方式仅为举例,其他现有的或今后可能出现的获取与所述查询序列相对应的查询结果的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
17
然后,在所述步骤S4’中,所述纠错设备提供与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果至所述用户设备。具体地,通过所述步骤S3’获取与所述纠错序列相对应的查询结果,以及通过所述步骤S5’获取与所述查询序列相对应的查询结果后,所述纠错设备通过诸如直接展现所述查询序列和所述纠错序列各自的查询结果、 提供与所述查询序列和所述纠错序列各自的查询结果相对应的超链接等方式将所述查询序列和所述纠错序列各自所对应的查询结果提供至所述用户设备。在此,所述查询结果包括但不限于一个网页、一个图片、一个电子邮件地址、一个文件,甚至是一个应用程序。而所述超链接包括但不限于文字超链接、图片超链接或logo超链接等。例如,当所述纠错设备将与所述纠错序列和/或所述查询序列各自的查询结果相对应的超链接提供至所述用户设备时,用户点击所述超链接后,查询结果将显示在浏览器上,诸如,网页、图片、电子邮件地址、文件、应用程序。当利用所述步骤S4’提供所述查询序列对应的查询结果以及所述纠错序列对应的查询结果时,所述用户不仅能够得到用户查询序列本身所对应的查询结果, 还能够得到经纠错处理后的纠错序列所对应的查询结果,因而用户可以根据自身需求来选择查看所述查询序列或所述纠错序列对应的查询结果。例如,当利用所述步骤Si’所获取的候选纠错序列的纠错相关度均不高,并通过所述步骤S2’将所有的候选纠错序列作为纠错序列时,在所述步骤S3’中,所述纠错设备通过搜索索引库中的匹配查询而得到所有纠错序列对应的查询结果,在此情形下,通过所述步骤S4,提供所述查询序列对应的查询结果, 可使用户将该查询序列的查询结果与所有纠错序列的查询结果进行比较,以选择查看基于纠错前的查询序列或纠错后的纠错序列得到的查询结果,提升了用户的搜索体验。本领域技术人员应能理解上述将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备的方式仅为举例,其他现有的或今后可能出现的将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备的方式如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。在另一个优选实施例中(参照图4),所述步骤S4’中,所述纠错设备还基于预设提供规则,将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备;其中,所述预设提供规则包括基于以下至少任一项将所述查询结果提供给所述用户设备-所述查询结果的提供区域;-所述查询结果的边界标注;-所述查询结果的显示颜色;-所述查询结果的提供顺序。以所述查询结果的提供区域为例,所述纠错设备根据所述查询结果的提供区域将与所述纠错序列相对应的查询结果以及与所述查询序列相对应的查询结果提供至所述用户设备,例如,将所述纠错序列相对应的查询结果提供在用户设备的浏览器的左侧,而将所述查询序列相对应的查询结果提供在用户设备的浏览器的右侧。以所述查询结果的边界标注为例,所述纠错设备根据所述查询结果的边界标注将与所述纠错序列相对应的查询结果以及与所述查询序列相对应的查询结果提供至所述用户设备。例如,所述纠错设备将这些查询结果提供给用户设备时,在不同的查询结果之间进行边界标注,以明确表明边界相对两侧的查询结果来自于纠错序列或查询序列。以所述查询结果的显示颜色为例,所述纠错设备根据所述查询结果的显示颜色将与所述纠错序列相对应的查询结果以及与所述查询序列相对应的查询结果提供至所述用户设备。以所述查询结果的提供顺序为例,所述纠错设备在提供所述纠错序列相对应的查询结果以及所述查询序列相对应的查询结果时,先提供所述查询序列的查询结果随后提供所述纠错序列相对应的查询结果,或者,先提供纠错序列相对应的查询结果随后提供所述查询序列的查询结果。在此,所述纠错设备通过搜索引擎等第三方设备提供的应用程序接口(API)或其他约定的提供方式,从该第三方设备获取上述预设提供规则,或者,通过对搜索引擎的搜索日志进行统计分析,获取上述预设提供规则。本领域技术人员应能理解上述预设提供规则仅为举例,其他现有的或今后可能出现的预设提供规则如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。优选地,在所述步骤S4’中,所述纠错设备还提供与所述纠错序列相对应的所述纠错相关度以及所述纠错序列相对应的查询结果至所述用户设备。具体地,所述纠错设备在提供所述纠错序列相对应的查询结果时,通过页面技术,如JSP、ASP或PHP等,将与所述纠错序列相对应的纠错相关度与所述查询结果一并提供给用户设备。采用该提供方式,本发明在将纠错相关度和查询结果提供给用户设备时,用户还可以借助于纠错相关度来确定搜索引擎对于当前输入的查询序列的纠错准确率,进一步增强了用户与搜索引擎之间的交互体验。对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括” 一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
权利要求
1.一种计算机实现的用于对查询序列进行纠错的方法,其中,该方法包括以下步骤 a获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;b根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列;c根据所述纠错序列,获取与所述纠错序列相对应的查询结果; d将所述查询结果提供至所述用户设备。
2.根据权利要求1所述的方法,其中,所述步骤a还包括-根据所述查询序列,结合预设纠错规则,获取所述候选纠错序列。
3.根据权利要求2所述的方法,其中,所述预设纠错规则基于以下至少任一项 -所述查询序列的同音匹配;-所述查询序列的模糊音匹配; -所述查询序列的形近字匹配; -与所述查询序列相对应的编辑距离阈值。
4.根据权利要求1至3中任一项所述的方法,其中,所述方法还包括-基于预设的相关度规则,根据所述候选纠错序列,获取所述候选纠错序列的纠错相关度。
5.根据权利要求4所述的方法,其中,所述预设的相关度规则包括基于以下至少任一项来获取所述候选纠错序列的纠错相关度-所述查询序列与所述候选纠错序列的共现频率; -所述查询序列与所述候选纠错序列之间的共现词数量; -所述候选纠错序列的查询次数;-所述查询序列的查询结果与所述候选纠错序列的查询结果的匹配度。
6.根据权利要求1至5中任一项所述的方法,其中,所述步骤b还包括-根据所述候选纠错序列的纠错相关度,对所述候选纠错序列进行排序,以获取所述经排序的候选纠错序列;-从所述经排序的候选纠错序列中选取所述纠错序列。
7.根据权利要求1至6中任一项所述的方法,其中,所述步骤b还包括-根据所述候选纠错序列的纠错相关度,结合预设的纠错相关度阈值,确定与所述候选纠错序列相对应的纠错等级;-根据所述纠错等级,从所述候选纠错序列中选取所述纠错序列。
8.根据权利要求1至7中任一项所述的方法,其中,该方法还包括 -根据所述查询序列,获取与所述查询序列相对应的查询结果;其中,所述步骤d还包括-将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备。
9.根据权利要求1至8中任一项所述的方法,其中,所述步骤d还包括-基于预设提供规则,将与所述纠错序列相对应的查询结果提供至所述用户设备; 其中,所述预设提供规则包括基于以下至少任一项将所述查询结果提供给所述用户-所述查询结果的提供区域; -所述查询结果的边界标注; -所述查询结果的显示颜色; -所述查询结果的提供顺序。
10.根据权利要求1至9中任一项所述的方法,其中,所述步骤d还包括-将与所述纠错序列相对应的所述纠错相关度以及所述查询结果提供至所述用户设备。
11.一种用于对查询序列进行纠错的设备,其中,所述设备包括第一获取装置,用于获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;选取装置,用于根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列;第二获取装置,用于根据所述纠错序列,获取与所述纠错序列相对应的查询结果; 提供装置,用于将所述查询结果提供至所述用户设备。
12.根据权利要求11所述的设备,其中,所述第一获取装置还用于 -根据所述查询序列,结合预设纠错规则,获取所述候选纠错序列。
13.根据权利要求12所述的设备,其中,所述预设纠错规则基于以下至少任一项 -所述查询序列的同音匹配;-所述查询序列的模糊音匹配; -所述查询序列的形近字匹配; -与所述查询序列相对应的编辑距离阈值。
14.根据权利要求11至13中任一项所述的设备,其中,所述设备还包括第三获取装置, 用于-基于预设的相关度规则,根据所述候选纠错序列,获取所述候选纠错序列的纠错相关度。
15.根据权利要求14所述的设备,其中,所述预设的相关度规则包括基于以下至少任一项来获取所述候选纠错序列的纠错相关度-所述查询序列与所述候选纠错序列的共现频率; -所述查询序列与所述候选纠错序列之间的共现词数量; -所述候选纠错序列的查询次数;-所述查询序列的查询结果与所述候选纠错序列的查询结果的匹配度。
16.根据权利要求11至15中任一项所述的设备,其中,所述选取装置还用于-根据所述候选纠错序列的纠错相关度,对所述候选纠错序列进行排序,以获取经排序的所述候选纠错序列;-从所述经排序的候选纠错序列中选取所述纠错序列。
17.根据权利要求11至16中任一项所述的设备,其中,所述选取装置还用于-根据所述候选纠错序列的纠错相关度,结合预设的纠错相关度阈值,确定与所述候选纠错序列相对应的纠错等级;-根据所述纠错等级,从所述候选纠错序列中选取所述纠错序列。
18.根据权利要求11至17中任一项所述的设备,其中,所述设备还包括第四获取装置, 用于-根据所述查询序列,获取与所述查询序列相对应的查询结果; 其中,所述提供装置还用于-将与所述查询序列相对应的查询结果以及与所述纠错序列相对应的查询结果提供至所述用户设备。
19.根据权利要求11至18中任一项所述的设备,其中,所述提供装置还用于-基于预设提供规则,将与所述纠错序列相对应的查询结果提供至所述用户设备; 其中,所述预设提供规则包括基于以下至少任一项将所述查询结果提供给所述用户设备-所述查询结果的提供区域; -所述查询结果的边界标注; -所述查询结果的显示颜色; -所述查询结果的提供顺序。
20.根据权利要求11至19中任一项所述的设备,其中,所述提供装置还用于 -将与所述纠错序列相对应的所述纠错相关度以及所述查询结果提供至所述用户设备。
21.一种搜索引擎,其中,该搜索引擎包括如权利要求11至20中任一项所述的用于对查询序列进行纠错的设备。
全文摘要
本发明提供一种用于基于纠错相关度对查询序列进行纠错的设备和方法,包括获取与用户通过用户设备输入的查询序列相对应的候选纠错序列;根据所述候选纠错序列的纠错相关度,从所述候选纠错序列中选取与所述查询序列相对应的纠错序列;根据所述纠错序列,获取与所述纠错序列相对应的查询结果;将所述查询结果提供至所述用户设备。与现有技术相比,本发明通过候选纠错序列的纠错相关度来合理地选择对应的纠错序列,并将所述纠错序列对应的查询结果提供给用户,既提高了搜索引擎对于用户输入的查询序列的纠错准确率,又增强了用户与搜索引擎之间的交互性,进而提升了用户的搜索体验。
文档编号G06F17/30GK102163234SQ20111009805
公开日2011年8月24日 申请日期2011年4月19日 优先权日2011年4月19日
发明者仙云森 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1