信息搜索方法和装置制造方法

文档序号:6515925阅读:181来源:国知局
信息搜索方法和装置制造方法
【专利摘要】本发明公开了一种信息搜索方法和装置,其中,方法包括:接收用户输入的搜索关键词;对搜索关键词进行语义分析,根据语义分析的结果得出用户需求的多个信息类型及对应相关度;根据各信息类型的相关度将搜索关键词与各类型垂直搜索数据库分别进行匹配,获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据;将各类型搜索结果数据进行整合并进行展现。根据本发明,最终得到的搜索结果综合了多个垂直频道的内容,包含了用户各种可能的需求,与通用搜索相比,针对性更强,而又不像垂直搜索那样只限于用户选择的当前频道,从而减少了用户的无效操作,更快捷的满足用户需求。
【专利说明】信息搜索方法和装置
【技术领域】
[0001]本发明涉及互联网【技术领域】,具体涉及一种信息搜索方法和装置。
【背景技术】
[0002]搜索引擎为用户提供了方便的信息导航服务,已经成为用户上网时必不可少的信息检索工具。搜索引擎最为常见的一种搜索方式为通用搜索。在通用搜索中,搜索引擎将视频、电子书、文字、图片等多种内容按一定顺序排列后呈现给用户。然而,由于其返回的信息量通常极大,随之产生了查询不准确、深度不够等问题。
[0003]垂直搜索引擎即是针对这一问题提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务,例如,各大门户搜索网站提供的图片、音乐搜索频道,以及服务于特定行业的搜索网站,如购物,旅游,汽车等行业网站。
[0004]然而,由于垂直搜索引擎只返回关键词在该频道的结果,对于某些关键词的查询效果很差。例如,对于一些涉及信息类型广泛的关键词。图1中给出了这种情况的一个示例,如图1所示,用户在某一图片搜索频道输入关键词“刘德华”,该频道只返回了图片查询结果。然而,“刘德华”这一关键词还涉及电影、音乐等大量信息,如果用户有相关需求,则无法从当前频道中得到满足。对于其他垂直频道,该问题同样存在,例如,在新闻频道中搜索新闻,则得到的通常是时效性较强的新闻结果,而且信息较为零散,增加了用户的使用难度。
[0005]由此可知,对于部分关键词,通用搜索返回的结果十分繁杂,用户在其中难以定位有效信息,效率十分低下;另一方面;垂直搜索频道的返回结果又可能过于单一,无法满足用户的多方面需求。导致垂直频道中每天都会产生大量的非该频道能解决的用户查询,使用户产生大量的无效操作,也增加了用户的使用难度。

【发明内容】

[0006]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种信息搜索方法和装置。
[0007]根据本发明的一个方面,提供了一种信息搜索方法,包括:接收用户输入的搜索关键词;对搜索关键词进行语义分析,根据语义分析的结果得出用户需求的多个信息类型及对应相关度;根据各信息类型的相关度将搜索关键词与各类型垂直搜索数据库分别进行匹配,获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据;将各类型搜索结果数据进行整合以供进行展现。
[0008]根据本发明的另一方面,提供了一种信息搜索装置,包括:接收模块,适于接收用户输入的搜索关键词;分析模块,适于对搜索关键词进行语义分析,根据语义分析的结果得出用户需求的多个信息类型及对应相关度;结果获取模块,适于根据各信息类型的相关度将搜索关键词与各类型垂直搜索数据库分别进行匹配,获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据;整合模块,适于将各类型搜索结果数据进行整合以供进行展现。
[0009]根据本发明的信息搜索方法和装置,搜索引擎接收用户输入的搜索关键词,通过对搜索关键词的语义分析得出用户需求的多个信息类型及对应相关度,然后,根据相关度,在各类型垂直搜索数据库中匹配该搜索关键词,获取搜索关键词在对应垂直搜索数据库中的结果,经整合后向用户展示。这样,最终得到的搜索结果综合了多个垂直频道的内容,包含了用户各种可能的需求,与通用搜索相比,针对性更强,而又不像垂直搜索那样只限于用户选择的当前频道,从而减少了用户的无效操作,更快捷的满足用户需求。
[0010]上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的【具体实施方式】。
【专利附图】

【附图说明】
[0011]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0012]图1示出了现有技术中图片垂直搜索频道对搜索关键词的返回结果;
[0013]图2示出了根据本发明一个实施例的信息搜索方法的流程图;
[0014]图3示出了根据本发明一个实施例得到的整合结果的示意图;
[0015]图4示出了根据本发明一个实施例的信息搜索装置的结构示意图。
【具体实施方式】
[0016]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0017]图2示出了根据本发明一个实施例的信息搜索方法的流程图,如图2所示,该方法100始于步骤SlOl,其中,接收用户输入的搜索关键词。
[0018]通用搜索和垂直搜索都是根据用户提供的搜索关键词进行检索的。一般地,用户通过在搜索主页或各垂直频道页的搜索栏中输入搜索关键词,页面生成搜索请求并通过浏览器发送至搜索引擎服务器。本发明中,可以为用户提供专门的搜索页面,页面中输入的搜索关键词都按本发明方法获取结果,或者在通用、垂直搜索页面上为用户设置专门的搜索选项,如果用户选择该选项,则搜索引擎按本发明方法获取结果,如果用户未选择,则按该页面默认的通用搜索或垂直搜索方式获取结果。同样的方法适用于其他的搜索客户端,例如智能手机平台上的各种客户端软件。
[0019]搜索引擎接收搜索关键词后,方法100进入步骤S102,其中,对搜索关键词进行语义分析,根据语义分析的结果得出用户需求的多个信息类型及对应相关度。
[0020]用户提供的搜索关键词是搜索引擎判断用户所需信息类型的依据。用户输入的搜索关键词一般是自然语言,而搜索引擎无法直接理解搜索关键词所包含的意图,因此,对搜索关键词进行语义识别是必要的。
[0021]具体地,由于自然语言输入方法的多样性,用户输入的搜索关键词也可能并不规范,或者只是多个搜索关键词的堆砌。因此,语义分析的一种方法是先对搜索关键词进行切分词处理,即将用户输入的自然语言序列切分成有意义的词,然后根据切分词处理的结果,进行用户意图识别。
[0022]现有技术中有多种切分词方法,例如,基于字符串匹配的分词方法,基于理解的分词方法和基于统计的分词方法等。本领域技术人员能够根据需求进行选取,或是综合使用多种方法。
[0023]意图识别以切分词处理的结果为基础,然而,同样的切分词结果可能包含有多种意图。例如,对图1中的搜索关键词“刘德华”来说,切分词处理虽然能识别出“刘德华”为演艺明星的名字,但该搜索关键词代表的意图可能是多样的,包括图片、电影、电视剧、音乐下载等。为保证用户需求得到满足,步骤S102中的意图识别应该考虑所有可能的意图。
[0024]与切分词类似,现有技术中也存在多种意图识别方法,如词表匹配,统计模型,规则解析等方法,本领域技术人员可以根据情况灵活选用。
[0025]在步骤S102中,对输入的搜索关键词,除了获取用户所需信息类型外,还包括获取该搜索关键词与各信息类型的相关度。本发明中,通过相关度对用户的各种需求做出量化的评估,以供后续步骤使用。高的相关度即表示较强的用户需求。
[0026]例如,对搜索关键词“荷塘月色”,其意图可能包含歌曲《荷塘月色》下载、“荷塘月色”小区,以及散文《荷塘月色》。其中,歌曲下载的需求可能较高,则其相关度也较高,例如50 %,相应地,其他类型的相关度较低。
[0027]进一步地,获取相关度时还可以考虑搜索关键词的时效性,以搜索关键词“Iphone5”为例,上市之前,用户搜索该搜索关键词的意图绝大部分是新闻,即该搜索关键词与新闻的相关度接近100%,而上市后一段时间内,用户的意图大多是购买、资讯等内容,停产后,用户不再关注购买、新闻等内容,意图基本上集中为百科、问答等。用户对各信息类型的需求是随时间变化的,因此,同一搜索关键词的各信息类型的相关度也是动态的。
[0028]得出信息类型和相关度后,方法100进入步骤S103,其中,根据各信息类型的相关度将搜索关键词与各类型垂直搜索数据库分别进行匹配,获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据。
[0029]垂直搜索中搜索关键词在垂直搜索数据库中的匹配与通用搜索类似,这里不再描述。在该步骤中,还可以对相关度和信息类型做进一步的设定。如果用户在某一垂直频道中选择本发明提供的信息搜索方式,可以相应地增加这一信息类型的相关度,即将这一信息类型作为用户的主要需求,并在后续步骤中作为主要的结果呈现。
[0030]以搜索关键词“刘德华”为例,经过步骤S102中的切分词处理和意图识别后,得出这一搜索关键词涉及的信息类型包括图片、视频、新闻、百科等。在图3所示的情况中,用户在图片垂直频道输入搜索关键词并进行检索,则将图片作为用户的主要需求信息,并获取最多的数据结果,而将其他信息,如文字介绍、新闻、视频等,作为辅助信息展示。
[0031]类似地,对于新闻搜索频道,则可以从其他相应频道的数据库中获取与新闻相关的图片、视频、以及事件追踪等信息;对于地图搜索,在用户搜索某个地名或者机构时,在地点附近显示相关地名的文字介绍,建筑物图片等。[0032]可选地,步骤S103中获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据进一步为:从相关度高于预设阈值的信息类型对应的垂直搜索数据库中获取搜索结果数据。对于部分搜索关键词,用户需求的信息类型可能十分广泛,而各类型的相关度相差较大,如果从全部相关的垂直频道中获取信息,可能会降低查询速度,同时,返回的结果可能过于繁多,不利于大部分用户的使用。这时,可以根据步骤S102中对相关度做出的量化,预先为相关度设定一个阈值,如果某一类型的相关度低于该阈值,则认为用户不需要该类型信息,也不从相应的垂直频道中获取信息。
[0033]随后,方法100进入步骤S104,其中,将各类型搜索结果数据进行整合以供进行展现。
[0034]在进行结果数据的整合、展现时也应该考虑各信息类型的相关度。图3示出了多个搜索结果数据经整合后的示例。其中,用户在图片频道提交搜索关键词“刘德华”,则可以将“刘德华”相关的人物图片作为主要结果示出,其他类型的搜索结果包括人物简介,时效性较强的新闻,以及人物相关的最新的影视作品等内容。这些结果浮动显示在图片结果的左侧供用户选择,或者以弹出窗口、框架网页等形式呈现。
[0035]上述整合处理进一步包括根据相关度按照预设模板对搜索结果页进行重排版,将获取的不同类型结果按相关度排序后再显示。这里,首先包括类型之间的排序,其次是同一类型结果的排序。例如在图3中,搜索结果页优先展示了相关度高的人物简介,之后是新闻和最新视频;而在视频结果中,只展示了当前与人物相关度最高的两部影视作品。
[0036]以上情况中,用户是在垂直频道中输入的搜索关键词。如果用户是在通用搜索页提交的搜索关键词,则一种整合方法是在搜索结果页中按相关度优先展示该关键词在百科、音乐、视频、图片中的内容,然后在下方展示通用搜索获取的URL地址列表。
[0037]排版按照搜索服务商预先提供的模板进行,例如,通过HTML语言、Java脚本等写入页面的源代码中,对页面中的字体大小、颜色,图片、视频等的嵌入位置等进行设定。
[0038]在本发明上述实施例提供的方法中,搜索引擎接收用户输入的搜索关键词,通过对搜索关键词的语义分析得出用户需求的多各信息类型及对应相关度,然后,根据相关度,在各类型垂直搜索数据库中匹配该搜索关键词,获取搜索关键词在对应垂直搜索数据库中的结果,经整合后向用户展示。根据该方法,最终得到的搜索结果综合了多个垂直频道的内容,包含了用户各种可能的需求,与通用搜索相比,针对性更强,而又不像垂直搜索那样只限于用户选择的当前频道,从而减少了用户的无效操作,更快捷的满足用户需求。
[0039]图4示出了本发明一个实施例提供的信息搜索装置的结构示意图。如图4所示,该装置包括:接收模块21,分析模块22,结果获取模块23和整合模块24。
[0040]接收模块21适于接收用户输入的搜索关键词。一般地,用户通过在搜索主页或各垂直频道页的搜索栏中输入搜索关键词,页面生成搜索请求并通过浏览器发送至搜索引擎服务器。本发明中,接收模块21可以为用户提供专门的搜索页面,在该页面中输入的搜索关键词都按本发明方法获取结果,或者在通用、垂直搜索页面上为用户设置专门的搜索选项,如果用户选择该选项,则搜索引擎按本发明方法获取结果,如果用户未选择,则按该页面默认的通用搜索或垂直搜索方式获取结果。接收模块22适用于其他的搜索客户端,例如智能手机平台上的客户端软件。
[0041]分析模块22,适于对搜索关键词进行语义分析,根据语义分析的结果得出用户需求的多个信息类型及对应相关度。
[0042]搜索引擎根据用户提供的搜索关键词判断用户所需信息类型。用户输入的搜索关键词一般是自然语言,而搜索引擎无法直接理解关键词所包含的意图,需要分析模块22对搜索关键词进行语义识别。
[0043]具体地,由于自然语言输入方法的多样性,用户输入的关键词也可能并不规范,或者只是多个搜索关键词的堆砌。因此,分析模块22通常包括切分词处理模块220和意图识别模块221,其中,切分词处理模块220适于先对搜索关键词进行切分词处理,即将用户输入的自然语言序列切分成有意义的词,意图识别模块221适于根据切分词处理的结果,进行用户意图识别。
[0044]切分词处理模块220可以利用现有技术中的多种切分词方法处理搜索关键词,例如,基于字符串匹配的分词方法,基于理解的分词方法和基于统计的分词方法等。本领域技术人员可以根据需求进行选取,或是综合使用多种方法。
[0045]意图识别模块221以切分词处理的结果作为输入信息。然而,同样的切分词结果可能包含有多种意图。仍以图1中的搜索关键词“刘德华”为例,切分词处理虽然能识别出了“刘德华”为演艺明星的名字,但该搜索关键词能表现出的意图是多样的,包括图片、电影、电视剧、音乐下载等。为保证用户需求得到满足,意图识别模块221需要分析出用户所有可能的意图。
[0046]意图识别模块221可以利用现有技术的多种意图识别方法得出用户意图,如词表匹配,统计模型,规则解析等方法,本领域技术人员可以根据情况灵活选用。
[0047]意图识别模块221对于输入的搜索关键词,除了获取用户所需信息类型外,还获取该搜索关键词与各信息类型的相关度。用户识别模块221通过相关度对用户的各种需求做出量化的评估,以供其他模块利用,高的相关度表示较强的用户需求。
[0048]例如,对搜索关键词“荷塘月色”,意图识别模块221分析出用户需求的信息类型可能包含歌曲《荷塘月色》下载、“荷塘月色”小区,以及散文《荷塘月色》。其中,歌曲下载的需求较高,则其相关度也较高,例如50 %,相应地,其他类型的相关度较低。
[0049]进一步地,获取相关度时还可以考虑搜索关键词的时效性,以搜索关键词“Iphone5”为例,上市之前,用户搜索该搜索关键词的意图绝大部分是新闻,即该关键词与新闻的相关度接近100%,而上市后一段时间内,用户的意图大多是购买、资讯等内容,停产后,用户不再关注购买、新闻等内容,意图基本上集中为百科、问答等。用户对各信息类型的需求是随时间变化的,因此,同一搜索关键词的各信息类型的相关度也是动态的。
[0050]结果获取模块23适于根据各信息类型的相关度将搜索关键词与各类型垂直搜索数据库分别进行匹配,获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据。
[0051]垂直搜索中搜索关键词在垂直搜索数据库中的匹配与通用搜索类似,这里不再描述。结果获取模块23可以对相关度和信息类型做进一步的设定。如果用户在某一垂直频道中选择本发明提供的信息搜索方式,则结果获取模块23可以相应地增加这一信息类型的相关度,即将这一信息类型作为用户的主要需求。
[0052]以搜索关键词“刘德华”为例,经过切分词处理模块220和意图识别模块221分析后,得出这一搜索关键词涉及的信息类型包括图片、视频、新闻、百科等。在图3所示的情况中,用户在图片垂直频道输入搜索关键词并进行检索,则结果获取模块23将图片作为用户的主要需求信息,并获取最多的数据结果,而将其他信息,如文字介绍、新闻、视频等,作为辅助信息展示。
[0053]类似地,对于新闻搜索频道,则结果获取模块23可以从其他相应频道的数据库中获取与新闻相关的图片、视频、以及事件追踪等信息;对于地图搜索,在用户搜索某个地名或者机构时,获取相关地名的文字介绍,建筑物图片等。
[0054]可选地,结果获取模块23获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据进一步为:从相关度高于预设阈值的信息类型对应的垂直搜索数据库中获取搜索结果数据。这是由于,对于部分搜索关键词,用户需求的信息类型可能十分广泛,而各类型的相关度相差较大,如果从全部相关的垂直频道中获取信息,可能会降低查询速度,同时,返回的结果可能过于繁多,不利于大部分用户的使用。这时,结果获取模块23可以根据意图识别模块221对相关度做出的量化评估,预先为相关度设定一个阈值,如果某一类型的相关度低于该阈值,则认为用户不需要该类型信息,也不从相应的垂直频道中获取信息。
[0055]整合模块24适于将多个搜索结果数据进行整合并进行展现。
[0056]整合模块24进行结果数据的整合、展现时应该考虑各信息类型的相关度。图3示出了多个搜索结果数据经整合后的示例。其中,用户在图片频道提交搜索关键词“刘德华”,则整合模块24可以将“刘德华”相关的人物图片作为主要结果示出,将获取的其他类型的搜索结果,如人物简介,时效性较强的新闻,以及人物相关的最新的影视作品等内容浮动显示在图片结果的左侧供用户选择,或者以弹出窗口、框架网页等形式呈现。
[0057]整合模块24进一步适于根据相关度按照预设模板对搜索结果页进行重排版,将获取的不同类型结果按相关度排序后再显示。这里首先包括类型之间的排序,其次是同一类型结果的排序。例如在图3中,整合模块24优先展示了相关度高的人物简介,之后是新闻和最新视频;而在视频结果中,展示了当前与人物相关度最高的两部影视作品。
[0058]以上情况中,用户都是在垂直频道中输入的搜索关键词。如果用户是在通用搜索页提交的搜索关键词,整合模块24可以在结果页中按相关度中优先展示该关键词在百科、音乐、视频、图片中的内容,然后在下方展示通用搜索获取的URL列表。
[0059]整合模块24对结果页的排版按照搜索服务商预先提供的模板进行,例如,通过HTML语言、java脚本等写入页面的源代码中,对页面中的字体大小、颜色,图片、视频等的嵌入位置等进行设定。
[0060]在本发明上述实施例提供的装置中,接收模块接收用户输入的搜索关键词,分析模块通过其中的切分词处理模块和意图识别模块对搜索关键词进行语义分析,得出用户需求的多个信息类型及对应相关度,然后,结果获取模块根据相关度,在各类型垂直搜索数据库中匹配该搜索关键词,获取搜索关键词在对应垂直搜索数据库中的结果,经整合模块整合后向用户展示。采用该装置,最终得到的搜索结果综合了多个垂直频道的内容,包含了用户各种可能的需求,与通用搜索相比,针对性更强,而又不像垂直搜索那样只限于用户选择的当前频道,从而减少了用户的无效操作,更快捷的满足用户需求。
[0061]在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
[0062]在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
[0063]类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循【具体实施方式】的权利要求书由此明确地并入该【具体实施方式】,其中每个权利要求本身都作为本发明的单独实施例。
[0064]本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
[0065]此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
[0066]本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的信息搜索装置中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
[0067]应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
【权利要求】
1.一种信息搜索方法,包括: 接收用户输入的搜索关键词; 对所述搜索关键词进行语义分析,根据语义分析的结果得出用户需求的多个信息类型及对应相关度; 根据各信息类型的相关度将所述搜索关键词与各类型垂直搜索数据库分别进行匹配,获取所述搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据; 将所述各类型搜索结果数据进行整合以供进行展现。
2.根据权利要求1所述的方法,所述获取搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据进一步包括:从相关度高于预设阈值的信息类型对应的垂直搜索数据库中获取搜索结果数据。
3.根据权利要求1或2所述的方法,所述对搜索关键词进行语义分析,根据语义分析的结果得出满足用户需求的所有信息类型进一步包括: 对所述搜索关键词进行切分词处理; 根据所述切分词处理的结果进行用户意图识别,得出满足用户需求的多个信息类型。
4.根据权利要求1所述的方法,所述整合进一步包括根据所述相关度按照预设模板对搜索结果页进行重排版。
5.根据权利要求1或2所述的方法,所述垂直搜索数据库包括图片搜索数据库、视频搜索数据库、新闻搜索数据库或音乐搜索数据库。
6.—种信息搜索装置,包括: 接收模块,适于接收用户输入的搜索关键词; 分析模块,适于对所述搜索关键词进行语义分析,根据语义分析的结果得出用户需求的多个信息类型及对应相关度; 结果获取模块,适于根据各信息类型的相关度将所述搜索关键词与各类型垂直搜索数据库分别进行匹配,获取所述搜索关键词对应的多个垂直搜索数据库的各类型搜索结果数据; 整合模块,适于将各类型搜索结果数据进行整合以供进行展现。
7.根据权利要求6所述的装置,所述结果获取模块进一步适于从相关度高于预设阈值的信息类型对应的垂直搜索数据库中获取搜索结果数据。
8.根据权利要求6或7所述的装置,所述分析模块进一步包括: 切分词处理模块,适于对所述搜索关键词进行切分词处理; 意图识别模块,适于根据所述切分词处理的结果进行用户意图识别,得出满足用户需求的多个信息类型。
9.根据权利要求6所述的装置,所述整合模块进一步适于根据所述相关度按照预设模板对搜索结果页进行重排版。
10.根据权利要求6或7所述的装置,所述垂直搜索数据库包括图片搜索数据库、视频搜索数据库、新闻搜索数据库或音乐搜索数据库。
【文档编号】G06F17/30GK103514299SQ201310493353
【公开日】2014年1月15日 申请日期:2013年10月18日 优先权日:2013年10月18日
【发明者】侯小虎 申请人:北京奇虎科技有限公司, 奇智软件(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1