信息搜索方法和装置制造方法

文档序号:6543450阅读:117来源:国知局
信息搜索方法和装置制造方法
【专利摘要】本发明提出一种信息搜索方法和装置。其中,方法包括:接收用户输入的查询信息,根据查询信息获得意图澄清引导语句;接收用户根据意图澄清引导语句输入的更新后的查询信息,根据更新后的查询信息获得搜索结果;以及向客户端返回搜索结果,以用于向用户展示。本发明实施例的信息搜索方法,通过接收用户输入的查询信息,根据查询信息获得意图澄清引导语句,并引导用户根据意图澄清引导语句更新查询信息,再根据更新后的查询信息获得搜索结果,引导和帮助用户对自己的搜索意图进行了澄清,提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求,从而提升了用户体验。
【专利说明】信息搜索方法和装置
【技术领域】
[0001]本发明涉及计算机网络【技术领域】,特别涉及一种信息搜索方法和装置。
【背景技术】
[0002]随着计算机技术的不断发展,使得互联网的应用越来越普及,互联网的用户可以通过搜索引擎来获取其需要的网络资源。目前,传统的搜索方法如下:首先,用户输入查询词,然后搜索引擎根据用户输入的查询词获得相关的搜索结果并返回至客户端,最后用户在返回的搜索结果中获得自己所需的资源。
[0003]但是,在实现本发明过程中,发明人发现现有技术中至少存在如下问题:通过以上方法进行搜索时,用户经常会因为输入的查询词表述不清楚或不全面,导致搜索引擎无法为用户提供准确的答案。即使对于相同的资源,由于用户对查询领域的不了解,用户通过输入不同的查询词进行多次搜索,获得的搜索结果仍无法满足用户的需求。

【发明内容】

[0004]本发明实施例旨在至少在一定程度上解决上述技术问题。
[0005]为此,本发明的第一个目的在于提出一种信息搜索方法,该方法能够对用户的搜索意图进行引导澄清,提高搜索引擎识别用户搜索意图的准确性,满足用户的需求,从而提升用户体验。
[0006]为达上述目的,根据本发明第一方面实施例提出了一种信息搜索方法,包括:接收用户输入的查询信息,根据所述查询信息获得意图澄清引导语句;接收用户根据所述意图澄清引导语句输入的更新后的查询信息,根据所述更新后的查询信息获得搜索结果;以及向客户端返回所述搜索结果,以用于向所述用户展示。
[0007]本发明实施例的信息搜索方法,通过获得搜索引擎提供的意图澄清引导语句,并根据意图澄清引导语句引导用户更新查询信息,以及根据更新后的查询信息获得搜索结果,对用户的搜索意图进行了澄清,提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求,从而提升了用户体验。
[0008]本发明第二方面实施例提出了一种信息搜索装置,包括:获得模块,用于接收用户输入的查询信息,根据所述查询信息获得意图澄清引导语句;更新模块,用于接收用户根据所述意图澄清引导语句输入的更新后的查询信息,根据所述更新后的查询信息获得搜索结果;以及返回模块,用于向客户端返回所述搜索结果,以用于向所述用户展示。
[0009]本发明实施例的信息搜索装置,通过获得搜索引擎提供的意图澄清引导语句,并引导用户根据意图澄清引导语句更新查询信息,以及根据更新后的查询信息获得搜索结果,对用户的搜索意图进行了澄清,提高了搜索引擎识别用户搜索意图的准确性,满足了用户的需求,从而提升了用户体验。
[0010]本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。【专利附图】

【附图说明】
[0011]图1为根据本发明一个实施例的信息搜索方法的流程图。
[0012]图2为根据本发明一个实施例的建立语句库的流程图。
[0013]图3为根据本发明一个实施例的根据查询信息获得意图澄清引导语句的流程图。
[0014]图4为根据本发明一个具体实施例的信息搜索方法的流程图。
[0015]图5为根据本发明一个实施例的基于社区式问答资源获取交互句对的效果示意图。
[0016]图6 Ca)为根据本发明一个实施例的获取意图澄清引导语句的效果示意图。
[0017]图6 (b)为根据本发明一个实施例的根据意图澄清引导语句更新查询信息,获得搜索结果的效果示意图。
[0018]图7为根据本发明一个实施例的信息搜索装置的结构示意图。
【具体实施方式】
[0019]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0020]下面参考附图描述本发明实施例的信息搜索方法和装置。
[0021]图1为根据本发明一个实施例的信息搜索方法的流程图。如图1所示,该信息搜索方法包括:
[0022]S101,接收用户输入的查询信息,根据查询信息获得意图澄清引导语句。
[0023]在本发明的实施例中,查询信息可以为查询词或查询语句,在根据查询信息获得意图澄清引导语句之前,先要建立语句库,以使搜索引擎查询该语句库从而获得意图澄清弓I导语句。当然,如果已经建立语句库,则无需建立语句库的步骤。
[0024]S102,接收用户根据意图澄清引导语句输入的更新后的查询信息,根据更新后的查询信息获得搜索结果。
[0025]在本发明的实施例中,在获得意图澄清引导语句后,搜索引擎可获取用户根据意图澄清引导语句更新后的查询信息,然后根据更新后的查询信息获得搜索结果。具体地,搜索引擎可通过客户端向用户展示意图澄清引导语句,然后用户根据意图澄清引导语句,在搜索引擎提供的输入框中输入更新的查询信息,最后搜索引擎根据更新后的查询信息进行搜索,并获得搜索结果。
[0026]S103,向客户端返回搜索结果,以用于向用户展示。
[0027]在本发明的实施例中,在搜索引擎根据更新后的查询信息获得搜索结果后,搜索引擎可向客户端返回该搜索结果,并向用户展示。用户可根据展示的搜索结果,获得自己需要的资源。
[0028]在本发明的实施例中,如图2所示,在根据查询信息获得意图澄清引导语句之前,建立语句库,可包括以下步骤:
[0029]S201,根据第一信息获取第一语句。
[0030]首先,搜索引擎可对第一信息进行切分处理,然后根据预设特征判断第一信息是否为预设句型。如果确定第一信息为预设句型,则根据第一信息获取第一语句。其中,第一信息可为社区用户知识交流平台中的语句。预设句型可为各种疑问句等。预设特征可为疑问词词典或问句特征等。
[0031]S202,根据与第一信息相关的第二信息获取第二语句。
[0032]首先,搜索引擎可对与第一信息相关的第二信息进行切分处理,然后根据预设特征判断第二信息是否为预设句型。如果确定与第一信息相关的第二信息为预设句型,则根据第二信息获取第二语句。其中,第二信息与第一信息相关。
[0033]S203,根据第一语句和第二语句,建立语句库中的至少一个句对。
[0034]在获取第一语句和第二语句后,搜索引擎可根据第一语句和第二语句建立至少一个句对,然后将建立的句对存入语句库中,用以建立语句库。
[0035]具体地,搜索引擎可对社区用户知识交流平台中的资源进行查询,在这类资源中包含用户提出的大量的问题(第一信息)以及其他用户对提出的问题进行的回答(第二信息)。在确定用户提出的问题和其他用户对提出的问题进行的回答均为预设句型后,搜索引擎可获取其中至少一个问题(第一语句)及其问题的答案(第二语句)建立的句对,以此建立语句库。例如:“百度知道”中有用户提问“宝宝发烧38.5度怎么办? ”,有用户回答“要看宝宝多大”,搜索引擎可获得该问答的交互句对,并将该句对存入语句库中,以此建立语句库。
[0036]在本发明的实施例中,在根据第一语句和第二语句,建立语句库中的至少一个句对之后,搜索引擎还可对语句库中的句对进行过滤处理。具体地,根据预设过滤规则对语句库中的第二语句进行过滤。例如:第一语句“十一出游好玩的地方”与第二语句“十一哪里好玩? ”语义相似,属于同一个问题,因此需要进行过滤。
[0037]在本发明的实施例中,在建立语句库后,用户可在搜索弓I擎提供的输入框中输入查询信息。然后,搜索引擎可根据该查询信息查询语句库,从而获得意图澄清引导语句。具体地,如图3所示,根据查询信息获得意图澄清引导语句,包括以下步骤:
[0038]S301,获得查询信息的特征信息,根据特征信息获得与特征信息相关的第一语句。
[0039]具体地,搜索引擎首先获得查询信息的特征信息,并查询语句库中根据所有第一语句的特征信息生成的倒排索引,然后根据倒排索引对查询信息的特征信息进行匹配,以此获得特征信息相关的第一语句。
[0040]在本发明的实施例中,当第一语句与查询信息的语义相似度大于第一预设阈值时,搜索引擎可获得第一语句。反之,若第一语句与查询信息的语义相似度小于第一预设阈值,则表示第一语句与查询信息无关,对该第一语句进行过滤处理。
[0041]S302,根据与特征信息相关的第一语句查询语句库,获得与第一语句对应的第二语句。
[0042]搜索引擎在获得与特征信息相关的第一语句后,可根据与特征信息相关的第一语句查询语句库,获得与第一语句对应的第二语句。具体地,与特征信息相关的第一语句,可包含多个与之对应的第二语句,因此可通过查询语句库获得与第一语句对应的第二语句。
[0043]在本发明的实施例中,当查询信息中不包含第二语句的预设类型关键词时,获得第二语句。反之,若查询信息中包含第二语句的预设类型关键词,例如:疑问词“什么”,则对该第二语句进行过滤处理。
[0044]在本发明的实施例中,当查询信息和第二语句的语义相似度小于第二预设阈值时,则获得第二语句。反之,若查询信息和第二语句的语义相似度大于第二预设阈值,表示查询信息和第二语句属于同一类型语句,为了避免重复,对该第二语句进行过滤处理。
[0045]S303,根据第二语句获得意图澄清引导语句。
[0046]在本发明的实施例中,在获得与第一语句对应的第二语句后,搜索引擎可对与第二语句进行排序和聚类处理。
[0047]具体地,可根据公式
【权利要求】
1.一种信息搜索方法,其特征在于,包括: 接收用户输入的查询信息,根据所述查询信息获得意图澄清引导语句; 接收用户根据所述意图澄清引导语句输入的更新后的查询信息,根据所述更新后的查询信息获得搜索结果;以及 向客户端返回所述搜索结果,以用于向所述用户展示。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述查询信息获得意图澄清引导语句之前,还包括: 建立所述语句库。
3.根据权利要求2所述的方法,其特征在于,所述建立所述语句库,包括: 根据第一信息获取第一语句; 根据与所述第一信息相关的第二信息获取第二语句;以及 根据所述第一语句和所述第二语句,建立所述语句库中的至少一个句对。
4.根据权利要求3所述的方法,其特征在于,在根据所述第一语句和所述第二语句, 建立所述语句库中的至少一个句对之后,还包括: 对所述语句库中的句对进行过滤处理。
5.根据权利要求4所述的方法,其特征在于,所述对所述语句库中的句对进行过滤处理,包括: 根据预设过滤规则对所述语句库中的第二语句进行过滤。
6.根据权利要求3-5任一权利要求所述的方法,其特征在于,所述根据所述查询信息获得意图澄清引导语句,包括: 获得所述查询信息的特征信息,根据所述特征信息获得与所述特征信息相关的第一语句; 根据与所述特征信息相关的第一语句查询所述语句库,获得与所述第一语句对应的第二语句; 根据所述第二语句获得所述意图澄清引导语句。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第二语句获得所述意图澄清引导语句,包括: 对与所述第二语句进行排序和聚类处理; 对聚类后的所述第二语句进行排序,获得所述意图澄清引导语句。
8.根据权利要求3所述的方法,其特征在于,所述根据所述第一信息获取所述第一语句,包括: 对所述第一信息进行切分处理; 根据预设语言模型判断所述第一信息是否为预设句型;以及 如果确定所述第一信息为预设句型,则根据所述第一信息获取所述第一语句。
9.根据权利要求3所述的方法,其特征在于,所述根据与所述第一信息相关的第二信息获取所述第二语句,包括: 对所述与所述第一信息相关的第二信息进行切分处理; 根据预设特征判断所述第二信息是否为预设句型;以及 如果确定与所述第一信息相关的第二信息为预设句型,则根据所述第二信息获取所述第二语句。
10.根据权利要求7所述的方法,其特征在于,所述对与所述第二语句进行排序和聚类处理,包括:.V.根据公式Jfp'对与所述第二语句进行排序,并根据语义相似度对所述第二语句进行聚类处理。
11.根据权利要求6所述的方法,其特征在于,所述根据所述特征信息获得与所述特征信息相关的第一语句,包括:确定所述第一语句与所述查询信息的语义相似度大于第一预设阈值,获得所述第一语句;或者所述获得与所述第一语句对应的第二语句,包括:确定所述查询信息中不包含所述第二语句的预设类型关键词,获得所述第二语句;或者,确定所述查询信息和所述第二语句的语义相似度小于第二预设阈值,则获得所述第二语句。
12.一种信息搜索装置,其特征在于,包括: 获得模块,用于接收用户输入的查询信息,根据所述查询信息获得意图澄清引导语句; 更新模块,用于接收用户根据所述意图澄清引导语句输入的更新后的查询信息,根据所述更新后的查询信息获得搜索结果;以及 返回模块,用于向客户端返回所述搜索结果,以用于向所述用户展示。
13.根据权利要求12所述的装置,其特征在于,所述信息搜索装置,还包括: 建立模块,用于建立所述语句库。
14.根据权利要求13所述的装置,其特征在于,所述建立模块,包括: 第一获取单兀,用于根据第一信息获取第一语句; 第二获取单元,用于根据与所述第一信息相关的第二信息获取第二语句;以及 建立单元,用于根据所述第一语句和所述第二语句,建立所述语句库中的至少一个句对。
15.根据权利要求14所述的装置,其特征在于,所述建立模块,还包括: 过滤单元,用于对所述语句库中的句对进行过滤处理。
16.根据权利要求15所述的装置,其特征在于,所述过滤单元,具体用于: 根据预设过滤规则对所述语句库中的第二语句进行过滤。
17.根据权利要求14-16任一权利要求所述的装置,其特征在于,所述获得模块,包括: 第一获得单元,用于获得所述查询信息的特征信息,根据所述特征信息获得与所述特征信息相关的第一语句; 第二获得单元,用于根据与所述特征信息相关的第一语句查询所述语句库,获得与所述第一语句对应的第二语句; 第三获得单元,用于根据所述第二语句获得所述意图澄清引导语句。
18.根据权利要求17所述的装置,其特征在于,所述第三获得单元,包括: 聚类子单元,用于对与所述第二语句进行排序和聚类处理; 获得子单元,用于对聚类后的所述第二语句进行排序,获得所述意图澄清引导语句。
19.根据权利要求14所述的装置,其特征在于,所述第一获取单元,具体用于:对所述第一信息进行切分处理; 根据预设语言模型判断所述第一信息是否为预设句型;以及 当确定所述第一信息为预设句型时,根据所述第一信息获取所述第一语句。
20.根据权利要求14所述的装置,其特征在于,所述第二获取单元,具体用于: 对所述与所述第一信息相关的第二信息进行切分处理; 根据预设特征判断所述第二信息是否为预设句型;以及 当确定与所述第一信息相关的第二信息为预设句型时,根据所述第二信息获取所述第二语句。
21.根据权利要求18所述的装置,其特征在于,所述聚类子单元,具体用于:.V 根据公式
22.根据权利要求17所述的装置,其特征在于,所述第一获得单元,具体用于:确定所述第一语句与所述查询信息的语义相似度大于第一预设阈值,获得所述第一语句;或者 所述第二获得单元,具体用于:确定所述查询信息中不包含所述第二语句的预设类型关键词,获得所述第二语句;或者,确定所述查询信息和所述第二语句的语义相似度小于第二预设阈值,获得所述第二语句。
【文档编号】G06F17/30GK103914548SQ201410144036
【公开日】2014年7月9日 申请日期:2014年4月10日 优先权日:2014年4月10日
【发明者】李婷婷, 万伟, 赵世奇 申请人:北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1