信息搜索方法、装置以及计算机设备与流程

文档序号:19350607发布日期:2019-12-06 21:21阅读:200来源:国知局
信息搜索方法、装置以及计算机设备与流程

本申请涉及互联网技术领域,尤其涉及一种信息搜索方法、装置以及计算机设备。



背景技术:

随着互联网技术的快速发展,现如今已经进入了信息爆炸时代,越来越多的用户通过网络来搜索自己需要的信息,因此,搜索引擎被用于查找各种信息。

目前,当用户的需求为多意图多场景时,在用搜索引擎进行检索,搜索引擎返回的搜索结果通常情况下与用户需求的匹配度较差,无法直接从用户需求出发,给出满意的网络资源。



技术实现要素:

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

本申请提出一种信息搜索方法,通过根据各目标实体对应的搜索意图模型确定用户关注的目标意图,进而根据满足目标意图的目标实体关联信息进行搜索结果的展示,解决了现有技术中信息搜索结果与用户需求匹配较差的技术问题,从而使得搜索结果更加满足用户需求。

本申请第一方面实施例提出了一种信息搜索方法,包括:

获取搜索词;

根据所述搜索词,确定搜索的目标实体;

查询所述目标实体对应的搜索意图模型,以响应于用户操作从所述搜索意图模型记载的搜索意图中确定目标意图;其中,所述搜索意图模型,是根据历史搜索所述目标实体时的搜索意图生成的;

根据满足所述目标意图的目标实体关联信息,展示搜索结果。

作为本申请实施例的第一种可能的实现方式,所述搜索意图模型用于指示各搜索意图,以及各搜索意图之间上下位的层级关系;

所述响应于用户操作从所述搜索意图模型记载的搜索意图中确定目标意图,包括:

根据所述目标实体对应的搜索意图模型,展示处于最高层级的搜索意图,以及所述最高层级的搜索意图的下一层级搜索意图;

响应于用户操作,从所述最高层级的搜索意图和所述最高层级的搜索意图的下一层级搜索意图中,确定所述目标意图。

作为本申请实施例的第二种可能的实现方式,所述根据满足所述目标意图的目标实体关联信息,展示搜索结果,包括:

在搜索结果的展示页面,展示满足所述目标意图的目标实体关联信息,以及展示所述目标意图的同层级搜索意图和所述目标意图的相邻层级搜索意图;

响应于用户操作,更新所述目标意图,并根据更新后的目标意图,重复执行所述展示满足所述目标意图的目标实体关联信息,以及展示所述目标意图的同层级搜索意图和所述目标意图的相邻层级搜索意图的步骤。

作为本申请实施例的第三种可能的实现方式,所述搜索意图模型还用于指示各搜索意图对应的权值;所述权值,用于指示符合相应搜索意图的可能性;

所述展示所述目标意图的同层级搜索意图和所述目标意图的相邻层级搜索意图,包括:

根据所述搜索意图模型中各搜索意图对应的权值,对所述目标意图的同层级搜索意图和所述目标意图的相邻层级搜索意图排序,以按序展示。

作为本申请实施例的第四种可能的实现方式,所述根据满足所述目标意图的目标实体关联信息,展示搜索结果之前,还包括:

查询知识库中存储的知识资源;

若查询到满足所述目标意图的目标实体的知识资源,将查询到的知识资源作为所述关联信息;

若未查询到满足所述目标意图的目标实体的知识资源,查询符合所述目标意图及所述目标意图的相邻层级搜索意图的所述目标实体的相关网络资源,以作为所述关联信息。

作为本申请实施例的第五种可能的实现方式,所述查询符合所述目标意图及所述目标意图的相邻层级搜索意图的所述目标实体的相关网络资源,包括:

根据历史搜索所述目标实体时,搜索到的网络资源的格式,确定目标格式;

在符合所述目标格式的网络资源范围内进行搜索,得到满足所述目标意图及所述目标意图的相邻层级搜索意图的目标实体的相关网络资源。

作为本申请实施例的第六种可能的实现方式,所述查询符合所述目标意图及所述目标意图的相邻层级搜索意图的所述目标实体的相关网络资源之后,还包括:

根据所述目标实体的相关网络资源的特征信息,对所述目标实体相关网络资源进行排序,以按序展示。

作为本申请实施例的第七种可能的实现方式,所述查询所述目标实体对应的搜索意图模型之前,还包括:

根据历史搜索的搜索行为信息,生成搜索样本;

识别所述搜索样本的搜索意图和搜索对象;

从所述搜索样本中,确定搜索对象为所述目标实体的目标搜索样本;

根据所述目标搜索样本关联的实体,对所述目标搜索样本的搜索意图,确定实体与搜索意图之间的映射关系;

根据预设的实体间上下位层级关系,确定对应搜索意图之间的上下位层级关系;

根据所述目标搜索样本的搜索意图及相应上下位层级关系,创建所述搜索意图模型。

作为本申请实施例的第八种可能的实现方式,所述搜索意图模型为图谱模型,所述创建所述搜索意图模型之后,还包括:

对所述目标搜索样本的搜索意图进行聚类,得到各聚簇;

若聚簇中存在未与实体映射的搜索意图,对相应聚簇中与实体映射的各搜索意图,在所述搜索意图模型中确定具有最小公共层级的搜索意图;

在所述搜索意图模型中,对所述未与实体映射的搜索意图建立与所述具有最小公共层级的搜索意图之间的上下位层级关系。

作为本申请实施例的第九种可能的实现方式,所述创建所述搜索意图模型之后,还包括:

根据预设的搜索意图关系,在所述搜索意图模型中增加搜索意图之间的上下位层级关系。

作为本申请实施例的第十种可能的实现方式,所述从所述搜索样本中,确定搜索对象为所述目标实体的目标搜索样本之后,还包括:

对所述目标搜索样本的搜索意图,根据所述目标搜索样本中搜索结果和/或搜索词的搜索热度,确定得分;

在所述搜索意图模型中,对每一搜索意图计算全部下位层级搜索意图的得分和,根据所述得分和与相应搜索意图的得分确定相应搜索意图的权值;

在所述搜索意图模型中,标注各搜索意图的权值。

作为本申请实施例的第十一种可能的实现方式,所述根据所述目标搜索样本关联的实体,对所述目标搜索样本的搜索意图,确定实体与搜索意图之间的映射关系之前,还包括:

对所述目标搜索样本的搜索意图,根据相似性进行合并。

本申请实施例的信息搜索方法,通过获取搜索词,根据搜索词,确定搜索的目标实体,查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图,其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的,根据满足目标意图的目标实体关联信息,展示搜索结果。由于搜索意图模型是根据历史搜索目标实体时的搜索意图生成的,因此,本申请中能够根据各目标实体对应的搜索意图模型确定用户关注的目标意图,进而根据满足目标意图的目标实体关联信息进行搜索结果的展示,从而使得搜索结果更加满足用户需求。

本申请第二方面实施例提出了一种信息搜索装置,包括:

获取模块,用于获取搜索词;

第一确定模块,用于根据所述搜索词,确定搜索的目标实体;

第一查询模块,用于查询所述目标实体对应的搜索意图模型,以响应于用户操作从所述搜索意图模型记载的搜索意图中确定目标意图;其中,所述搜索意图模型,是根据历史搜索所述目标实体时的搜索意图生成的;

展示模块,用于根据满足所述目标意图的目标实体关联信息,展示搜索结果。

本申请实施例的信息搜索装置,通过获取搜索词,根据搜索词,确定搜索的目标实体,查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图,其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的,根据满足目标意图的目标实体关联信息,展示搜索结果。由于搜索意图模型是根据历史搜索目标实体时的搜索意图生成的,因此,本申请能够根据各目标实体对应的搜索意图模型确定用户关注的目标意图,进而根据满足目标意图的目标实体关联信息进行搜索结果的展示,从而使得搜索结果更加满足用户需求。

本申请第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述实施例中所述的信息搜索方法。

本申请第四方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例中所述的信息搜索方法。

本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:

图1为本申请实施例一提供的信息搜索方法的流程示意图;

图2为本申请实施例提供的第一种信息搜索结果展示示例图;

图3为本申请实施例提供的第二种信息搜索结果展示示例图;

图4为本申请实施例提供的第三种信息搜索结果展示示例图;

图5为本申请实施例二提供的信息搜索方法的流程示意图;

图6为本申请实施例提供的第四种信息搜索结果展示示例图;

图7为本申请实施例提供的第五种信息搜索结果展示示例图;

图8为本申请实施例提供的第六种信息搜索结果展示示例图;

图9为本申请实施例三提供的信息搜索方法的流程示意图;

图10为本申请实施例四提供的信息搜索方法的流程示意图;

图11为本申请实施例五提供的信息搜索方法的流程示意图;

图12为本申请实施例提供的一种信息搜索装置的结构示意图;

图13示出了适于用来实现本申请实施方式的示例性计算机设备的框图。

具体实施方式

下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。

针对现有技术中用户在信息搜索时,搜索结果与用户需求匹配度差,不能直接从用户需求出发,搜索到满足用户需求的网络资源的技术问题,本申请实施例提出了一种信息搜索方法,通过获取搜索词,根据搜索词,确定搜索的目标实体,查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图,其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的,根据满足目标意图的目标实体关联信息,展示搜索结果。由于搜索意图模型是根据历史搜索目标实体时的搜索意图生成的,因此,能够根据各目标实体对应的搜索意图模型确定用户关注的目标意图,进而根据满足目标意图的目标实体关联信息进行搜索结果的展示,从而使得搜索结果更加满足用户需求。

下面参考附图描述本申请实施例的信息搜索方法、装置以及计算机设备。

图1为本申请实施例所提供的一种信息搜索方法的流程示意图。

本申请实施例以该信息搜索方法被配置于信息搜索装置中来举例说明,该信息搜索装置可以应用于任一计算机设备中,以使该计算机设备可以执行信息搜索功能。

其中,计算机设备可以为个人电脑(personalcomputer,简称pc)、云端设备、移动设备等,移动设备例如可以为手机、平板电脑、个人数字助理、穿戴式设备、车载设备等具有各种操作系统、触摸屏和/或显示屏的硬件设备。

如图1所示,该信息搜索方法包括以下步骤:

步骤101,获取搜索词。

本申请实施例中,用户通过计算机设备进行信息搜索时,可以在搜索框中输入搜索词,以使得计算机设备获取到用户输入的搜索词,以根据搜索词进行信息搜索。

需要说明的是,在实际应用中,用户在搜索框中输入搜索词时,可以手动输入搜索词,也可以采用语音的形式输入搜索词,等等,本申请实施例中对用户输入搜索词的方式不做限制。

步骤102,根据搜索词,确定搜索的目标实体。

其中,实体指的是现实世界中的事物,比如人、地名、公司、电话、动物等。

本申请实施例中,获取到用户输入的搜索词后,对搜索词进行实体解析,以确定搜索的目标实体。

举例来说,假如搜索词为“红葡萄酒”,在获取到搜索词,对搜索词进行解析后,可以确定搜索的目标实体为“红酒”。

步骤103,查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图。

其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的。

需要说明的是,在进行信息搜索时,不能根据搜索的目标实体的字面意思直接搜索,而是要理解搜索词对应的目标实体的目标意图。由此,避免了用户输入搜索词不规范,搜索词出现多意图等原因导致搜索结果不准确的技术问题。

本申请实施例中,为了确定目标意图,在确定搜索的目标实体后,通过查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图。其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的。

需要说明的是,每一个目标实体,均具有对应的搜索意图模型,在确定搜索的目标实体后,通过查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图。由此,可以更加精确的确定用户的目标意图。

作为一种可能的情况,搜索意图模型可以用于指示各搜索意图,以及各搜索意图之间上下位的层级关系。这种情况下,根据搜索词确定搜索的目标实体后,根据目标实体查询到对应的搜索意图模型,以根据目标实体对应的搜索意图模型展示处于最高层级的搜索意图,以及最高层级的搜索意图的下一层级搜索意图。进一步的,响应于用户操作,从最高层级的搜索意图和最高层级的搜索意图的下一层级搜索意图中,确定目标意图。

举例来说,假如目标实体为“红酒”,在根据目标实体查询到对应的搜索意图模型后,根据搜索意图模型展示处于最高层级的搜索意图和最高层级的搜索意图的下一层级搜索意图为:“红酒的好处”和“红酒怎么喝”。若用户的目标意图为“红酒的好处”,则用户可以选择“红酒的好处”,从而确定目标意图为“红酒的好处”。

作为另一种可能的情况,搜索意图模型还可以用于指示各搜索意图对应的权值。其中,权值,用于指示符合相应搜索意图的可能性。可以理解为,搜索意图对应的权值越大,用户对该搜索意图的需求越强烈。这种情况下,根据搜索词确定搜索的目标实体后,根据目标实体查询到对应的搜索意图模型,以根据目标实体对应的搜索意图模型确定各搜索意图对应的权值。进而,响应于用户操作从搜索意图模型对应的各搜索意图中确定目标意图。

举例来说,假如目标实体为“红酒”,在根据目标实体查询到对应的搜索意图模型后,根据搜索意图模型确定搜索意图为“红酒的好处”对应的权值为70%,搜索意图为“红酒怎么喝”对应的权值为20%,搜索意图为“红酒怎么开”对应的权值为10%。若用户的目标意图为“红酒的好处”,则可以通过用户操作确定目标意图。

步骤104,根据满足目标意图的目标实体关联信息,展示搜索结果。

本申请实施例中,从目标实体对应的搜索意图模型记载的各搜索意图中确定目标意图后,根据满足目标意图的目标实体关联信息,展示搜索结果。

作为一种可能的情况,从目标实体对应的搜索意图模型记载的各搜索意图中确定目标意图后,在搜索结果的展示页面展示搜索结果时,展示满足目标意图的目标实体关联信息,以及展示目标意图的同层级搜索意图和目标意图的相邻层级搜索意图。

进一步的,用户可以根据自己的需求,对展示页面展示的满足目标意图的目标实体关联信息,以及展示目标意图的同层级搜索意图和目标意图的相邻层级搜索意图进行操作,以确定目标意图。进而,响应于用户操作,更新目标意图,并根据更新后的目标意图,重复执行展示满足目标意图的目标实体关联信息,以及展示目标意图的同层级搜索意图和目标意图的相邻层级搜索意图的步骤。

作为一种示例,参见图2,当用户输入的搜索词为“诸葛亮”时,展示的搜索结果如图2所示,包括基本认知区和资源满足区。在资源满足区中展示了最高层级的搜索意图和最高层级的搜索意图的下一层级搜索意图,以及满足搜索意图的网络资源内容。

用户对资源满足区内的意图标签进行操作或者点击“查看更多”后,展示的搜索结果页面将会根据用户操作进行跳转至相应的情景页,如图3所示,展示对应的搜索结果,包括搜索意图和意图资源满足区。在搜索意图索引区,可以展示目标意图的同层级搜索意图和相邻层级搜索意图。

例如,可以预先设定搜索意图各层级之间的关系,在用户点击任意的搜索意图,都会跳到另一个情景页。如图4所示,假如当前情景页的目标搜索意图为“古文”以及同层级搜索意图,用户点击“古文”时,则会展示下一层级搜索意图。进而响应于用户操作,更新目标意图,并且展示目标意图的同层级搜索意图和目标意图的相邻层级搜索意图。在用户点击右侧三角后,可以返回上一次用户的点击状态。

作为本申请实施例的一种可能的实现方式,在展示目标意图的同层级搜索意图和目标意图的相邻层级搜索意图时,具体地,根据目标实体对应的搜索意图模型确定各搜索意图对应的权值后,可以根据搜索意图模型中各搜索意图对应的权值,对目标意图的同层级搜索意图和目标意图的相邻层级搜索意图排序,以按序展示。

由于搜索意图对应的权值对应于用户需求,权值越大,用户需求越大,因此,在对目标意图的同层级搜索意图和目标意图的相邻层级搜索意图进行排序时,将权值大的排序在前,以优先展示权值较大的目标意图的同层级搜索意图和目标意图的相邻层级搜索意图。

本申请实施例的信息搜索方法,通过获取搜索词,根据搜索词,确定搜索的目标实体,查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图,其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的,根据满足目标意图的目标实体关联信息,展示搜索结果。由于搜索意图模型是根据历史搜索目标实体时的搜索意图生成的,因此,能够根据各目标实体对应的搜索意图模型确定用户关注的目标意图,进而根据满足目标意图的目标实体关联信息进行搜索结果的展示,从而使得搜索结果更加满足用户需求。

在上述实施例的基础上,在步骤104中,根据满足目标意图的目标实体关联信息,展示搜索结果之前,还需要确定满足目标意图的目标实体关联信息。作为一种可能的实现方式,可以通过查询知识库中存储的知识资源,以将查询到的知识资源作为目标实体关联信息,或者,将查询符合目标意图及目标意图的相邻层级搜索意图的所述目标实体的相关网络资源,作为目标实体关联信息。下面结合实施例二对上述过程进行详细介绍,图5为本申请实施例二提供的信息搜索方法的流程示意图。

如图5所示,在步骤104之前,还可以包括以下步骤:

步骤201,查询知识库中存储的知识资源。

其中,知识库是知识工程中结构化,易操作,易利用,全面有组织的知识集群,是针对某一(或某些)领域问题求解的需要,采用某种(或若干)知识表示方式在计算机存储器中存储、组织、管理和使用的互相联系的知识片集合。并且,知识库中的知识是有层次的。

本申请实施例中,从搜索意图模型记载的搜索意图中确定目标意图后,根据目标意图,查询知识库中存储的知识资源,以得到满足用户意图的实体资源。

需要说明的是,知识库中存储的知识资源,可以是文本文章、图片、视频等形式,本实施例中对此不做限制。

步骤202,判断是否查询到满足目标意图的目标实体的知识资源。

本申请实施例中,在查询知识库中的存储的知识资源时,进一步,判断是否查询到满足目标意图的目标实体的知识资源。

作为一种可能的情况,在查询知识库中存储的知识资源时,查询到满足目标意图的目标实体的知识资源,则执行步骤203。

作为另一种可能的情况,在查询知识库中存储的知识资源时,未查询到满足目标意图的目标实体的知识资源,则执行步骤204。

步骤203,若查询到满足目标意图的目标实体的知识资源,将查询到的知识资源作为关联信息。

本申请实施例中,在查询知识库中存储的知识资源时,当查询到满足目标意图的目标实体的知识资源时,则将查询到的知识资源作为满足目标意图的目标实体关联信息。

步骤204,若未查询到满足目标意图的目标实体的知识资源,查询符合目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源,以作为关联信息。

本申请实施例中,在查询知识库中存储的知识资源时,当未查询到满足目标意图的目标实体的知识资源时,进一步,查询符合目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源,进而将查询到的目标实体的相关网络资源作为满足目标意图的目标实体关联信息。

具体地,在查询知识库中存储的知识资源时,当未查询到满足目标意图的目标实体的知识资源时,进一步的,根据历史搜索目标实体时搜索到的网络资源的格式,确定目标格式,进而,在符合目标格式的网络资源范围内进行搜索,以得到满足目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源。进而,根据目标实体的相关网络资源的特征信息,对目标实体相关网络资源进行排序,以按序展示。

举例来说,在查询知识库中存储的知识资源时,未查询到满足目标意图的目标实体的知识资源时,假如根据历史搜索目标实体搜索到网络资源的格式为视频格式,则继续符合视频格式的网络资源范围内进行搜索,以得到满足目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源。

作为一种可能的情况,满足目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源可能为单个实体资源内容,如图6所示。

作为另一种可能的情况,满足目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源可能为多个实体资源,比如:榜单,实体列表类知识等,例如图7所示。

作为又一种可能的情况,满足目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源还可能为文本、文章、图集、视频等。如图8所示,网络资源可以为文章。

本申请实施例的信息搜索方法,通过查询知识库中存储的知识资源,若查询到满足目标意图的目标实体的知识资源,将查询到的知识资源作为关联信息,若未查询到满足目标意图的目标实体的知识资源,查询符合目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源,以作为关联信息。由此,通过查询知识库中存储的知识资源,判断是否查询到满足目标意图的目标实体的知识资源,以进一步确定满足目标意图的目标实体关联信息,从而根据用户的意图得到该意图相关的网络资源,提高了网络资源与用户搜索需求匹配的概率。

在本申请实施例的一种可能的实现方式中,对于搜索意图模型的创建,可以根据历史搜索的搜索行为信息生成搜索样本,以识别搜索样本的搜索意图和搜索对象,进而,从搜索样本中,确定搜索对象为目标实体的目标搜索样本,以根据各目标搜索样本创建对应的搜索意图模型。具体地创建搜索意图模型的过程参见实施例三,图9为本申请实施例三提供的信息搜索方法的流程示意图。

如图9所示,该信息搜索方法,还可以包括以下步骤:

步骤301,根据历史搜索的搜索行为信息,生成搜索样本。

其中,搜索样本中包括搜索词和搜索结果。

本申请实施例中,在创建搜索意图模型时,首先要得到搜索样本。具体地,可以根据历史搜索的搜索行为信息,获取到每次搜索行为信息对应的搜索词和搜索结果,进而根据搜索词和搜索结果得到搜索样本。

需要说明的是,用户的搜索行为不限于在输入框内进行搜索,还可以包括用户的查询行为信息、点击网页行为信息、浏览行为信息等等,本实施例中在此不做限制。

步骤302,识别搜索样本的搜索意图和搜索对象。

本申请实施例中,根据历史搜索的搜索行为信息生成搜索样本后,对搜索样本进行识别,以识别搜索样本的搜索意图和搜索对象。

作为一种可能的实现方式,可以人工预先建立搜索意图候选集合,进而对搜索样本中的搜索词进行切句、切词、词性、语法、语义等自然语言特征的提取后,根据预先建立的搜索意图候选集合,识别对搜索词进行切词后的短语、单词或者短句是否为搜索意图,进而识别得到各搜索样本中的搜索意图和搜索对象。

步骤303,从搜索样本中,确定搜索对象为目标实体的目标搜索样本。

本申请实施例中,从搜索样本中识别出搜索意图和搜索对象后,进而可以确定搜索对象为目标实体的搜索样本为目标搜索样本。

步骤304,根据目标搜索样本关联的实体,对目标搜索样本的搜索意图,确定实体与搜索意图之间的映射关系。

本申请实施例中,从搜索样本中确定目标搜索样本后,可以根据目标搜索样本关联的实体,以及目标搜索样本的搜索意图,确定实体与搜索意图之间的映射关系。

作为一种可能情况,在根据目标搜索样本关联的实体,对目标搜索样本的搜索意图,确定实体与搜索意图之间的映射关系之前,还可以确定目标搜索样本的各搜索意图的相似性,进而根据相似性对目标搜索样本的搜索意图进行合并。进一步的,确定实体与合并后的搜索意图之间的映射关系。

步骤305,根据预设的实体间上下位层级关系,确定对应搜索意图之间的上下位层级关系。

本申请实施例中,由于实体间存在一定的关联,因此,在实体间已经预设了上下位层级关系。例如,实体为“饲养”“时,对应的下位层级可以为“喂养”和“训练”。进一步的,可以根据预设的实体间上下位层级关系,确定对应搜索意图之间的上下位层级关系。

举例来说,当实体为“购买”和“价格”时,实体间上下位层级关系为,“购买”是上位层级,“价格”为下位层级。对应的搜索意图为“买东西”和“多少钱”,此时,可以根据预设的实体间上下位层级关系,确定对应搜索意图中“买东西”为上位层级,“多少钱”为下位层级,进而确定对应搜索意图之间的上下位层级关系。

步骤306,根据目标搜索样本的搜索意图及相应上下位层级关系,创建搜索意图模型。

本申请实施例中,根据预设的实体间上下位层级关系,确定对应搜索意图之间的上下位层级关系后,进而,根据目标搜索样本的搜索意图及相应上下位层级关系,创建搜索意图模型。

需要说明的是,创建的搜索意图模型中可以确定各搜索意图,以及各搜索意图之间上下位的层级关系,从而在确定目标实体后,可以通过查询目标实体对应的搜索意图模型,确定目标实体对应的搜索意图。

本申请实施例的信息搜索方法,通过根据历史搜索的搜索行为信息,生成搜索样本,识别搜索样本的搜索意图和搜索对象,从搜索样本中,确定搜索对象为目标实体的目标搜索样本,根据目标搜索样本关联的实体,对目标搜索样本的搜索意图,确定实体与搜索意图之间的映射关系,根据预设的实体间上下位层级关系,确定对应搜索意图之间的上下位层级关系,根据目标搜索样本的搜索意图及相应上下位层级关系,创建搜索意图模型。由此,根据历史搜索目标实体时的搜索意图创建搜索意图模型后,可以实现确定目标实体后,查询对应的搜索意图模型即可得到目标意图,从而能够准确识别出用户需求,提高了信息搜索的准确性。

作为一种可能的情况,上述实施例中创建的搜索意图模型可以为图谱模型,在创建搜索意图模型后,还可以对目标搜索样本的搜索意图进行聚类,得到各聚簇,进而,在搜索意图模型中,对未与实体映射的搜索意图建立与具有最小公共层级的搜索意图之间的上下位层级关系。下面结合实施例四对上述过程进行详细介绍,图10为本申请实施例四提供的信息搜索方法的流程示意图。

如图10所示,该信息搜索方法还可以包括以下步骤:

步骤401,对目标搜索样本的搜索意图进行聚类,得到各聚簇。

其中,聚类,是指将物理或抽象对象的集合分成由类似的对象组成的多个类的过程。

作为一种可能的情况,搜索意图模型为图谱模型时,在创建搜索意图模型后,还可以对目标搜索样本的搜索意图进行聚类,以得到各聚簇。

具体地,对各目标搜索样本的搜索意图,计算各搜索意图之间的语义相似度,进而根据相似度阈值确定聚簇数目后,根据各搜索意图之间的语义相似度对目标搜索样本的搜索意图进行聚类,得到各聚簇。

需要说明的是,本实施例中计算各搜索意图之间的语义相似度的计算方法,可以参考现有的语义相似度计算方法,本实施例中对此不再赘述。

步骤402,若聚簇中存在未与实体映射的搜索意图,对相应聚簇中与实体映射的各搜索意图,在搜索意图模型中确定具有最小公共层级的搜索意图。

其中,最小公共层级,是多搜索意图的公共上位层级,在公共上位层级为多个时,最小公共层级是多个公共上位层级中的最低层级。

本申请实施例中,对目标搜索样本的搜索意图进行聚类,得到各聚簇后,查看各聚簇中的搜索意图是否均存在与之映射的实体。作为一种可能的情况,若聚簇中存在未与实体映射的搜索意图时,对相应聚簇中与实体映射的各搜索意图,在搜索意图模型中确定具有最小公共层级的搜索意图。

具体地,在聚簇中存在未与实体映射的搜索意图时,对于相应聚簇中与实体映射的各搜索意图,在搜索意图模型上,遍历上位层级,计算每一个上位层级到达聚簇中各搜索意图的路径和,将最短路径和的搜索意图作为有最小公共层级的搜索意图。

步骤403,在搜索意图模型中,对未与实体映射的搜索意图建立与具有最小公共层级的搜索意图之间的上下位层级关系。

本申请实施例中,在搜索意图模型中,可能存在未与实体映射的搜索意图,对于未与实体映射的搜索意图,建立与具有最小公共层级的搜索意图之间的上下位层级关系。

举例来说,对目标搜索样本的搜索意图进行聚类时,将“吃巧克力中毒怎么办”、“幼犬食物”和“成年犬食物”聚在同一个簇,“幼犬食物”和“成年犬食物”的最小公共上位实体是“喂养”,而搜索意图为“吃巧克力中毒怎么办”未与实体映射,那么就把“吃巧克力中毒怎么办”的上位设置为“喂养”。

作为另一种可能的情况,在创建搜索意图模型中,还可能存在实体不能表达的搜索意图关系,这种情况下,可以预先构建搜索意图关系,进而根据预设的搜索意图关系,在搜索意图模型中增加搜索意图之间的上下位层级关系。

举例来说,对于搜索意图为“购买”、“价格”、“毛色”,可以预设搜索意图之间的关系为“购买”为上位层级,“价格”和“毛色”为下位层级,并在搜索意图模型中增加搜索意图之间的上下位层级关系。

本申请实施例的信息搜索方法,通过对目标搜索样本的搜索意图进行聚类,得到各聚簇,若聚簇中存在未与实体映射的搜索意图,对相应聚簇中与实体映射的各搜索意图,在搜索意图模型中确定具有最小公共层级的搜索意图,在搜索意图模型中,对未与实体映射的搜索意图建立与具有最小公共层级的搜索意图之间的上下位层级关系。由此,通过在搜索意图模型汇总确定各搜索意图的上下位层级关系,更加符合用户认知,从而提高了信息搜索的准确性。

在上述实施例三的基础上,作为一种可能的情况,在步骤303之后,还可以计算各目标搜索样本的搜索意图的权值,以在搜索意图模型中标注各搜索意图的权值。下面结合实施例五对上述过程进行详细介绍,图11为本申请实施例五提供的信息搜索方法的结构示意图。

如图11所示,该信息搜索方法还可以包括以下步骤:

步骤501,对目标搜索样本的搜索意图,根据目标搜索样本中搜索结果和/或搜索词的搜索热度,确定得分。

作为一种可能的实现方式,从搜索样本中确定搜索对象为目标实体的目标搜索样本后,对目标搜索样本的搜索意图,可以根据目标搜索样本中搜索结果在网络资源中的数量和热度,确定得分。

作为另一种可能的实现方式,从搜索样本中确定搜索对象为目标实体的目标搜索样本后,对目标搜索样本的搜索意图,还可以根据目标搜索样本中搜索词在网络资源中的搜索热度,确定得分。

作为又一种可能的实现方式,从搜索样本中确定搜索对象为目标实体的目标搜索样本后,对目标搜索样本的搜索意图,还可以同时根据目标搜索样本中搜索结果和搜索词在网络资源中的搜索热度,确定得分。

步骤502,在搜索意图模型中,对每一搜索意图计算全部下位层级搜索意图的得分和,根据得分和与相应搜索意图的得分确定相应搜索意图的权值。

其中,搜索意图的权值对应于用户对该搜索意图的需求强度。可以理解为,搜索意图的权值越大,用户对该搜索意图的需求强度越大,同样地,搜索意图的权值越小,用户对该搜索意图的需求强度越小。因此,可以根据搜索意图的权值,识别用户对该搜索意图的需求强度。

本申请实施例中,在搜索意图模型中,确定各搜索意图的得分后,进一步的,确定每一搜索意图的权值。

具体地,根据目标搜索样本中搜索结果和/或搜索词的搜索热度,确定各搜索意图的得分后,对于每一搜索意图计算其全部下位层级搜索意图的得分和,进而根据得分和与相应搜索意图的得分确定相应搜索意图的权值。

步骤503,在搜索意图模型中,标注各搜索意图的权值。

本申请实施例中,确定各搜索意图的权值后,在搜索意图模型中,标注各搜索意图的权值,以使得根据目标实体能够在搜索意图模型中确定目标意图以及用户对该目标意图的需求强度。

本申请实施例的信息搜索方法,通过对目标搜索样本的搜索意图,根据目标搜索样本中搜索结果和/或搜索词的搜索热度,确定得分,在搜索意图模型中,对每一搜索意图计算全部下位层级搜索意图的得分和,根据得分和与相应搜索意图的得分确定相应搜索意图的权值,在搜索意图模型中,标注各搜索意图的权值。由此,能够根据搜索意图模型中标注的各搜索意图的权值,确定用户对该搜索意图的需求强度,从而能够识别出用户的需求,提高信息搜索的准确度。

为了实现上述实施例,本申请还提出一种信息搜索装置。

图12为本申请实施例提供的一种信息搜索装置的结构示意图。

如图12所示,该信息搜索装置100包括:获取模块110、第一确定模块120、第一查询模块130以及展示模块140。

获取模块110,用于获取搜索词。

第一确定模块120,用于根据搜索词,确定搜索的目标实体。

第一查询模块130,用于查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图;其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的。

展示模块140,用于根据满足目标意图的目标实体关联信息,展示搜索结果。

作为一种可能的实现方式,搜索意图模型用于指示各搜索意图,以及各搜索意图之间上下位的层级关系;第一查询模块130,还用于:

根据目标实体对应的搜索意图模型,展示处于最高层级的搜索意图,以及最高层级的搜索意图的下一层级搜索意图;响应于用户操作,从最高层级的搜索意图和最高层级的搜索意图的下一层级搜索意图中,确定目标意图。

作为另一种可能的实现方式,展示模块140,还用于:

在搜索结果的展示页面,展示满足目标意图的目标实体关联信息,以及展示目标意图的同层级搜索意图和目标意图的相邻层级搜索意图;

响应于用户操作,更新目标意图,并根据更新后的目标意图,重复执行展示满足目标意图的目标实体关联信息,以及展示目标意图的同层级搜索意图和目标意图的相邻层级搜索意图的步骤。

作为另一种可能的实现方式,搜索意图模型还用于指示各搜索意图对应的权值;权值,用于指示符合相应搜索意图的可能性;展示模块140,还用于:

根据搜索意图模型中各搜索意图对应的权值,对目标意图的同层级搜索意图和目标意图的相邻层级搜索意图排序,以按序展示。

作为另一种可能的实现方式,信息搜索装置100,还包括:

第二查询模块,用于查询知识库中存储的知识资源。

处理模块,用于若查询到满足目标意图的目标实体的知识资源,将查询到的知识资源作为关联信息;若未查询到满足目标意图的目标实体的知识资源,查询符合目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源,以作为关联信息。

作为另一种可能的实现方式,处理模块,还用于:

根据历史搜索目标实体时,搜索到的网络资源的格式,确定目标格式;

在符合目标格式的网络资源范围内进行搜索,得到满足目标意图及目标意图的相邻层级搜索意图的目标实体的相关网络资源。

作为另一种可能的实现方式,处理模块,还用于:

根据目标实体的相关网络资源的特征信息,对目标实体相关网络资源进行排序,以按序展示。

作为另一种可能的实现方式,信息搜索装置100,还包括:

生成模块,用于根据历史搜索的搜索行为信息,生成搜索样本。

识别模块,用于识别搜索样本的搜索意图和搜索对象。

第二确定模块,用于从搜索样本中,确定搜索对象为目标实体的目标搜索样本。

第三确定模块,用于根据目标搜索样本关联的实体,对目标搜索样本的搜索意图,确定实体与搜索意图之间的映射关系。

第四确定模块,用于根据预设的实体间上下位层级关系,确定对应搜索意图之间的上下位层级关系。

创建模块,用于根据目标搜索样本的搜索意图及相应上下位层级关系,创建搜索意图模型。

作为另一种可能的实现方式,信息搜索装置100,还包括:

聚类模块,用于对目标搜索样本的搜索意图进行聚类,得到各聚簇。

第五确定模块,用于若聚簇中存在未与实体映射的搜索意图,对相应聚簇中与实体映射的各搜索意图,在搜索意图模型中确定具有最小公共层级的搜索意图。

建立模块,用于在搜索意图模型中,对未与实体映射的搜索意图建立与具有最小公共层级的搜索意图之间的上下位层级关系。

作为另一种可能的实现方式,信息搜索装置100,还包括:

增加模块,用于根据预设的搜索意图关系,在搜索意图模型中增加搜索意图之间的上下位层级关系。

作为另一种可能的实现方式,信息搜索装置100,还包括:

打分模块,用于对目标搜索样本的搜索意图,根据目标搜索样本中搜索结果和/或搜索词的搜索热度,确定得分。

第六确定模块,用于在搜索意图模型中,对每一搜索意图计算全部下位层级搜索意图的得分和,根据得分和与相应搜索意图的得分确定相应搜索意图的权值。

标注模块,用于在搜索意图模型中,标注各搜索意图的权值。

作为另一种可能的实现方式,信息搜索装置100,还包括:

合并模块,用于对目标搜索样本的搜索意图,根据相似性进行合并。

需要说明的是,前述对信息搜索方法实施例的解释说明也适用于该实施例的信息搜索装置,此处不再赘述。

本申请实施例的信息搜索装置,通过获取搜索词,根据搜索词,确定搜索的目标实体,查询目标实体对应的搜索意图模型,以响应于用户操作从搜索意图模型记载的搜索意图中确定目标意图,其中,搜索意图模型,是根据历史搜索目标实体时的搜索意图生成的,根据满足目标意图的目标实体关联信息,展示搜索结果。由于搜索意图模型是根据历史搜索目标实体时的搜索意图生成的,因此,能够根据各目标实体对应的搜索意图模型确定用户关注的目标意图,进而根据满足目标意图的目标实体关联信息进行搜索结果的展示,从而使得搜索结果更加满足用户需求。

为了实现上述实施例,本申请还提出一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述实施例中所述的信息搜索方法。

为了实现上述实施例,本申请还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例中所述的信息搜索方法。

图13示出了适于用来实现本申请实施方式的示例性计算机设备的框图。图13显示的计算机设备12仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。

如图13所示,计算机设备12以通用计算设备的形式表现。计算机设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(industrystandardarchitecture;以下简称:isa)总线,微通道体系结构(microchannelarchitecture;以下简称:mac)总线,增强型isa总线、视频电子标准协会(videoelectronicsstandardsassociation;以下简称:vesa)局域总线以及外围组件互连(peripheralcomponentinterconnection;以下简称:pci)总线。

计算机设备12典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。

存储器28可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(randomaccessmemory;以下简称:ram)30和/或高速缓存存储器32。计算机设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、非易失性磁介质(图13未显示,通常称为“硬盘驱动器”)。尽管图13中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(compactdiscreadonlymemory;以下简称:cd-rom)、数字多功能只读光盘(digitalvideodiscreadonlymemory;以下简称:dvd-rom)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在例如存储器28中,这样的程序模块42包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块42通常执行本申请所描述的实施例中的功能和/或方法。

计算机设备12也可以与一个或多个外部设备14(例如键盘、指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计算机系统/服务器12交互的设备通信,和/或与使得该计算机设备12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口22进行。并且,计算机设备12还可以通过网络适配器20与一个或者多个网络(例如局域网(localareanetwork;以下简称:lan),广域网(wideareanetwork;以下简称:wan)和/或公共网络,例如因特网)通信。如图所示,网络适配器20通过总线18与计算机设备12的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备12使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理单元16通过运行存储在系统存储器28中的程序,从而执行各种功能应用以及数据处理,例如实现前述实施例中提及的信息搜索方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。

上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1