一种推荐搜索关键词的确定方法及装置与流程

文档序号:11250928阅读:380来源:国知局
一种推荐搜索关键词的确定方法及装置与流程

本发明涉及搜索技术领域,特别涉及一种推荐搜索关键词的确定方法及装置。



背景技术:

在当今信息时代,互联网获得了快速发展,并为人们的生产生活提供了诸多便利,人们也越来越多利用互联网获取相应的服务。

目前,在用户使用搜索服务时,搜索结果页面会显示搜索结果,还会根据用户输入的搜索词,在搜索结果页面上给出“您还可以搜”的推荐搜索关键词。以视频网站为例,现有的推荐搜索关键词确定方法是在该用户的搜索日志中,对该用户session(会话)下的query(查询)行为,以及对同一个doc(document,文档)的点击query行为,进行挖掘得到的。

然而,现有的确定方法是基于用户的历史行为获取到的,并没有考虑当搜索词是自然语言中广泛存在的命名实体(简称“实体”,是指客观存在并可相互区别的事物)时,该搜索词与某些实体之间的重要关系,忽略了与该搜索词存在重要关系的那些实体,导致所给出的推荐搜索关键词与用户所输入关键词的信息关联性不高。例如,当搜索实体为“李晨”时,目前的“您还可以搜”的推荐搜索关键词并没有与“李晨”存在相当重要关系的实体“范冰冰”,而是基于用户历史行为所给出的推荐搜索关键词,这样导致所给出的推荐搜索关键词与用户所输入关键词的信息关联性不高,用户的搜索体验度也不高。



技术实现要素:

本发明实施例的目的在于提供一种推荐搜索关键词的确定方法及装置,以提高所给出的推荐搜索关键词与用户所输入关键词的信息关联性。

为达到上述目的,本发明实施例公开了一种推荐搜索关键词的确定方法,方法包括:

获得用户输入的目标搜索词;

判断所述目标搜索词是否为实体;

如果是,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;

根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。

可选地,预先构建表征实体间关系的知识图谱,包括:

根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。

可选地,所述根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词的步骤,包括:

从所确定出的实体中选取符合预设推荐条件的实体;

将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。

可选地,所述从所确定出的实体中选取符合预设推荐条件的实体的步骤,包括:

计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;

从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。

可选地,所述从所确定出的实体中选取符合预设推荐条件的实体的步骤,包括:

统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;

从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。

可选地,所述实体为:

专辑实体、人物实体、影视剧实体或影视剧角色实体。

可选地,所述方法还包括:

在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。

为达到上述目的,本发明实施例公开了一种推荐搜索关键词的确定装置,装置包括:

获得模块,用于获得用户输入的目标搜索词;

判断模块,用于判断所述目标搜索词是否为实体;

第一确定模块,用于在判断所述目标搜索词为实体的情况下,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;

第二确定模块,用于根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。

可选地,所述第一确定模块,具体用于:

根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。

可选地,所述第二确定模块,包括:

选取单元,用于从所确定出的实体中选取符合预设推荐条件的实体;

确定单元,用于将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。

可选地,所述选取单元,具体用于:

计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;

从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。

可选地,所述选取单元,具体用于:

统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;

从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。

可选地,所述实体为:

专辑实体、人物实体、影视剧实体或影视剧角色实体。

可选地,所述装置还包括:

第三确定模块,用于在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。

由上述的技术方案可见,本发明实施例提供了一种推荐搜索关键词的确定方法及装置,获得用户输入的目标搜索词;判断所述目标搜索词是否为实体;如果是,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。

可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的推荐搜索关键词的确定方法的一种流程示意图;

图2为本发明实施例提供的推荐搜索关键词的确定方法的另一种流程示意图;

图3为本发明实施例提供的推荐搜索关键词的确定装置的一种结构示意图;

图4为本发明实施例提供的推荐搜索关键词的确定装置的另一种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面首先对本发明实施例提供的一种推荐搜索关键词的确定方法进行详细说明。

需要说明的是,本发明实施例所提供的一种推荐搜索关键词的确定方法可以应用于电子设备,其中,该电子设备可以为终端设备,如智能手机、平板电脑、台式电脑等等。

并且,实现本发明实施例所提供的一种推荐搜索关键词的确定方法的功能软件可以为具有搜索功能的程序软件中的插件,举例而言,该具有搜索功能的程序软件可以为浏览器、即时通讯类的客户端、网购类的客户端、娱乐类的客户端等等。

参见图1,图1为本发明实施例提供的推荐搜索关键词的确定方法的一种流程示意图,可以包括如下步骤:

s101,获得用户输入的目标搜索词;

示例性的,用户在网页的搜索框中输入一个目标搜索词“李晨”,从而就获得了该用户输入的目标搜索词“李晨”。

可以理解的是,目标搜索词的输入形式可以为文本输入,也可以语音输入,等等,这都是合理的。

s102,判断所述目标搜索词是否为实体;如果是,执行s103;

其中,在获得用户输入的目标搜索词后,可以判断目标搜索词是否为实体,并根据不同的判断结果,执行不同的步骤。具体的,在判断出该目标搜索词为实体时,可以执行s103;当判断出该目标搜索词不为实体时,可以利用所述用户的历史搜索日志,确定所述目标搜索词对应的推荐搜索关键词,其中,可以采用现有技术来实现:利用所述用户的历史搜索日志,确定所述目标搜索词对应的推荐搜索关键词。

具体的,所述实体可以为:专辑实体、人物实体、影视剧实体或影视剧角色实体。例如,实体可以为爸爸去哪儿(专辑实体)、李晨(人物实体)、琅琊榜(影视剧实体)或梅长苏(影视剧角色实体)。

需要强调的是,可以预先设定若干实体,在获得目标搜索词后,可以将目标搜索词与预先设定的若干实体进行匹配,根据匹配结果判定该目标搜索词是否为实体。

并且,可以理解的是,上述所给出的实体的具体类型仅仅作为示例,并不应该构成对本发明实施例的限定。

s103,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;

具体的,预先构建表征实体间关系的知识图谱,可以根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。也就是,可以根据数据库包含的不同类型实体和实体间的关系数据,来构建表征实体间关系的知识图谱;也可以根据数据库包含的不同类型实体和实体间的关系数据,以及爬取的实体间的关系数据,来构建表征实体间关系的知识图谱;也可以根据数据库包含的不同类型实体,以及爬取的实体间的关系数据,来构建表征实体间关系的知识图谱。需要强调的是,无论知识图谱构建过程所利用的关系数据是数据库包含的关系数据,还是爬取的关系数据,所利用的关系数据至少涵盖:该数据库包含的不同类型实体对应的关系数据。

示例性的,可以根据数据库包含的专辑、视频等数据信息,以及从网站爬取的人物间关系数据、专辑间关系数据、影视剧间关系数据、影视剧角色间关系数据、人物与专辑间的关系数据、人物与影视剧间的关系数据和人物与影视剧角色间的关系数据等等,构建表征实体间关系的知识图谱。其中,构建表征实体间关系的知识图谱,为现有技术,本发明实施例对其不进行赘述。

示例性的,目标搜索词为实体a,在表征实体间关系的知识图谱中,查找到与实体a存在关系的实体为b、c、d、e、f和g,则可以将实体b、c、d、e、f和g确定为与目标搜索词即实体a存在关系的实体。

s104,根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。

其中,在确定出与所述目标搜索词存在关系的实体后,在一种具体实现方式中,可以将所确定出的所有实体,确定为与所述目标搜索词对应的第一推荐搜索关键词。

需要说明的是,由于与目标搜索词存在关系的实体的数量可能比较多,而考虑到推荐搜索关键词显示区域的有限性,以及,数量过多而给用户带来的不便性等问题,可以对所确定出的实体进行筛选。基于该种处理思想,在另一种具体实现方式中,根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词,可以包括:从所确定出的实体中选取符合预设推荐条件的实体,将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。

可选地,在第一种实现方式中,从所确定出的实体中选取符合预设推荐条件的实体,可以包括:计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值,从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。其中,在实际应用中,计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值,为现有技术,本发明实施例在此不对其进行赘述。

示例性的,所确定出的实体为实体b、c、d、e、f和g,选取符合预设推荐条件的实体,可以首先计算出所确定出的实体b、c、d、e、f和g与目标搜索词a所存在关系对应的相关性权重值分别为b、c、d、e、f和g,其中,实体b、c和d所对应的相关性权重值b、c和d均大于预设权重阈值h。然后,从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值,即选取符合预设权重条件的实体b、c和d,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体b、c和d,确定为与目标搜索词对应的第一推荐搜索关键词。

示例性的,目标搜索词为实体“范冰冰”,与“范冰冰”存在关系的实体为男友“李晨”、好友“冯小刚”、好友“章子怡”、搭档“张馨予”、搭档“黄晓明”、绯闻男友“李治廷”。其中,“李晨”与“范冰冰”所存在的关系“男友”对应的相关性权重值为2.445,“冯小刚”与“范冰冰”所存在的关系“好友”对应的相关性权重值为2.209,“章子怡”与“范冰冰”所存在的关系“好友”对应的相关性权重值为2.1,“张馨予”与“范冰冰”所存在的关系“搭档”对应的相关性权重值为1.842,“黄晓明”与“范冰冰”所存在的关系“搭档”对应的相关性权重值为2.021,“李治廷”与“范冰冰”所存在的关系“绯闻男友”对应的相关性权重值为1.311。预设权重阈值设为2.0,则大于预设权重阈值的相关性权重值2.445、2.209、2.1和2.021,所对应的实体分别为“李晨”、“冯小刚”、“章子怡”和“黄晓明”,从而选取实体“李晨”、“冯小刚”、“章子怡”和“黄晓明”,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体“李晨”、“冯小刚”、“章子怡”和“黄晓明”,确定为与目标搜索词对应的第一推荐搜索关键词。

可以理解的是,该知识图谱中不但可以记录有实体间的关系,而且可以记录关系对应的相关性权重;当然,知识图谱中可以仅仅记录实体间的关系,进而,在计算相关性权重值时,可以根据知识图谱中的关系所对应的属性值来计算,例如:知识图谱中通过连线来体现两个实体存在关系与否,而通过连线的长度来体现关系紧密度,两个实体间的连线越短表示关系越紧密,这样,在计算相关权重值时,可以根据实体间的连线的长度来计算相关性权重值。

可选地,在第二种实现方式中,从所确定出的实体中选取符合预设推荐条件的实体,可以包括:统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。

示例性的,所确定出的与目标搜索词a存在关系的实体为实体b、c、d、e、f和g,从中选取符合预设推荐条件的实体,可以首先统计所确定出的实体b、c、d、e、f和g在预设时间段内的网络搜索值分别为l、m、n、o、p和q,其中,高于预设搜索值阈值i的网络搜索值为o、p和q,预设时间段为一周,网络搜索值为网络搜索热度或网络搜索频率。然后,从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值,即选取符合预设搜索值条件的实体e、f和g,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体e、f和g,确定为与目标搜索词对应的第一推荐搜索关键词。

示例性的,目标搜索词为实体“王宝强”,与“王宝强”存在关系的实体为前妻“马蓉”、原经纪人“宋喆”、好友“陈思诚”、搭档“邓超”和影视剧“士兵突击”。其中,“马蓉”在一周时间内的网络搜索值为5,“宋喆”在一周时间内的网络搜索值为4.1,“陈思诚”在一周时间内的网络搜索值为3,“邓超”在一周时间内的网络搜索值为2,“士兵突击”在一周时间内的网络搜索值为2。预设权重阈值设为4,则高于预设搜索值阈值的网络搜索值5和4,所对应的实体分别为“马蓉”和“宋喆”,从而选取实体“马蓉”和“宋喆”,作为符合预设推荐条件的实体。进而,将所选取的符合预设推荐条件的实体“马蓉”和“宋喆”,确定为与目标搜索词对应的第一推荐搜索关键词。另外,在确定与所述目标搜索词对应的第一推荐搜索关键词后,可以将所确定出的第一推荐搜索关键词进行输出。

可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。

参见图2,图2为本发明实施例提供的推荐搜索关键词的确定方法的另一种流程示意图,本发明图2所示实施例在本发明图1所示实施例的基础上,增加步骤s105:在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。

具体的,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词,为现有技术,本发明实施例在此不对其进行赘述。

另外,在确定与所述目标搜索词对应的第二推荐搜索关键词后,可以将所确定出的第二推荐搜索关键词进行输出。可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。进一步地,还可以利用用户的历史搜索日志,确定第二推荐搜索关键词,提高推荐搜索关键词的丰富度。

相应于上述方法实施例,本发明实施例还提供了一种推荐搜索关键词的确定装置。

参见图3,图3为本发明实施例提供的推荐搜索关键词的确定装置的一种结构示意图,与图1所示的流程相对应,该确定装置可以包括:获得模块301、判断模块302、第一确定模块303和第二确定模块304。

获得模块301,用于获得用户输入的目标搜索词;

判断模块302,用于判断所述目标搜索词是否为实体;

第一确定模块303,用于在判断所述目标搜索词为实体的情况下,根据预先构建的表征实体间关系的知识图谱,确定与所述目标搜索词存在关系的实体;

第二确定模块304,用于根据所确定出的实体,确定与所述目标搜索词对应的第一推荐搜索关键词。

具体的,所述第一确定模块303,具体可以用于:

根据数据库包含的不同类型实体和目标关系数据,构建表征实体间关系的知识图谱,其中,所述目标关系数据为所述数据库包含的实体间的关系数据,和/或,爬取的实体间的关系数据。

具体的,所述第二确定模块304,可以包括:选取单元、确定单元(图中未示出);

选取单元,用于从所确定出的实体中选取符合预设推荐条件的实体;

确定单元,用于将所选取出的实体确定为与所述目标搜索词对应的第一推荐搜索关键词。

具体的,所述选取单元,具体可以用于:

计算所确定出的实体与所述目标搜索词所存在关系对应的相关性权重值;

从所确定出的实体中选取符合预设权重条件的实体,其中,所述预设权重条件为:所对应相关性权重值大于预设权重阈值。

具体的,所述选取单元,具体可以用于:

统计所确定出的实体在预设时间段内的网络搜索值;其中,所述网络搜索值为:网络搜索热度或网络搜索频率;

从所确定出的实体中选取符合预设搜索值条件的实体,其中,所述预设搜索值条件为:所对应网络搜索值高于预设搜索值阈值。

具体的,所述实体可以为:

专辑实体、人物实体、影视剧实体或影视剧角色实体。

可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。

参见图4,图4为本发明实施例提供的推荐搜索关键词的确定装置的另一种结构示意图,与图2所示的流程相对应,本发明图4所示实施例在本发明图3所示实施例的基础上,增加第三确定模块305,用于在判断所述目标搜索词为实体的情况下,利用所述用户的历史搜索日志,确定所述目标搜索词对应的第二推荐搜索关键词。

可见,在目标搜索词为实体时,通过知识图谱,确定与目标搜索词存在关系的实体,在根据所确定出的实体,确定第一推荐搜索关键词。而由于知识图谱表征有实体间的关系,因此,本方案在确定推荐搜索关键词时考虑了实体间的关系,这样,通过本方案提高了所给出的推荐搜索关键词与用户所输入关键词的信息关联性,并提高了用户的搜索体验度。进一步地,还可以利用用户的历史搜索日志,确定第二推荐搜索关键词,提高推荐搜索关键词的丰富度。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本领域普通技术人员可以理解实现上述方法实施方式中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机可读取存储介质中,这里所称得的存储介质,如:rom/ram、磁碟、光盘等。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1