一种信息搜索方法和装置的制造方法

文档序号:9547192阅读:151来源:国知局
一种信息搜索方法和装置的制造方法
【技术领域】
[0001] 本发明涉及信息搜索技术领域,特别是涉及一种信息搜索方法和装置。
【背景技术】
[0002] 在大多数的社交网络平台中,都支持用户自己根据某一个特定的主题,比如兴趣 爱好、共享的环境、特定身份、话题等建立用户群组。用户群组是供多用户聊天交流服务的 用户集合,其可以是用户自发的兴趣小组(如巴萨球迷群),也可以是企业创建的客服账 号;例如,QQ群(企业QQ群、用户QQ群、微信公众账号等等)是腾讯公司推出的聊天群体 的群体平台案例,阿里旺旺群是阿里巴巴公司推出的购物咨询相关的聊天群体的群体平台 案例,豆瓣小组是同类用户群组产品中的群体平台案例等等。用户获取某方面的特定信息 时,通过搜索引擎进行搜索仅是单纯地被动获得网页结果,并不能就搜索的需求进行互动 交流,往往需要根据需求加入一些用户群组,在群组中进行沟通交流才能获得对应的特定 信息,用户若要加入已经建立的用户群组,一般都需要先搜索,再申请加入。
[0003] 现有的搜索用户群组的方法主要是在群体平台中输入账号或关键词,群体平台会 根据该账号或关键词搜索群体平台中各用户群组的账号、类型、描述文字和名称,并列出搜 索结果。
[0004] 现有的搜索用户群组的方法具有如下缺点:
[0005] 第一,现有的群体平台众多,用户需要逐个打开各群体平台,在其内部分别搜索用 户群组,上述在各群体平台中逐个搜索的过程无疑带来了操作繁琐的问题,降低了获取信 息的效率;
[0006] 第二,用户往往会在熟悉的群体平台做简单的搜索,例如,QQ用户在存在租房信息 需求时,其搜索范围通常局限于QQ群,实际上,具有超大成员上限的豆瓣小组"北京租房" 要比固定成员上限的QQ群具有更多、更独到的租房信息,降低了获取信息的容量。

【发明内容】

[0007] 本发明实施例所要解决的技术问题是提供一种信息搜索方法和装置,能够提高用 户群组搜索的便捷性和效率。
[0008] 为了解决上述问题,本发明公开了一种信息搜索方法,包括:
[0009] 获取用户在搜索引擎中输入的查询串;
[0010] 根据所述查询串对应的搜索结果进行分析,得到对应的关键词;
[0011] 将所述关键词作为检索词,依据所述检索词在群体平台的各用户群组的索引数据 中分别进行检索,得到对应匹配的目标群组;
[0012] 将所述目标群组展现在所述搜索结果的页面。
[0013] 优选的,所述方法还包括:
[0014] 依据所述目标群组分别与各所述搜索结果的相关度对所述目标群组进行过滤,并 保留符合第一过滤条件的目标群组;
[0015] 则所述将所述目标群组展现在所述搜索结果的页面的步骤,具体为将符合第一过 滤条件的所述目标群组展现在所述搜索结果的页面。
[0016] 优选的,所述依据所述目标群组分别与各所述搜索结果的相关度对所述目标群组 进行过滤,并保留符合第一过滤条件的所述目标群组的步骤,包括:
[0017] 提取各搜索结果对应网页的第一特征,以及,提取各目标群组对应索引数据的第 二特征;
[0018] 计算所述第一特征和所述第二特征之间的相似度值;
[0019] 依据所述相似度值对各目标群组进行过滤,并保留相似度值符合第一过滤条件的 所述目标群组。
[0020] 优选的,所述方法还包括:
[0021] 依据所述目标群组的索引数据与所述检索词的相关度和/或各目标群组的查询 点击情况,对所述目标群组进行排序;
[0022] 则所述将所述目标群组展现在所述搜索结果的页面的步骤,具体为将排好序的所 述目标群组展现在所述搜索结果的页面。
[0023] 优选的,在所述将排好序的所述目标群组展现在所述搜索结果的页面步骤之前, 所述方法还包括:
[0024] 依据所述目标群组的摘要数据与所述检索词的相关度和/或各目标群组的群组 重要度,对排好序的所述目标群组进行过滤,并保留符合第二过滤条件的所述目标群组;其 中,所述群组重要度用于表示用户群组的重要程度;
[0025] 则所述将排好序的所述目标群组展现在所述搜索结果的页面的步骤,具体为将符 合第二过滤条件的所述目标群组展现在所述搜索结果的页面。
[0026] 优选的,通过如下步骤生成所述用户群组的索引数据:
[0027] 获取群体平台中各用户群组的群组资料数据和群组消息日志数据;
[0028] 依据所述群组资料数据和所述群组消息日志数据,生成用户群组的索引数据。
[0029] 优选的,所述群组资料数据包括:群名称、群简介、群标签,所述群组消息日志数据 包括群消息;
[0030] 则所述依据所述群组资料数据和所述群组消息日志数据,生成用户群组的索引数 据的步骤,包括:
[0031] 抽取所述群组资料数据中的群名称、群名称的别名、群简介、群标签、群的锚名称 作为基本信息;
[0032] 抽取所述群消息的描述文字中符合预置频率条件的词汇作为扩展信息;
[0033] 依据所述基本信息和所述扩展信息建立用户群组的索引数据。
[0034] 优选的,所述依据所述检索词在群体平台中各用户群组的索引数据中进行检索, 得到对应匹配的目标群组的步骤具体为,依据所述检索词在倒排索引表中进行检索,得到 对应匹配的目标群组,所述倒排索引表依据所有用户群组的索引数据建立。
[0035] 优选的,所述将所述目标群组展现在所述搜索结果的页面的步骤具体为,在所述 搜索结果的页面展现所述目标群组对应的摘要数据。
[0036] 另一方面,本发明还公开了一种信息搜索装置,包括:
[0037] 接口单元,用于获取用户在搜索引擎中输入的查询串;
[0038] 分析单元,用于根据所述查询串对应的搜索结果进行分析,得到对应的关键词;
[0039] 检索单元,用于将所述关键词作为检索词,依据所述检索词在群体平台的各用户 群组的索引数据中分别进行检索,得到对应匹配的目标群组;及
[0040] 展现单元,用于将所述目标群组展现在所述搜索结果的页面。
[0041] 优选的,所述装置还包括:用于依据所述目标群组分别与各所述搜索结果的相关 度对所述目标群组进行过滤,并保留符合第一过滤条件的目标群组的第一过滤单元;
[0042] 则所述展现单元,具体用于将符合第一过滤条件的所述目标群组展现在所述搜索 结果的页面。
[0043] 优选的,所述装置还包括:用于依据所述目标群组的索引数据与所述检索词的相 关度和/或各目标群组的查询点击情况,对所述目标群组进行排序的排序单元;
[0044] 则所述展现单元,具体用于将排好序的所述目标群组展现在所述搜索结果的页 面。
[0045] 优选的,所述装置还包括:用于生成所述用户群组的索引数据的索引生成单元,所 述索引生成单元包括:
[0046] 获取子单元,用于获取群体平台中各用户群组的群组资料数据和群组消息日志数 据;
[0047] 生成子单元,用于依据所述群组资料数据和群组消息日志数据,生成用户群组的 索引数据。
[0048] 优选的,所述展现单元,具体用于在所述搜索结果的页面展现所述目标群组的摘 要数据。
[0049] 与现有技术相比,本发明实施例包括以下优点:
[0050] 本发明实施例提供了一种在搜索引擎中网页搜索结果的页面中附着用户群组的 方案,该方案将根据所述查询串对应的搜索结果得到的关键词作为符合当前用户查询意图 的检索词,依据所述检索词在群体平台中各用户群组的索引数据中检索得到对应的目标群 组,并将所述目标群组展现在所述搜索结果的页面。
[0051] 其中,所述查询串为用户在搜索引擎中输入,其能够直接代表用户的查询意图;所 述查询串的网页搜索结果对应关键词可以为在搜索结果中通过词频统计获得的一个或多 个关键词,关键词相对于单一的上述查询串既能够间接代表用户的查询意图,又能够为用 户的查询意图匹配到更多的用户群组,因此能够扩大检索系统的召回率,丰富了获取信息 的容量;
[0052] 由于该方案中的群体平台可以为多个群体平台,故该方案可以支持多个群体平台 中用户群组,因此,本发明实施例无需用户逐个打开群体平台即可在网页搜索过程中获取 多个群体平台中用户群组搜索结果,因此,能够提高用户群组搜索的便捷性和效率;并且, 本发明实施例不仅可以为用户提供熟悉的群体平台中用户群组搜索结果,而且可以全面地 为用户提供不熟悉或者完全陌生的群体平台中用户群组搜索结果。
【附图说明】
[0053] 图1是本发明的一种信息搜索方法实施例一的步骤流程图;
[0054] 图2是本发明的一种信息搜索方法实施例二的步骤流程图;
[0055] 图3是本发明的一种信息搜索方法实施例三的步骤流程图;
[0056] 图4是本发明的一种信息搜索方法实施例四的步骤流程图;
[0057] 图5是本发明的一种信息搜索方法实施例五的步骤流程图;
[0058] 图6是本发明实施例一种用户群组检索的服务流程的示意图;
[0059] 图7是本发明的一种信息搜索装置实施例的结构框图。
【具体实施方式】
[0060] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本发明作进一步详细的说明。
[0061] 实施例一
[0062] 参照图1,示出了本发明的一种信息搜索方法实施例一的步骤流程图,具体可以包 括如下步骤:
[0063] 步骤101、获取用户在搜索引擎中输入的查询串;
[0064] 步骤102、根据所述查询串对应的搜索结果进行分析,得到对应的关键词;
[0065] 步骤103、将所述关键词作为检索词,依据所述检索词在群体平台的各用户群组的 索引数据中分别进行检索,得到对应匹配的目标群组;
[0066] 步骤104、将所述目标群组展现在所述网页搜索结果的页面。
[0067] 随着网络信息搜索技术的不断发展,用户通过网上进行信息搜索获取所需信息, 越来越成为日常生活以及工作中不可缺少的一部分。而通过QQ群、豆瓣小组等用户群组获 取租房息、二手息、打折息等所需息也是现有的一种获取息的主要方式,而由于 QQ群、豆瓣小组等用户群组从属于群体平台,而群体平台也提供相应用户群组的搜索功能, 故现有搜索用户群组的常规技术手段是在群体平台中搜索用户群组的方案。
[0068] 而本发明实施例打破了上述技术常规,提供了一种在搜索引擎中网页搜索结果的 页面中附着用户群组搜索结果的方案,该方案将所述查询串的网页搜索结果对应关键词作 为符合当前用户查询意图的检索词,依据所述检索词在群体平台中各用户群组的索引数据 中检索得到对应的目标群组,并将所述目标群组展现在所述网页搜索结果的页面。
[0069] 其中,所述查询串的网页搜索结果对应关键词可以为在网页搜索结果中通过词频 统计获得的一个或多个关键词,上述查询串的网页搜索结果对应关键词相对于单一的上述 查询串既能够间接代表用户的查询意图,又能够为用户
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1