一种生成搜索提示词服务的方法及其装置制造方法

文档序号:6631233阅读:209来源:国知局
一种生成搜索提示词服务的方法及其装置制造方法
【专利摘要】本申请提供一种生成搜索提示词服务的方法及其装置,所述方法包括:加载至少一个主题项目的数据库,建立与各主题项目对应的数据结构,在预置的容器中保存与所述各主题项目对应的数据结构的标识索引;分别根据各个主题项目的数据库,将其主题项目的搜索关键词以及与所述搜索关键词对应的搜索提示项插入到所述各主题项目对应的数据结构中;根据接收的输入搜索提示项以及所述容器中保存的标识索引,定位与所述输入的搜索提示项对应的数据结构,并在定位的数据结构中进行查找,获得与所述接收的输入搜索提示项对应的搜索提示词。本申请能够根据加载的主题项目数据库,自动生成搜索提示服务,节约开发成本,缩短开发周期。
【专利说明】-种生成搜索提示词服务的方法及其装置

【技术领域】
[0001] 本申请涉及互联网【技术领域】,尤其涉及一种生成搜索提示词服务的方法及其装 置。

【背景技术】
[0002] 随着互联网技术的发展,网络信息数据量也越来越大,比如视频网站中大量的视 频信息,网站论坛中大量用户的发布信息,W及用户的历史海量日志。为了实现某一操作目 的,需要在大数据量的网络信息中获得满足需求的数据。
[0003] 现有的数据搜索技术多采用基于搜索关键词(query)进行搜索,由搜索引擎服务 器根据输入的搜索关键词,将存储服务器存储的与所述搜索关键词匹配的页面包含搜索结 果进行反馈。同时,为了令搜索更加便捷,出现了搜索提示机制,用户仅需要输入搜索提示 项,搜索引擎服务器可W根据输入的搜索提示项给出搜索提示词,在给出的搜索提示词中 选择搜索关键词,即可根据所述搜索关键词进行搜索。
[0004] 搜索提示机制令数据搜索更加便捷,但是存储服务器每增加一主题项目,则需要 针对该增加的主题项目进行编程,建立搜索提示机制,从而根据输入的搜索提示项生成搜 索提示词。例如,当存储服务器增加了视频项目时,搜索引擎服务器需要通过编程建立针对 视频的搜索提示机制,从而实现根据输入的搜索提示项,给出视频的搜索提示词。但是当存 储服务器又增加了新闻项目时,则仍需要针对新闻项目重新进行搜索提示机制的编程,才 能够实现根据输入的搜索提示项,给出新闻的搜索提示词,开发成本高,周期长。
[0005] 因此,如何针对不同的主题项目,自动生成提示服务成为亟待解决的技术问题。


【发明内容】

[0006] 有鉴于此,本申请提供一种生成搜索提示词服务的方法及其装置,其能够根据加 载的主题项目数据库,自动生成搜索提示服务,节约开发成本,缩短开发周期。
[0007] 本申请提供一种生成搜索提示词服务的方法,所述方法包括:
[0008] 加载至少一个主题项目的数据库,建立与各主题项目对应的数据结构,在预置的 容器中保存与所述各主题项目对应的数据结构的标识索引;
[0009] 分别根据各个主题项目的数据库,将其主题项目的搜索关键词W及与所述搜索关 键词对应的搜索提示项插入到所述各主题项目对应的数据结构中;
[0010] 根据接收的输入搜索提示项W及所述容器中保存的标识索引,定位与所述输入的 搜索提示项对应的数据结构,并在定位的数据结构中进行查找,获得与所述接收的输入搜 索提示项对应的搜索提示词。
[0011] 进一步,本申请所述搜索提示项包括搜索关键词的文字、全拼、简拼、全笔画、首笔 画、描述信息中至少一个。
[0012] 进一步,本申请所述分别根据各个主题项目的数据库,将其主题项目的搜索关键 词W及与所述搜索关键词对应的搜索提示项插入到所述各主题项目对应的数据结构中包 括:
[0013] 根据各主题项目的数据库,分别获取所述各主题项目的数据库中所有搜索关键词 W及与每一个搜索关键词对应的至少一个搜索提示项;
[0014] 按照搜索提示项,分别将每一主题项目的所有搜索关键词W及与每一个搜索关键 词对应的至少一个搜索提示项插入到所述主题项目对应的数据结构中。
[0015] 进一步,本申请所述根据各主题项目的数据库,分别获取所述各主题项目的数据 库中所有搜索关键词W及与每一个搜索关键词对应的至少一个搜索提示项还包括:
[0016] 判断所述搜索关键词是否为网络热词;
[0017] 如果所述搜索关键词为网络热词,所述搜索关键词的搜索提示项还包括所述搜索 关键词进行分词处理后获得的主要分词词语的搜索提示项。
[0018] 进一步,本申请所述按照搜索提示项,分别将每一主题项目的所有搜索关键词W 及与每一个搜索关键词对应的至少一个搜索提示项插入到所述主题项目对应的数据结构 中包括:
[0019] 将所述搜索提示项插入到所述主题类型对应的数据结构的节点中;
[0020] 按照所述搜索关键词的搜索频率,依次将所述搜索提示项对应的搜索关键词插入 到所述搜索提示项插入的节点中。
[0021] 本申请还提供一种生成搜索提示词服务的装置,所述装置包括:
[0022] 加载模块,用于加载至少一个主题项目的数据库,建立与各主题项目对应的数据 结构,在预置的容器中保存与所述各主题项目对应的数据结构的标识索引;
[0023] 插入模块,用于分别根据各个主题项目的数据库,将其主题项目的搜索关键词W 及与所述搜索关键词对应的搜索提示项插入到所述各主题项目对应的数据结构中;
[0024] 提示模块,用于根据接收的输入搜索提示项W及所述容器中保存的标识索引,定 位与所述输入的搜索提示项对应的数据结构,并在定位的数据结构中进行查找,获得与所 述接收的输入搜索提示项对应的搜索提示词。
[0025] 进一步,本申请所述搜索提示项包括搜索关键词的文字、全拼、简拼、全笔画、首笔 画、描述信息中至少一个。
[0026] 进一步,本申请所述插入模块包括:
[0027] 提示获取单元,用于根据各主题项目的数据库,分别获取所述各主题项目的数据 库中所有搜索关键词W及与每一个搜索关键词对应的至少一个搜索提示项;
[0028] 信息插入单元,用于按照搜索提示项,分别将每一主题项目的所有搜索关键词W 及与每一个搜索关键词对应的至少一个搜索提示项插入到所述主题项目对应的数据结构 中。
[0029] 进一步,所述提示获取单元还包括:
[0030] 判断子单元,用于判断所述搜索关键词是否为网络热词;
[0031] 增加子单元,用于如果所述搜索关键词为网络热词,所述搜索关键词的搜索提示 项还包括所述搜索关键词进行分词处理后获得的主要分词词语的搜索提示项。
[0032] 进一步,本申请所述信息插入单元包括:
[0033] 提示插入子单元,用于将所述搜索提示项插入到所述主题类型对应的数据结构的 节点中;
[0034] 词语插入子单元,用于按照所述搜索关键词的搜索频率,依次将所述搜索提示项 对应的搜索关键词插入到所述搜索提示项插入的节点中。
[00巧]由W上技术方案可见,本申请加载至少一个主题项目的数据库时,在预置的容器 中保存与所述各主题项目对应的数据结构的标识索引。并且,分别根据各个主题项目的数 据库,将其主题项目的搜索关键词W及与所述搜索关键词对应的搜索提示项插入到所述各 主题项目对应的数据结构中。从而,根据接收的输入搜索提示项W及所述容器中保存的标 识索引,定位对应的数据结构并进行查找,获得与所述接收的输入搜索提示项对应的搜索 提示词。因此,本申请无需针对增加的主题项目进行编程,即可自动根据主题项目的数据库 建立搜索关键词提示服务,节约开发成本,缩短开发周期。

【专利附图】

【附图说明】
[0036] 图1是本申请生成搜索提示词服务的方法一具体实施例的流程图;
[0037] 图2是字典树的示意图;
[003引图3是本申请方法一具体实施例中的步骤S2的流程图;
[0039] 图4是本申请方法一具体实施例中的步骤S21的流程图;
[0040] 图5是本申请一具体实施例中字典树意图;
[0041] 图6是本申请另一具体实施例中字典树示意图;
[0042] 图7是本申请再一具体实施例中字典树示意图;
[0043] 图8是本申请又一具体实施例中字典树示意图;
[0044] 图9是本申请一具体实施例中的步骤S22的流程图;
[0045] 图10是本申请又一具体实施例中字典树示意图;
[0046] 图11是本申请一具体实施例中的两个字典树的示意图;
[0047] 图12是本申请生成搜索提示词服务的装置一具体实施例的结构图;
[0048] 图13是本申请一具体实施例中插入模块的结构图;
[0049] 图14是本申请一具体实施例中提示获取单元的结构图;
[0050] 图15是本申请一具体实施例中信息插入单元的结构图。

【具体实施方式】
[0051] 本申请加载至少一个主题项目的数据库时,在预置的容器中保存与所述各主题项 目对应的数据结构的标识索引。并且,分别根据各个主题项目的数据库,将其主题项目的搜 索关键词W及与所述搜索关键词对应的搜索提示项插入到所述各主题项目对应的数据结 构中。从而,根据接收的输入搜索提示项W及所述容器中保存的标识索引,定位对应的数据 结构并进行查找,获得与所述接收的输入搜索提示项对应的搜索提示词。因此,本申请无 需针对增加的主题项目进行编程,即可自动根据主题项目的数据库建立搜索关键词提示服 务,节约开发成本,缩短开发周期。
[0052] 下面结合本申请附图进一步说明本申请具体实现。
[0053] 本申请提供一种生成搜索提示词服务的方法,应用于搜索系统中的搜索引擎服务 器。所述搜索系统包括;存储数据库、客户端W及搜索引擎服务器。其中,存储数据库包括 内容数据库和媒资数据库。所述内容数据库包括;主题项目内容数据,例如视频数据、新闻 数据、股票数据、音乐数据等。媒资数据库用于存储内容的描述信息,例如视频内容的专辑 信息、明星、视频宣传页、时长等等,W及视频观看过程中生成的信息,如:下载次数、搜索日 志、观看用户数等。客户端可W为运行于手机或者智能电视、电脑等智能终端上的应用程 序。所述搜索引擎服务器用于根据用户通过客户端输入的搜索提示项提供搜索提示词,用 户通过客户端选择搜索提示词作为搜索关键词,所述搜索引擎服务器根据所述搜索关键词 针对所述存储服务器存储的主题项目完成数据搜索。
[0054] 参见图1,所述方法包括:
[00巧]S1、加载至少一个主题项目的数据库,建立与各主题项目对应的数据结构,在预置 的容器中保存与所述各主题项目对应的数据结构的标识索引。
[0056] 其中,所述主题项目包括视频项目、新闻项目、股票项目、音乐项目等各类不同主 题的项目。
[0057] 所述预置的容器用于创建所有主题项目对应的数据结构,W及存储所述数据结构 的标识或索引;并且,预置有读取主题项目的数据库的接口,当检测到所述接口被调用时, 会自动创建一个主题项目对应的数据结构,W及存储该数据结构的标识或索引的存储单 TVi O
[005引具体地,本申请所述数据结构为字典树(Trie树)。参见图2,字典树(Trie树), 又称单词查找树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保 存大量的字符串(但不仅限于字符串),所W经常被搜索引擎系统用于文本词频统计。它的 优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询 效率比哈希表高。图2中根节点不保存字符,所述字典树中所保存的字符串为油、油c、bd、 dda,字符串结尾用黑色表示该字符串结束。当然亦可采用字典树W外的其他分类数据结构 来实现本申请,比如二叉搜索树、H叉搜索树、链表等。
[0059] 在本申请一具体实现中,如所述搜索系统中的存储数据库增加了视频项目数据库 时,即所述内容数据库增加视频数据内容,所述媒资数据库则增加视频内容的专辑信息、明 星、视频宣传页、时长等等,W及视频观看过程中生成的信息,如:下载次数、搜索日志、观看 用户数等。系统调用预置的容器提供的读取主题项目的数据库的接口,当所述容器检测到 所述接口被调用时,会自动创建一个增加的视频项目对应的字典树,W及分配一个用于存 储该字典树的指针的存储单元。
[0060] 在本申请另一具体实现中,如所述搜索系统中的存储数据库增加了新闻项目数据 库时,即所述内容数据库新增新闻数据内容,所述媒资数据库新增新闻内容的发生地区、类 型、新闻级别、时长等等,W及新闻的点击率等。本申请根据增加的新闻项目数据库,建立与 新闻项目对应的字典树,在预置的容器中保存新闻项目对应的字典树的标识索引。
[0061] S2、分别根据各个主题项目的数据库,将其主题项目的搜索关键词W及与所述搜 索关键词对应的搜索提示项插入到所述各主题项目对应的数据结构中。
[0062] 在本申请一具体实现中,参看图3,所述步骤S2包括:
[0063] S21、根据各主题项目的数据库,分别获取所述各主题项目的数据库中所有搜索关 键词W及与每一个搜索关键词对应的至少一个搜索提示项。
[0064] 具体地,所述搜索提示项包括搜索关键词的文字、全拼、简拼、全笔画、首笔画、描 述信息中至少一个。本申请可W在所述数据库中保存搜索关键词W及与每一个搜索关键词 对应的至少一个搜索提示项,亦可在所述数据库中仅保存搜索关键词,而根据搜索关键词 和相关算法获得其对应的至少一个搜索提示项。所述相关算法可W根据搜索提示项进行设 置,比如搜索提示项为全拼,则根据现有的全拼提取算法获得该搜索关键词的全拼搜索提 示项。
[0065] 例如,搜索关键词为"爸爸去哪儿",搜索关键词的文字为"爸爸去哪儿",全拼为 "b油aqunaer",简拼为 "bbqne",全笔趣为。j、j I 一 L i、i In I 一 L一 I 一L 、I 1 一1 一一i I I i L",首笔画为"]i 一 I i "描述信息为"亲子类综艺节目"。为了 便于操作与管理,将所述搜索关键词与其搜索提示项建立并保存为一对应表,所述对应表 如表一所示。所述对应表可W保存一项搜索提示项,也可W保存多项搜索提示项。
[0066] 表一
[0067]

【权利要求】
1. 一种生成搜索提示词服务的方法,其特征在于,所述方法包括: 加载至少一个主题项目的数据库,建立与各主题项目对应的数据结构,在预置的容器 中保存与所述各主题项目对应的数据结构的标识索引; 分别根据各个主题项目的数据库,将其主题项目的搜索关键词以及与所述搜索关键词 对应的搜索提示项插入到所述各主题项目对应的数据结构中; 根据接收的输入搜索提示项以及所述容器中保存的标识索引,定位与所述输入的搜索 提示项对应的数据结构,并在定位的数据结构中进行查找,获得与所述接收的输入搜索提 示项对应的搜索提示词。
2. 根据权利要求1所述的方法,其特征在于,所述搜索提示项包括搜索关键词的文字、 全拼、简拼、全笔画、首笔画、描述信息中至少一个。
3. 根据权利要求1所述的方法,其特征在于,所述分别根据各个主题项目的数据库,将 其主题项目的搜索关键词以及与所述搜索关键词对应的搜索提示项插入到所述各主题项 目对应的数据结构中包括: 根据各主题项目的数据库,分别获取所述各主题项目的数据库中所有搜索关键词以及 与每一个搜索关键词对应的至少一个搜索提示项; 按照搜索提示项,分别将每一主题项目的所有搜索关键词以及与每一个搜索关键词对 应的至少一个搜索提示项插入到所述主题项目对应的数据结构中。
4. 根据权利要求3所述的方法,其特征在于,所述根据各主题项目的数据库,分别获取 所述各主题项目的数据库中所有搜索关键词以及与每一个搜索关键词对应的至少一个搜 索提示项还包括: 判断所述搜索关键词是否为网络热词; 如果所述搜索关键词为网络热词,所述搜索关键词的搜索提示项还包括所述搜索关键 词进行分词处理后获得的主要分词词语的搜索提示项。
5. 根据权利要求3所述的方法,其特征在于,所述按照搜索提示项,分别将每一主题项 目的所有搜索关键词以及与每一个搜索关键词对应的至少一个搜索提示项插入到所述主 题项目对应的数据结构中包括: 将所述搜索提示项插入到所述主题类型对应的数据结构的节点中; 按照所述搜索关键词的搜索频率,依次将所述搜索提示项对应的搜索关键词插入到所 述搜索提示项插入的节点中。
6. -种生成搜索提示词服务的装置,其特征在于,所述装置包括: 加载模块,用于加载至少一个主题项目的数据库,建立与各主题项目对应的数据结构, 在预置的容器中保存与所述各主题项目对应的数据结构的标识索引; 插入模块,用于分别根据各个主题项目的数据库,将其主题项目的搜索关键词以及与 所述搜索关键词对应的搜索提示项插入到所述各主题项目对应的数据结构中; 提示模块,用于根据接收的输入搜索提示项以及所述容器中保存的标识索引,定位与 所述输入的搜索提示项对应的数据结构,并在定位的数据结构中进行查找,获得与所述接 收的输入搜索提示项对应的搜索提示词。
7. 根据权利要求6所述的装置,其特征在于,所述搜索提示项包括搜索关键词的文字、 全拼、简拼、全笔画、首笔画、描述信息中至少一个。
8. 根据权利要求6所述的装置,其特征在于,所述插入模块包括: 提示获取单元,用于根据各主题项目的数据库,分别获取所述各主题项目的数据库中 所有搜索关键词以及与每一个搜索关键词对应的至少一个搜索提示项; 信息插入单元,用于按照搜索提示项,分别将每一主题项目的所有搜索关键词以及与 每一个搜索关键词对应的至少一个搜索提示项插入到所述主题项目对应的数据结构中。
9. 根据权利要求8所述的装置,其特征在于,所述提示获取单元还包括: 判断子单元,用于判断所述搜索关键词是否为网络热词; 增加子单元,用于如果所述搜索关键词为网络热词,所述搜索关键词的搜索提示项还 包括所述搜索关键词进行分词处理后获得的主要分词词语的搜索提示项。
10. 根据权利要求8所述的装置,其特征在于,所述信息插入单元包括: 提示插入子单元,用于将所述搜索提示项插入到所述主题类型对应的数据结构的节点 中; 词语插入子单元,用于按照所述搜索关键词的搜索频率,依次将所述搜索提示项对应 的搜索关键词插入到所述搜索提示项插入的节点中。
【文档编号】G06F17/30GK104331434SQ201410568353
【公开日】2015年2月4日 申请日期:2014年10月22日 优先权日:2014年10月22日
【发明者】关涛, 于立柱 申请人:乐视网信息技术(北京)股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1