检索方法、装置和系统与流程

文档序号:12464926阅读:来源:国知局

技术特征:

1.一种检索方法,应用于搜索引擎中,其特征在于,包括:

当接收到的搜索信息中包括关键词和所述关键词对应的感知度时,将所述关键词与预设的主题感知树的主题节点进行匹配,得到所述关键词对应的主题节点;其中,所述感知度指示所述关键词与查询意图的匹配程度;

判断所述关键词对应的主题节点的类型,所述主题节点的类型包括连接节点和叶子节点;

根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,得到扩展词集合;

将所述扩展词集合中的词作为所述搜索信息的检索对象,进行检索。

2.根据权利要求1所述的方法,其特征在于,所述预设的主题感知树的构建过程包括:

从训练数据的文档样本中获取主题词、概念词和实例词;

将所述主题词嵌入主题感知树的主题层内,根据主题词的含义设置不同类型的主题节点,包括具有子节点的连接节点和没有子节点的叶子节点;

将所述概念词嵌入主题感知树的概念层内,建立概念节点,并为主题层的叶子节点与对应的概念节点建立关联;

将所述实例词嵌入主题感知树的实例层内,建立实例节点,并为概念层的概念节点与对应的实例节点建立关联;

为每个主题节点和每个概念节点设置属性标识;

根据每个主题节点和每个概念节点的属性标识,获取每个主题节点的主题感知度、每个概念节点的概念感知度和每个实例节点的实例感知度。

3.根据权利要求2所述的方法,其特征在于,根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,包括:

如果所述关键词对应的主题节点的类型是叶子节点,判断用户输入的感知度的数值区间;

如果所述感知度大于0且小于1,则查找所述主题节点对应的所有概念节点和所有实例节点,找到所有实例感知度大于所述感知度的实例节点;

如果所述感知度大于1,从所述主题节点的父节点对应的所有子节点中,查找主题感知度满足预设条件的节点对应的概念节点和实例节点;所述父节点为所述主题节点对应的连接节点;

如果所述关键词所对应的主题节点的类型是连接节点,判断用户输入的感知度的数值区间;

如果所述感知度大于0且小于1,从所述主题节点的子节点中,查找主题感知度满足预设条件的节点对应的概念节点和实例节点;

如果所述感知度大于1,从所述主题节点的父节点及所述父节点对应的所有子节点中,查找主题感知度满足预设条件的节点所对应的概念节点和实例节点;

将上述步骤中获取的实例节点作为扩展词存入扩展词集合。

4.根据权利要求1所述的方法,其特征在于,

在将所述关键词与预存的主题感知树的主题节点进行匹配之前,所述方法还包括:

对所述关键词进行预处理,提取所述关键词中的实词;

将提取的所述实词作为新的关键词。

5.根据权利要求4所述的方法,其特征在于,对所述关键词进行预处理,包括:

采用非空探测方法和/或中文分词方法对所述关键词进行预处理。

6.一种检索装置,其特征在于,包括:

节点匹配模块,用于当接收到的搜索信息中包括关键词和所述关键词对应的感知度时,将所述关键词与预设的主题感知树的主题节点进行匹配,得到所述关键词对应的主题节点;其中,所述感知度指示所述关键词与查询意图的匹配程度;

节点类型判断模块,用于判断所述关键词对应的主题节点的类型,所述主题节点的类型包括连接节点和叶子节点;

扩展词获取模块,根据所述关键词对应的主题节点、主题节点的类型和所述感知度对所述关键词进行扩展,得到扩展词集合;

检索模块,将所述扩展词集合中的词作为所述搜索信息的检索对象,进行检索。

7.根据权利要求6所述的装置,其特征在于,所述扩展词获取模块包括:

叶子节点处理单元,用于在所述关键词对应的主题节点的类型是叶子节点时,根据用户输入的感知度查找对应的实例节点;

连接节点处理单元,用于在所述关键词对应的主题节点的类型是连接节点时,根据用户输入的感知度查找对应的实例节点。

8.根据权利要求6所述的装置,其特征在于,所述装置还包括:

关键词预处理模块,用于对所述关键词进行预处理,提取所述关键词中的实词;将提取的所述实词作为新的关键词。

9.一种检索系统,其特征在于,包括权利要求6-8中任意一项所述的检索装置和预设的主题感知树。

10.根据权利要求9所述的系统,其特征在于,所述主题感知树包括主题层、概念层和实例层;

所述主题层内设有多个主题节点;

所述概念层内设有多个与所述主题节点有关联的概念节点;

所述实例层内设有多个与所述概念节点有关联的实例节点。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1