一种搜索方法和系统的制作方法_4

文档序号:8528166阅读:来源:国知局
78]在本申请的一种优选实施例中,所述标识实体词可以为与所述实体词具有相同的语义标签,且使用频次最多的实体词;
[0179]所述标识属性词可以为与所述属性词描述同一类实体词,且使用频次最多的属性
ο
[0180]在本申请的一种优选实施例中,所述逆向表达判断子模块进一步可以包括如下子模块:
[0181]句法分析子模块,用于对所述查询词串进行句法分析,获得主语和修饰语,以及,所述主语和所述修饰语之间的依赖关系;所述依赖关系包括所述主语依赖所述修饰词的依赖关系;
[0182]判定子模块,用于在所述主语为所述实体词、所述修饰词为所述属性词,并且,所述依赖关系为所述主语依赖所述修饰词的依赖关系时,则所述查询词串符合逆向表达的句法规则。
[0183]对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
[0184]本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0185]本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请优选应用于嵌入式系统中。
[0186]最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
[0187]本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0188]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0189]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0190]尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
[0191]以上对本申请所提供的一种搜索方法和一种搜索系统,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
【主权项】
1.一种搜索方法,其特征在于,包括: 当接收到查询词串时,对所述查询词串进行语义分析,得到所述查询词串对应的语义表达式; 结合所述语义表达式进行匹配分析,确定当前所述查询词串中各词所属的语义标签; 根据所述语义标签对所述查询词串进行改写; 以改写后的查询词串进行搜索,得到匹配的网络信息。
2.根据权利要求1所述的方法,其特征在于,所述当接收到查询词串时,对所述查询词串进行语义分析,得到所述查询词串对应的语义表达式的步骤包括: 在知识库预置的实体词列表中查找所述查询词串对应的实体词; 在知识库预置的属性词列表中查找所述查询词串对应的属性词。
3.根据权利要求2所述的方法,其特征在于,所述确定当前所述查询词串中各词所属的语义标签的步骤包括: 提取所述属性词的预置的语义标签; 对所述实体词标记一个或多个原始语义标签; 分别判断被标记原始语义标签的所述实体词,与被标记语义标签的所述属性词是否存在预定义的关联关系;若是,则确定存在所述预定义关联关系的原始语义标签为当前所述实体词所属的语义标签。
4.根据权利要求1或2或3所述的方法,其特征在于,所述根据所述语义标签对所述查询词串进行改写的步骤包括: 采用所述语义标签查找预置的标识实体词; 将所述实体词替换为预置的标识实体词; 和/或, 将所述属性词替换为预置的标识属性词; 和/或, 判断所述查询词串是否符合逆向表达的句法规则;若是,则获取对应的在服务器存储的符合正向表达的句法规则对应的预置表达式;所述预置表达式具有使用频次; 当所述预置表达式的使用频次高于预设阈值时,将所述查询词串按照正向表达的句法规则进行改写。
5.根据权利要求4所述的方法,其特征在于,所述标识实体词为与所述实体词具有相同的语义标签,且使用频次最多的实体词; 所述标识属性词为与所述属性词描述同一类实体词,且使用频次最多的属性词。
6.根据权利要求4所述的方法,其特征在于,所述判断所述查询词串是否符合逆向表达的句法规则的步骤包括: 对所述查询词串进行句法分析,获得主语和修饰语,以及,所述主语和所述修饰语之间的依赖关系;所述依赖关系包括所述主语依赖所述修饰词的依赖关系; 当所述主语为所述实体词、所述修饰词为所述属性词,并且,所述依赖关系为所述主语依赖所述修饰词的依赖关系时,则所述查询词串符合逆向表达的句法规则。
7.一种搜索系统,其特征在于,包括: 词性解析模块,用于在接收到查询词串时,对所述查询词串进行语义分析,得到所述查询词串对应的语义表达式; 语义标签确定模块,用于结合所述语义表达式进行匹配分析,确定当前所述查询词串中各词所属的语义标签; 改写模块,用于根据所述语义标签对所述查询词串进行改写; 查询模块,用于以改写后的查询词串进行搜索,得到匹配的网络信息。
8.根据权利要求7所述的系统,其特征在于,所述词性解析模块包括: 实体词查找模块,用于在知识库预置的实体词列表中查找所述查询词串对应的实体词; 属性词查找模块,用于在知识库预置的属性词列表中查找所述查询词串对应的属性 ο
9.根据权利要求8所述的系统,其特征在于,所述语义标签确定模块包括: 提取子模块,用于提取所述属性词的预置的语义标签; 标记子模块,用于对所述实体词标记一个或多个原始语义标签; 关联关系判断模块,用于分别判被标记原始语义标签的所述实体词,与被标记语义标签的所述属性词是否存在预定义的关联关系;若是,则调用确定子模块; 确定子模块,用于确定存在所述预定义关联关系的原始语义标签为当前所述实体词所属的语义标签。
10.根据权利要求8或9或10所述的系统,其特征在于,所述改写模块包括: 标识实体词查找子模块,用于采用所述语义标签查找预置的标识实体词; 标识实体词替换子模块,用于将所述实体词替换为预置的标识实体词; 和/或, 标识属性词替换子模块,用于将所述属性词替换为预置的标识属性词; 和/或, 逆向表达判断子模块,用于判断所述查询词串是否符合逆向表达句法规则;若是,则调用预置表达式获取子模块; 预置表达式获取子模块,用于获取对应的在服务器存储的符合正向表达句法规则的预置表达式;所述预置表达式具有使用频次; 正向表达改写子模块,用于在所述预置表达式的使用频次高于预设阈值时,将所述查询词串按照正向表达句法规则进行改写。
11.根据权利要求10所述的系统,其特征在于,所述标识实体词为与所述实体词具有相同的语义标签,且使用频次最多的实体词; 所述标识属性词为与所述属性词描述同一类实体词,且使用频次最多的属性词。
12.根据权利要求10所述的系统,其特征在于,所述逆向表达判断子模块包括: 句法分析子模块,用于对所述查询词串进行句法分析,获得主语和修饰语,以及,所述主语和所述修饰语之间的依赖关系;所述依赖关系包括所述主语依赖所述修饰词的依赖关系; 判定子模块,用于在所述主语为所述实体词、所述修饰词为所述属性词,并且,所述依赖关系为所述主语依赖所述修饰词的依赖关系时,则所述查询词串符合逆向表达的句法规则。
【专利摘要】本申请提供了一种搜索方法和系统,所述方法包括:当接收到查询词串时,对所述查询词串进行语义分析,得到所述查询词串对应的语义表达式;结合所述语义表达式进行匹配分析,确定当前所述查询词串中各词所属的语义标签;根据所述语义标签对所述查询词串进行改写;以改写后的查询词串进行搜索,得到匹配的网络信息。本申请通过对查询词串进行语义分析,得到语义表达式,进而确定符合当前语境的语义表达式中各词所属的语义标签,基于该语义标签进行查询词串的改写,更为符合用户意图,使得在搜索时信息匹配的成功率高,提高了搜索的质量和搜索的效率。
【IPC分类】G06F17-30
【公开号】CN104850554
【申请号】CN201410051875
【发明人】张友书, 张坤, 张阔
【申请人】北京搜狗科技发展有限公司
【公开日】2015年8月19日
【申请日】2014年2月14日
当前第4页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1