一种信息检索方法及装置的制造方法

文档序号:8445625阅读:237来源:国知局
一种信息检索方法及装置的制造方法
【技术领域】
[0001]本发明涉及数据处理技术领域,特别涉及一种信息检索方法及装置。
【背景技术】
[0002]随着信息技术的飞速发展,当今社会进入了信息爆炸时代,人们越来越多地借助网络来寻找自己需要的信息,因此,检索成为人们工作、生活不可或缺的一部分。
[0003]人们通常使用搜索引擎来进行检索,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将与用户检索相关的信息展示给用户的系统。
[0004]现有技术中,搜索引擎在对信息进行组织和处理时,会直接存储信息内容本身,例如,北京关联的相关机构是故宫,则会保存文字北京关联的相关机构是故宫,这样需要大量的存储空间。并且,搜索引擎在检索时会直接根据文字匹配与搜索词相关的信息,如,搜索词为“北京关联的机构是什么”,则会匹配到“北京关联的相关机构是故宫”等,检索速度较慢。

【发明内容】

[0005]本发明提供一种信息检索方法及装置,用以实现提高检索速度及词语关联准确度的目的。
[0006]本发明提供一种信息检索方法,包括:
[0007]从给定的、包含关联属性信息的词汇中提取出给定词的名称和关联属性;
[0008]根据所述给定词的名称,计算所述给定词的哈希hash值;
[0009]在词典表中根据所述给定词的hash值查找所述给定词的标识,其中,所述词典表的数据项架构包括词的标识、词的hash值以及词本身;
[0010]根据所述给定词的标识和关联属性,在对应的词语关联表中查找所述给定词的属性关联词的标识;
[0011]在所述词典表中根据所述给定词的属性关联词的标识查找所述给定词的属性关联词。
[0012]在本发明一实施例中,所述词语关联表的数据项架构包括关联的两个词的标识和对应的关联深度值。
[0013]在本发明一实施例中,所述根据所述给定词的标识和关联属性,在词语关联表中查找所述给定词的属性关联词的标识,包括:
[0014]在所述给定词的关联属性对应的词语关联表中,根据所述给定词的标识查找所述给定词的属性关联词的标识。
[0015]在本发明一实施例中,所述根据所述给定词的标识查找所述给定词的属性关联词的标识,包括:
[0016]根据所述给定词的标识查找到多个所述给定词的属性关联词的标识;
[0017]从多个所述给定词的属性关联词的标识中,选取对应的关联深度值满足预设数值条件的标识。
[0018]在本发明一实施例中,所述给定词的关联属性包括多个,所述根据所述给定词的标识和关联属性,在词语关联表中查找所述给定词的属性关联词的标识,包括:
[0019]根据所述给定词的标识和第一关联属性,在词语关联表中查找所述给定词的第一属性关联词的标识;
[0020]根据所述给定词的第一属性关联词的标识和第二关联属性,在词语关联表中查找所述给定词的第二属性关联词的标识,以此类推,直至在词语关联表中查找所述给定词的所有属性关联词的标识。
[0021]本发明还提供一种信息检索装置,包括:
[0022]提取模块,用于从给定的、包含关联属性信息的词汇中提取出给定词的名称和关联属性;
[0023]计算模块,用于根据所述给定词的名称,计算所述给定词的哈希hash值;
[0024]第一查找模块,用于在对应的词典表中根据所述给定词的hash值查找所述给定词的标识,其中,所述词典表的数据项架构包括词的标识、词的hash值以及词本身;
[0025]第二查找模块,用于根据所述给定词的标识和关联属性,在词语关联表中查找所述给定词的属性关联词的标识;
[0026]第三查找模块,用于在所述词典表中根据所述给定词的属性关联词的标识查找所述给定词的属性关联词。
[0027]在本发明一实施例中,所述词语关联表的数据项架构包括关联的两个词的标识和对应的关联深度值。
[0028]在本发明一实施例中,所述第二查找模块还包括:
[0029]查找单元,用于在所述给定词的关联属性对应的词语关联表中,根据所述给定词的标识查找所述给定词的属性关联词的标识。
[0030]在本发明一实施例中,所述查找单元还用于:
[0031 ] 根据所述给定词的标识查找到多个所述给定词的属性关联词的标识;
[0032]从多个所述给定词的属性关联词的标识中,选取对应的关联深度值满足预设数值条件的标识。
[0033]在本发明一实施例中,所述给定词的关联属性包括多个,所述第二查找模块还用于:
[0034]根据所述给定词的标识和第一关联属性,在词语关联表中查找所述给定词的第一属性关联词的标识;
[0035]根据所述给定词的第一属性关联词的标识和第二关联属性,在词语关联表中查找所述给定词的第二属性关联词的标识,以此类推,直至在词语关联表中查找所述给定词的所有属性关联词的标识。
[0036]本发明实施例的一些有益效果可以包括:
[0037]本发明实施例中,从给定的、包含关联属性信息的词汇中提取出给定词的名称和关联属性,随后根据给定词的名称,计算给定词的hash值,进而在词典表中根据给定词的hash值查找给定词的标识,根据给定词的标识和关联属性,在对应的词语关联表中查找给定词的属性关联词的标识,最后在词典表中根据给定词的属性关联词的标识查找给定词的属性关联词。由此可知,本发明能够根据给定词的标识,在关联属性对应的词语关联表中查找给定词的属性关联词的标识,最后在词典表中根据给定词的属性关联词的标识查找给定词的属性关联词,相比于现有技术中查找匹配文字本身,本发明能够提高检索效率及词语关联准确度。并且,本发明在词语关联表中存储词的标识,能够节约资源存储空间。
[0038]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0039]下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
【附图说明】
[0040]附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0041]图1为本发明一实施例中信息检索方法的流程图;
[0042]图2为本发明一实施例提供的词典表的结构字段示意图;
[0043]图3为本发明一实施例提供的词典数据表的结构字段示意图;
[0044]图4为本发明一实施例提供的词语关联表的结构字段示意图;
[0045]图5为本发明一实施例中信息检索装置的结构示意图;以及
[0046]图6为本发明一实施例中信息检索装置中第二查找模块的结构示意图。
【具体实施方式】
[0047]以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0048]本发明实施例中,词语关联表可以包括:人物关联表,地点关联表,机构关联表,属性关联表等,本发明不限于此。下文提及的词语关联表中nr (表示人物)、nt (表示机构)或ns (表示地点)均视为不同的词语关联表,但每个关联表数据结构保持一致。
[0049]图1所示为本发明一实施例中信息检索方法的流程图,该方法包括以下步骤S11-S15:
[0050]步骤Sll,从给定的、包含关联属性信息的词汇中提取出给定词的名称和关联属性。
[0051]在该步骤中,给定的、包含关联属性信息的词汇,例如“北京关联的机构资源”,从该词汇中提取出给定词为“北京”,关联属性为“关联的机构”。
[0052]步骤S12,根据给定词的名称,计算给定词的hash值。
[0053]步骤S13,在词典表中根据给定词的hash值查找给
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1