一种信息检索方法及装置的制造方法

文档序号:8445623阅读:310来源:国知局
一种信息检索方法及装置的制造方法
【技术领域】
[0001]本发明涉及数据处理技术领域,特别涉及一种信息检索方法及装置。
【背景技术】
[0002]随着信息技术的飞速发展,当今社会进入了信息爆炸时代,人们越来越多地借助网络来寻找自己需要的信息,因此,检索成为人们工作、生活不可或缺的一部分。
[0003]人们通常使用搜索引擎来进行检索,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将与用户检索相关的信息展示给用户的系统。
[0004]现有技术中,搜索引擎在对信息进行组织和处理时,会直接存储信息内容本身,例如,北京植物园包括很多展区,如树木园、月季园、牡丹园等,则会保存文字北京植物园包括很多展区,如树木园、月季园、牡丹园等,这样需要大量的存储空间。并且,在后续提供检索服务时,检索速度较慢。

【发明内容】

[0005]本发明提供一种信息检索方法及装置,用以实现灵活、快速的检索信息的目的。
[0006]本发明提供一种信息检索方法,包括:
[0007]根据给定的属性值及天数,从对应的词语关联表中查找所述属性值对应的数据项,其中,所述词语关联表的数据项架构包括关联的两个词的标识和对应的关联深度值;
[0008]从所述查找到的数据项中选取对应的关联深度值满足预设数值条件的至少一个数据项;
[0009]在词典表中查找所述至少一个数据项的词的标识对应的各个词,作为所述属性值的热门词汇,其中,所述词典表的数据项架构包括词的标识、词的哈希hash值以及词本身。
[0010]在本发明一实施例中,所述从所述查找到的数据项中选取对应的关联深度值满足预设数值条件的至少一个数据项,包括:
[0011]对所述查找到的数据项对应的关联深度值进行降序排列;
[0012]选取前η个关联深度值对应的至少一个数据项。
[0013]在本发明一实施例中,所述根据给定的属性值及天数,从对应的词语关联表中查找所述属性值对应的数据项之前,还包括:
[0014]计算所述属性值的hash值;
[0015]在所述词典表中查找所述属性值的hash值对应的所述属性值的标识。
[0016]在本发明一实施例中,所述在词典表中查找所述至少一个数据项的词的标识对应的各个词,作为所述属性值的热门词汇,包括:
[0017]将所述至少一个数据项的词的标识生成标识集合;
[0018]在词典表中查找所述标识集合中各标识对应的各个词,作为所述属性值的热门词汇。
[0019]在本发明一实施例中,若所述属性值包括多个,所述根据给定的属性值及天数,从对应的词语关联表中查找所述属性值对应的数据项,包括:
[0020]根据给定的多个属性值及天数,从对应的多个词语关联表中查找所述属性值对应的数据项。
[0021]本发明还提供一种信息检索装置,包括:
[0022]第一查找模块,用于根据给定的属性值及天数,从对应的词语关联表中查找所述属性值对应的数据项,其中,所述词语关联表的数据项架构包括关联的两个词的标识和对应的关联株度值;
[0023]选取模块,用于从所述查找到的数据项中选取对应的关联深度值满足预设数值条件的至少一个数据项;
[0024]第二查找模块,用于在词典表中查找所述至少一个数据项的词的标识对应的各个词,作为所述属性值的热门词汇,其中,所述词典表的数据项架构包括词的标识、词的哈希hash值以及词本身。
[0025]在本发明一实施例中,所述选取模块还用于:
[0026]对所述查找到的数据项对应的关联深度值进行降序排列;
[0027]选取前η个关联深度值对应的至少一个数据项。
[0028]在本发明一实施例中,在所述第一查找模块根据给定的属性值及天数,从对应的词语关联表中查找所述属性值对应的数据项之前,所述第一查找模块还用于:
[0029]计算所述属性值的hash值;
[0030]在所述词典表中查找所述属性值的hash值对应的所述属性值的标识。
[0031]在本发明一实施例中,所述第二查找模块还用于:
[0032]将所述至少一个数据项的词的标识生成标识集合;
[0033]在词典表中查找所述标识集合中各标识对应的各个词,作为所述属性值的热门词汇。
[0034]在本发明一实施例中,若所述属性值包括多个,所述第一查找模块还用于:
[0035]根据给定的多个属性值及天数,从对应的多个词语关联表中查找所述属性值对应的数据项。
[0036]本发明实施例的一些有益效果可以包括:
[0037]本发明实施例中,由于词语关联表可以包括人物关联表,地点关联表,机构关联表,属性关联表等等,并且词语关联表的数据项架构包括关联的两个词的标识和对应的关联深度值,因而本发明根据给定的属性值及天数,从对应的词语关联表中查找属性值对应的数据项,查找结果更加准确。进一步,本发明利用属性值的标识查找属性值对应的数据项,能够提高查找的效率。此外,关联深度值反映了两个词的关联程度,本发明选取了对应的关联深度值满足预设数值条件的至少一个数据项,进一步提高查找结果的准确性。
[0038]本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0039]下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
【附图说明】
[0040]附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0041]图1为本发明一实施例中信息检索方法的流程图;
[0042]图2为本发明一实施例提供的词典表的结构字段示意图;
[0043]图3为本发明一实施例提供的词语关联表的结构字段示意图;
[0044]图4为本发明一实施例提供的词典数据表的结构字段示意图;以及
[0045]图5为本发明一实施例中信息检索装置的结构示意图。
【具体实施方式】
[0046]以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
[0047]图1所示为本发明一实施例中信息检索方法的流程图,该方法包括以下步骤S11-S13:
[0048]步骤S11,根据给定的属性值及天数,从对应的词语关联表中查找属性值对应的数据项,其中,词语关联表的数据项架构包括关联的两个词的标识和对应的关联深度值。
[0049]这里提及的词语关联表可以包括:人物关联表,地点关联表,机构关联表,属性关联表等,本发明不限于此。下文提及的词语关联表中nr (表示人物)、nt (表示机构)或ns(表示地点)均视为不同的词语关联表,但每个关联表数据结构保持一致。
[0050]词语关联性表可以表示为Tzn_terms,其包括两个字段分别为rel和weight,其中,rel记录了关联的两个词的ID (标识),I
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1