一种事件索引与检索的方法及装置的制造方法

文档序号:8282448阅读:554来源:国知局
一种事件索引与检索的方法及装置的制造方法
【技术领域】
[0001] 本发明实施例涉及计算机技术领域,尤其涉及一种事件索引与检索的方法及装 置。
【背景技术】
[0002] 随着计算机技术的发展,在大量的文件与数据中进行检索已成为广泛应用的技术 手段。
[0003] 现有的检索方法具体为依据输入的关键词,在数据库或文件库中搜索包含该关键 词的数据或文件,即检索到的数据或文件严格包括输入的关键词,不包括该关键词的数据 或文件将不可能作为检索结果输出,但不包括关键词的数据或文件也有可能与输入的关键 词相关,使得检索结果不全面,导致检索效率低。

【发明内容】

[0004] 本发明实施例提供一种事件索引与检索的方法及装置,以提高检索效率。
[0005] 本发明实施例的一个方面是提供一种事件索引与检索的方法,包括:
[0006] 依据目标关键词获取与所述目标关键词对应的目标共生词,所述目标共生词是所 述目标关键词对应的共生词中共生频率超出阈值的共生词,所述共生词是与所述目标关键 词同时出现的词,所述共生频率是所述目标关键词与所述共生词同时出现的次数;
[0007] 依据所述目标关键词进行检索获得第一目标事件,依据所述目标共生词进行检索 获得第二目标事件;
[0008] 将所述第一目标事件和所述第二目标事件作为检索结果输出。
[0009] 本发明实施例的另一个方面是提供一种事件索引与检索的装置,包括:
[0010] 目标共生词获取模块,用于依据目标关键词获取与所述目标关键词对应的目标共 生词,所述目标共生词是所述目标关键词对应的共生词中共生频率超出阈值的共生词,所 述共生词是与所述目标关键词同时出现的词,所述共生频率是所述目标关键词与所述共生 词同时出现的次数;
[0011] 检索模块,用于依据所述目标关键词进行检索获得第一目标事件,依据所述目标 共生词进行检索获得第二目标事件;
[0012] 输出模块,用于将所述第一目标事件和所述第二目标事件作为检索结果输出。 [0013] 本发明实施例提供的一种事件索引与检索的方法及装置,依据目标关键词获取与 该目标关键词对应的目标共生词,分别检索获得包括目标关键词的第一目标事件,以及包 括目标共生词的第二目标事件,将第一目标事件和第二目标事件作为最终的检索结果,由 于目标共生词与目标关键词同时出现的频率超出了阈值,则包括目标共生词的第二目标事 件也是与目标关键词密切相关的事件,使得检索结果全面,并提高了检索效率。
【附图说明】
[0014] 图1为本发明实施例提供的事件索引与检索的方法流程图;
[0015] 图2为本发明实施例提供的事件索引与检索的装置的结构图;
[0016] 图3为本发明另一实施例提供的事件索引与检索的装置的结构图。
【具体实施方式】
[0017] 图1为本发明实施例提供的事件索引与检索的方法流程图。本发明实施例针对事 件流构成的事件集合,从事件集合中检索目标事件,提供了事件索引与检索的方法,该方法 的具体步骤如下:
[0018] 步骤S101、依据目标关键词获取与所述目标关键词对应的目标共生词,所述目标 共生词是所述目标关键词对应的共生词中共生频率超出阈值的共生词,所述共生词是与所 述目标关键词同时出现的词,所述共生频率是所述目标关键词与所述共生词同时出现的次 数;
[0019] 所述依据目标关键词获取与所述目标关键词对应的目标共生词之前,还包括:
[0020] 依据事件描述构建共生词检索表,所述共生词检索表包括关键词、所述关键词对 应的所述共生词,以及所述关键词与所述共生词的共生频率。
[0021] 本发明实施例提供的检索系统包括事件集合,该事件集合包括多个事件,每个事 件对应有一个事件描述,事件描述包括该事件最关键最核心的词,依据所有的事件描述构 建共生词检索表,该共生词检索表包括关键词、所述关键词对应的所述共生词,以及所述关 键词与所述共生词的共生频率。
[0022] 当接收到输入的目标关键词时,通过查找共生词检索表获得该目标关键词的所有 共生词,并从所有共生词中选出共生频率超出阈值的共生词作为目标共生词;其中,共生词 是与目标关键词同时出现在事件描述中的词,共生频率是某一个共生词与目标关键词在所 有事件描述中同时出现的次数。
[0023] 步骤S102、依据所述目标关键词进行检索获得第一目标事件,依据所述目标共生 词进行检索获得第二目标事件;
[0024] 依照现有的搜索技术在事件集合中检索出包括该目标关键词的第一目标事件,该 第一目标事件可以是一个集合,同理,对于步骤SlOl中获得的目标共生词,依照现有的搜 索技术在事件集合中检索出包括该目标共生词的第二目标事件,该第二目标事件也可以是 一个集合。
[0025] 步骤S103、将所述第一目标事件和所述第二目标事件作为检索结果输出。
[0026] 将所述第一目标事件和所述第二目标事件合并起来作为最终的检索结果,并输出 显不O
[0027] 本发明实施例依据目标关键词获取与该目标关键词对应的目标共生词,分别检索 获得包括目标关键词的第一目标事件,以及包括目标共生词的第二目标事件,将第一目标 事件和第二目标事件作为最终的检索结果,由于目标共生词与目标关键词同时出现的频率 超出了阈值,则包括目标共生词的第二目标事件也是与目标关键词密切相关的事件,使得 检索结果全面,并提高了检索效率。
[0028] 在上述实施例的基础上,所述依据事件描述构建共生词检索表包括:
[0029] 对所述事件描述进行分词处理获得多个关键词,所述多个关键词中任意两个关键 词互为共生词;依据所述关键词与所述关键词的共生词构建所述共生词检索表。
[0030] 例如一个事件描述为"马航MH17水下搜索",对该事件描述进行分词处理获得4个 关键词:马航、MH17、水下和搜索,且该4个关键词中两两互为共生词,构成多个共生词对, 具体为[马航,MH17]、[马航,水下]、[马航,搜索]、[MH17,马航]、[MH17,水下]、[MH17, 搜索]、[水下,马航]、[水下,MH17]、[水下,搜索]、[搜索,马航]、[搜索,MH17]、[搜 索,水下],并统计出任一共生词对在所有事件描述中同时出现的次数即频率,构成如表1 所示的共生词检索表:
[0031] 表 1
[0032]
【主权项】
1. 一种事件索引与检索的方法,其特征在于,包括: 依据目标关键词获取与所述目标关键词对应的目标共生词,所述目标共生词是所述目 标关键词对应的共生词中共生频率超出阔值的共生词,所述共生词是与所述目标关键词同 时出现的词,所述共生频率是所述目标关键词与所述共生词同时出现的次数; 依据所述目标关键词进行检索获得第一目标事件,依据所述目标共生词进行检索获得 第二目标事件; 将所述第一目标事件和所述第二目标事件作为检索结果输出。
2. 根据权利要求1所述的方法,其特征在于,所述依据目标关键词获取与所述目标关 键词对应的目标共生词之前,还包括: 依据事件描述构建共生词检索表,所述共生词检索表包括关键词、所述关键词对应的 所述共生词,W及所述关键词与所述共生词的共生频率。
3. 根据权利要求2所述的方法,其特征在于,所述依据事件描述构建共生词检索表包 括: 对所述事件描述进行分词处理获得多个关键词,所述多个关键词中任意两个关键词互 为共生词; 依据所述关键词与所述关键词的共生词构建所述共生词检索表。
4. 根据权利要求1-3任一项所述的方法,其特征在于,所述依据所述目标关键词进行 检索获得第一目标事件,依据所述目标共生词进行检索获得第二目标事件包括: 依据所述目标关键词进行全文索引获得所述第一目标事件,依据所述目标共生词进行 全文索引获得所述第二目标事件。
5. 根据权利要求4所述的方法,其特征在于,所述全文索引包括倒排索引。
6. -种事件索引与检索的装置,其特征在于,包括: 目标共生词获取模块,用于依据目标关键词获取与所述目标关键词对应的目标共生 词,所述目标共生词是所述目标关键词对应的共生词中共生频率超出阔值的共生词,所述 共生词是与所述目标关键词同时出现的词,所述共生频率是所述目标关键词与所述共生词 同时出现的次数; 检索模块,用于依据所述目标关键词进行检索获得第一目标事件,依据所述目标共生 词进行检索获得第二目标事件; 输出模块,用于将所述第一目标事件和所述第二目标事件作为检索结果输出。
7. 根据权利要求6所述的事件索引与检索的装置,其特征在于,还包括: 构建模块,用于依据事件描述构建共生词检索表,所述共生词检索表包括关键词、所述 关键词对应的所述共生词,W及所述关键词与所述共生词的共生频率。
8. 根据权利要求7所述的事件索引与检索的装置,其特征在于,所述构建模块具体用 于对所述事件描述进行分词处理获得多个关键词,所述多个关键词中任意两个关键词互为 共生词;依据所述关键词与所述关键词的共生词构建所述共生词检索表。
9. 根据权利要求6-8任一项所述的事件索引与检索的装置,其特征在于,所述检索模 块具体用于依据所述目标关键词进行全文索引获得所述第一目标事件,依据所述目标共生 词进行全文索引获得所述第二目标事件。
10. 根据权利要求9所述的事件索引与检索的装置,其特征在于,所述全文索引包括倒 排索引。
【专利摘要】本发明实施例提供一种事件索引与检索的方法及装置。该方法包括:依据目标关键词获取与所述目标关键词对应的目标共生词;依据所述目标关键词进行检索获得第一目标事件,依据所述目标共生词进行检索获得第二目标事件;将所述第一目标事件和所述第二目标事件作为检索结果输出。本发明实施例依据目标关键词获取与该目标关键词对应的目标共生词,分别检索获得包括目标关键词的第一目标事件,以及包括目标共生词的第二目标事件,将第一目标事件和第二目标事件作为最终的检索结果,由于目标共生词与目标关键词同时出现的频率超出了阈值,则包括目标共生词的第二目标事件也是与目标关键词密切相关的事件,使得检索结果全面,并提高了检索效率。
【IPC分类】G06F17-30
【公开号】CN104598630
【申请号】CN201510062272
【发明人】李建欣, 卢忠宇, 于伟仁, 张日崇
【申请人】北京航空航天大学
【公开日】2015年5月6日
【申请日】2015年2月5日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1