一种基于全文检索的数据分类与数据检索的方法及装置与流程

文档序号:11133997阅读:来源:国知局

技术特征:

1.一种基于全文检索的数据分类与数据检索的方法,其特征在于,包括以下步骤:定义各个业务模块,将业务模块产生的数据与该业务模块进行关联,对上述数据进行分类,对分类后的数据添加索引,然后存储;在用户检索数据时,根据索引查找到相应数据,根据数据与业务模块的关联信息,找到数据对应的业务模块,进而找到对应业务模块处理类的处理方法,对数据进行处理,得到检索结果。

2.根据权利要求1所述的基于全文检索的数据分类与数据检索的方法,其特征在于,所述方法包括以下步骤:

(1)数据采集、分类过程:

(1-1)根据需要定义不同的业务模块,建立业务模块库,规划各个业务模块的数据处理机制,所述数据处理机制为业务模块处理类的处理方法;

(1-2)对数据进行采集,并将数据与业务模块库中的业务模块进行关联;

(1-3)对数据进行结构化和非结构化分类;

(1-4)对分类之后的数据添加数据索引,将数据索引保存到数据索引库中,然后借由数据库持久化操作,将数据保存到对应的数据库中;

(2)数据检索过程:

(2-1)系统根据用户输入的检索关键字,对储存的数据进行搜索,找到对应数据的索引;通过索引找到相应的数据并提取出来;

(2-2)根据数据与业务模块的关联信息,找到数据对应的业务模块,根据该业务模块的数据处理机制,完成对数据的处理,得到检索结果。

3.根据权利要求2所述的基于全文检索的数据分类与数据检索的方法,其特征在于,所述方法还包括步骤:

(2-3)在步骤(2-2)得到检索结果后,再根据用户的权限对上述检索结果进行过滤,最终将过滤后的检索结果发送给用户。

4.根据权利要求2所述的基于全文检索的数据分类与数据检索的方法,其特征在于,所述步骤(1-2)中将数据与业务模块库中的业务模块进行关联的方式为:对各个业务模块赋予一个标记,该业务模块采集的数据自动添加该标记。

5.根据权利要求4所述的基于全文检索的数据分类与数据检索的方法,其特征在于,将业务模块的编码作为标记,将该标记作为后缀与结构化、非结构化数据进行关联,然后存入非结构化数据库中。

6.根据权利要求2所述的基于全文检索的数据分类与数据检索的方法,其特征在于,所述步骤(2-1)中找到对应数据的索引的具体步骤为:对需要检索的线索字段进行关键字提取和分词处理,并对这些关键字进行优先级筛选及敏感信息过滤,然后提取出索引;

所述步骤(2-2)中,找到数据对应的业务模块后,采用面相对象开发语言的反射机制,找到该业务模块对应的数据处理机制。

7.一种基于全文检索的数据分类与数据检索的装置,其特征在于,包括:

预定义模块,用于根据需要定义不同的业务模块,建立业务模块库,规划各个业务模块的数据处理机制,所述数据处理机制为业务模块处理类的处理方法;

信息采集模块,用于对数据进行采集,并将数据与业务模块库中的业务模块进行关联;

数据分类模块,用于对数据进行结构化和非结构化分类;

数据持久化模块,用于对分类之后的数据添加数据索引,将数据索引保存到数据索引库中,然后借由数据库持久化操作,将数据保存到对应的数据库中;同时,还用于在用户输入检索关键字时,对储存的数据进行搜索,找到对应数据的索引,通过索引找到相应的数据并提取出来;

数据分类处理模块,用于根据数据与业务模块的关联信息,找到数据对应的业务模块,根据该业务模块的数据处理机制,完成对数据的处理,得到检索结果。

8.根据权利要求7所述的基于全文检索的数据分类与数据检索的装置,其特征在于,所述装置还包括:

数据权限模块,用于在数据分类处理模块得到检索结果后,再根据用户的权限对上述检索结果进行过滤,最终将过滤后的检索结果发送给用户。

9.根据权利要求7所述的基于全文检索的数据分类与数据检索的装置,其特征在于,所述信息采集模块中,将业务模块的编码作为后缀与结构化、非结构化数据进行关联,然后存入非结构化数据库中。

10.根据权利要求7所述的基于全文检索的数据分类与数据检索的装置,其特征在于,所述数据持久化模块包括索引寻找模块,所述索引寻找模块用于对需要检索的线索字段进行关键字提取和分词处理,并对这些关键字进行优先级筛选及敏感信息过滤,然后提取出索引。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1