一种知识查询方法

文档序号:8457367阅读:944来源:国知局
一种知识查询方法
【技术领域】
[0001]本发明涉及知识查询领域,尤其涉及一种知识查询方法。
【背景技术】
[0002]互联网上的数据量大、分布存储、异构和非结构化使得发现知识的盲目性变高。数据庞大的知识信息查询速度较慢,且准确率较差,由于每次查询时都要将待查询的知识信息进行存储,造成系统内存的负担较大,影响了查询速度。且查询时需要通过多级检索才能查询到符合要求的知识信息,整个过程复杂,流程较多。

【发明内容】

[0003]针对上述技术问题,本发明设计开发了一种知识查询方法,目的在于提高知识查询的效率和准确度,同时及时释放内存空间,减小系统压力。
[0004]本发明提供的技术方案为:
[0005]一种知识查询方法,包括以下步骤:
[0006]步骤一、构建知识库,并将所述知识库中的每个词汇按照预定的标号规则标号,且按照预定的编码规则编码存储所述词汇及其关联的信息;
[0007]步骤二、从数据源中调取待查询的数据包,并缓存到解压缩单元进行解压缩,读取从所述数据包中解压出来的每个文件中的详细信息,并查找出每个文件中出现频率大于预定个数的关键词,将该关键词以预定的标号规则标号,且同时以预定的编码规则将该关键词编码,并存储到所述步骤一的知识库的临时存储区中,按照预定的编码规则查询所述临时存储区中的关键词与所述知识库中预先存储的词汇是否相同,若相同,则将所述临时存储区中的关键词清空,并将查找到的所述知识库中的词汇及其关联的信息复制存储到读取区,若不相同,则将所述临时存储区中的关键词移动到所述知识库中,同时将该关键词复制存储到读取区;
[0008]其中,按照预定的编码规则查询所述临时存储区中的关键词与所述知识库中预先存储的词汇是否相同的方法为:依次比较每一个关键词的编码与所述知识库中预先存储的词汇的编码的重复率,若重复率大于90%,则判定二者相同,若重复率为80?90%,则将所述知识库中预先存储的该词汇关联的信息与所述临时存储区中的关键词建立关联,作为该关键词的最接近的关联信息,与该关键词同时复制存储到读取区,若重复率小于80%,则判定二者不相同。
[0009]优选的是,所述的知识查询方法中,所述步骤二中还包括:
[0010]在按照预定的编码规则查询之前,按照所述临时存储区中的关键词的标号依次查询所述知识库中预先存储的词汇的标号,若存在标号相同的词汇,则判定二者相同,查询结束,将所述临时存储区中的关键词清空,并将查找到的所述知识库中的词汇及其关联的信息复制存储到读取区;若不存在标号相同的词汇,则按照预定的编码规则继续查询。
[0011]优选的是,所述的知识查询方法中,所述步骤一中利用可视化建模工具构建知识库。
[0012]优选的是,所述的知识查询方法中,所述步骤二中的数据包经压缩后存储在所述数据源中。
[0013]优选的是,所述的知识查询方法中,所述关键词的预定个数为10?15个。
[0014]优选的是,所述的知识查询方法中,所述预定的标号规则为:标号首位按照词汇首字母的排序标号,标号次位按照该词汇的第二个字母的排序标号,依次类推完成标号。
[0015]本发明所述的知识查询方法中,首先在解压缩后的数据包中查找关键词,然后按照关键词的标号在所述知识库中进行查询,相比于直接查询关键词,提高了查询效率。若不存在标号相同的词汇,则按照预定的编码规则继续查询,通过依次比较每一个关键词的编码与所述知识库中预先存储的词汇的编码的重复率进行查询,简化了查询步骤,同时提高了查询的准确度,且在查询到相应的信息后,及时释放临时存储区的空间,减小了整个系统的压力。
【附图说明】
[0016]图1是本发明所述的知识查询方法的流程示意图。
【具体实施方式】
[0017]下面结合附图对本发明做进一步的详细说明,以令本领域技术人员参照说明书文字能够据以实施。
[0018]如图1所示,本发明提供一种知识查询方法,包括以下步骤:
[0019]步骤一、构建知识库,并将所述知识库中的每个词汇按照预定的标号规则标号,以方便通过标号快速查询,且按照预定的编码规则编码存储所述词汇及其关联的信息,以减小占用空间。知识库中包含各个领域的所有词汇及其关联的信息,每个领域的词汇构成其特有的知识库。
[0020]步骤二、从数据源中调取待查询的数据包,并缓存到解压缩单元进行解压缩,读取从所述数据包中解压出来的每个文件中的详细信息,并查找出每个文件中出现频率大于预定个数的关键词,该关键词因在该文件中出现的频率较高,因此作为该文件的重要词频,即查询时的目标对象。将该关键词以预定的标号规则标号,该预定的标号规则与知识库中的词汇的预定的标号规则相同,使用同一标号规则,便于在知识库中进行快速查询。且同时以预定的编码规则将该关键词编码,该预定的编码规则与知识库中词汇的编码规则相同,使用同一编码规则,使得查询时不需解码即可快速判定两个词汇是否相同,节省占用空间的同时,简化了查询程序。将编码后的关键词存储到所述步骤一的知识库的临时存储区中,按照预定的编码规则查询所述临时存储区中的关键词与所述知识库中预先存储的词汇是否相同,即编码是否相同,若相同,则表明已在现有知识库中查询到该关键词,将所述临时存储区中的关键词清空,并将查找到的所述知识库中的词汇及其关联的信息复制存储到读取区,供查询者阅读参考;若不相同,则表明在现有知识库中没有存储该关键词,将所述临时存储区中的关键词移动到所述知识库中,以更新知识库,同时将该关键词复制存储到读取区,供查询者阅读参考。
[0021]其中,按照预定的编码规则查
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1