一种基于云存储的电力信息检索方法及系统的制作方法

文档序号:6355608阅读:116来源:国知局
专利名称:一种基于云存储的电力信息检索方法及系统的制作方法
技术领域
本发明涉及检索技术,尤其涉及一种基于云存储的电力信息检索方法及系统。
背景技术
随着信息技术的迅猛发展,人们越来越多的将各种资料转换成电子资源,通过计算机等终端进行存储,并且,也越来越多的通过计算机或者网络等查找自己所需的各种信息;从而,为了方便用户对于各种信息的查询,电子图书馆应运而生。但是,现有的电子图书馆都是涵盖了各个领域的各种技术资料,但是由于自身存储能力以及获取到的资源的限制,只能提供各个领域中较为基础和有限的资源。现有技术中,并没有公开仅基于电力信息所建立的电子图书馆,也没有公开基于电子图书馆的进行电力信息检索的方法。

发明内容
有鉴于此,本发明要解决的技术问题是,提供一种基于云存储的电力信息检索方法及装置,能够实现对于电力信息的检索,且提高了检索速度。为此,本发明实施例采用如下技术方案—种基于云存储的电力信息检索方法,包括根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述电力数据库以及索引数据库存储于云存储系统中;获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;从索引数据库中查找得到各个关键词对应的文档集合;根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档 fn息;将所述文档信息向用户进行展现。还包括根据用户的点击操作,从电力数据库中获取用户点击的文档信息对应的文档,将所述文档向用户展现。根据得到的分词结果建立索引数据库包括根据分词结果确定每个词项所对应的、包含该词项的文档集合,以词项为主字段, 建立所述索引数据库。还包括对检索信息对应的文档信息,按照文档信息所对应文档与检索信息之间的关联度进行排序;相应的,向用户进行展现的文档信息为排序后的文档信息。一种基于云存储的电力信息检索系统,包括
建立单元,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库;云存储系统,用于对电力数据库以及索引数据库进行云存储;确定单元,用于获取用户的检索信息,根据所述检索信息确定检索信息的关键词, 以及关键词之间的逻辑关系;查找单元,用于从索引数据库中查找得到各个关键词对应的文档集合;处理单元,用于根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;第一展现单元,用于将所述文档信息向用户进行展现。还包括第二展现单元,用于根据用户的点击操作,从电力数据库中获取用户点击的文档信息对应的文档,将所述文档向用户展现。建立单元包括分词子单元,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理;建立子单元,用于根据得到的分词结果确定每个词项所对应的、包含该词项的文档集合,以词项为主字段,建立所述索引数据库。还包括排序单元,用于对检索信息对应的文档信息,按照文档信息所对应文档与检索信息之间的关联度进行排序。对于上述技术方案的技术效果分析如下建立基于电力信息的电力数据库,根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述索引数据库存储于云存储系统中,从而后续用户可以输入由电力主题词表中的词项构成的检索信息,进行电力信息文档的检索,从而实现了专门针对电力信息的检索;而且,将电力数据库以及索引数据库存储于云存储系统中,从而可以提高对于电力信息的检索速度。


图1为本发明实施例基于云存储的电力信息检索方法流程示意图;图2为本发明实施例另一种基于云存储的电力信息检索方法流程示意图;图3为本发明实施例一种基于云存储的电力信息检索系统结构示意图。
具体实施例方式以下,结合附图详细说明本发明实施例基于云存储的进行电力关键词全文检索的方法及装置的实现。图1为本发明实施例一种基于云存储的电力信息检索方法流程示意图,如图1所示,该方法包括预设设置基于电力信息的数据库,所述数据库中可以包括从时效性最高的电力动态信息到时效性较低的图书手册等各种电力信息资源,具体的,可以电力动态、电力报刊、电力期刊、会议文集、技术标准、法律法规、科技报告、考察报告、科技成果、图书手册等;并且,可以将这些电力信息资源进行类别的划分,具体的类别以及类别的数量可以在实际应用中自主设定并划分,这里并不限定。步骤101 根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述索引数据库存储于云存储系统中;步骤102 获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;步骤103 从索引数据库中查找得到各个关键词对应的文档集合;步骤104 根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;步骤105 将所述文档信息向用户进行展现。图1所示的本发明实施例检索方法中,建立基于电力信息的电力数据库,根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述索引数据库存储于云存储系统中,从而后续用户可以输入由电力主题词表中的词项构成的检索信息,进行电力信息文档的检索,从而实现了专门针对电力信息的检索;而且,将电力数据库以及索引数据库存储于云存储系统中,从而可以提高对于电力信息的检索速度。在图1的基础上,通过图2对本发明实施例基于云存储的电力信息检索方法进行更为详细的说明,如图2所示,该方法包括步骤201 预先设置基于电力信息的电力数据库,所述数据库中包含基于电力信息资源的各种文档;所述电力数据库存储于云存储系统中。其中,所述云存储系统可以使用现有的各种云存储系统实现,这里不赘述。步骤202 根据预设的电力主题词表的分词词库对电力数据库中的各个文档进行分词处理,将得到的分词结果按照倒排结构进行存储,构成索引数据库,所述索引数据库存储于云存储系统中。所述索引数据库中包括词项以及该包含该词项的文档构成的文档集合。其中,所述文档集合中可以仅记载文档对应的文档信息,例如文档标识(ID)和/或文档名称等。其中,根据预设的电力主题词表的分词词库对电力数据库中的各个文档进行分词处理包括依次将待分词文档中字符串与分词词库中的各个词条进行匹配,如果匹配上,则存储该词条以及词条对应的信息,再继续进行该词条后续字符串的匹配,直到文档末端。进行分词处理后得到的分词结果是正排结构,分词结果以文档为主字段,记录了每个文档中包含的词项,也即是说每个文档对应一个由该文档所包含词项构成的词项集合。而倒排结构则以词项为主字段,记录了包含词项的所有文档,也即是说每个词项对应一个由包含该词项的所有文档构成的文档集合。例如,正排结构是包括文档1,词项集合 {tl、t2、t3};文档2,词项集合{tl、t2、t4};而其对应的倒排结构则是词项tl,文档集合 {1、2};词项t2,文档集合{1,2};词项t3,文档集合{1};词项t4,文档集合⑵。步骤203 获取用户输入的检索信息,根据所述检索信息确定检索信息的关键词, 以及关键词之间的逻辑关系。
其中,用户输入的检索信息可以为词条或者语句,此时,一般需要通过分词的方式确定检索信息的关键词,具体的分词方法,这里不赘述。此时,一般需要将分词结果中例如“的”“地”等对检索没有帮助的词项删除,具体的,可以预先设置可以进行删除的词库,通过将分词后的词项与该词库中的词项进行比较,从而得到最终检索信息对应的关键词。此时,关键词之间的逻辑关系可以为文档中包含所有的关键词。或者,也可以预先设置用户如何检索信息的规则,例如,设定不同的检索关键词之间需要通过逻辑连词“and” "or" “*” “?”等等标明关键词之间的逻辑关系,此时,直接将相邻两个连词之间的词项作为检索信息的关键词即可。此时,关键词之间的逻辑关系可以通过检索信息中的逻辑连词确定。其中,各个连词所代表的关系可以自主设定,一般的,在实际应用中,各种连词的含义如下And:组合若干个关键词,使检索结果中包含所有关键词,但与关键词的先后顺序和位置无关。例如,检索education and technology的结果中必然既包含education和 technology。Or 组合若干个关键词,使检索结果中至少包含一个关键词,与关键词的先后顺序和位置无关。例如,检索education or technology的结果中必然包含education或者 technology 中的一个。* 通配符,用于通配多个字符,但只能用于英文和数字。例如,使用aero*可以检索到所有包含aero开头单词(如aerospace,aerobes等)的文献。要注意的是,本系统不支持前截词,也就是说"*"不能置于表达式开头。?通配符,用于通配单个字符,但只能用于英文和数字。例如,使用aero可以检索到所有包含aero开头,共7个字符的单词(如aerobic,aerobes等)的文献。其他连词这里不再赘述,可以在实际应用中适应性选择。步骤204 根据所述关键词从索引数据库中查找得到各个关键词所对应的文档集合。其中,所述关键词需要与词项匹配,也即输入的关键词也必须是电力主题词表的分词词库中包含的词项。步骤205 根据所述关键词之间的逻辑关系,对所述关键词对应的文档集合进行处理,得到检索信息对应的文档信息;在根据逻辑关系进行处理时,例如,关键词之间的逻辑关系为and,则需要计算两个关键词对应的文档集合的交集;或者,关键词之间的逻辑关系为or,则需要计算两个关键词对应的文档集合的合集;等等,这里不赘述。进一步的,还可以由用户预先在输入检索信息时,指定所需检索文档的类别等信息,此时,步骤205和步骤206之间还需要包括对得到的文档信息进一步通过类别等信息进行进一步筛选的步骤,这里不赘述。另外,在实际应用中,还可以根据用户的行为日志和电力主题词表的分词词库,对检索结果进行分析、挖掘,并结合分析结果对上述检索结果进行优化。例如,当用户输入“电力变压器”查询时,可以通过读取分词词库中的相关资料,得知单相变压器、地下变压器、分裂变压器、干式变压器、换流变压器、降压变压器、接地变压器、壳式变压器、联络变压器、配电变压器、气体绝缘变压器、牵引变压器、三绕组变压器、心式变压器、油浸变压器、整流变压器、自耦变压器、power transformers等相近电力专业词汇,然后分析用户行为日志库, 给出综合分析结果,结合该分析结果对上述检索结果进行优化,从而使得用户得到基于自身的行为日志、分词词库以及检索信息优化后的检索结果,从而使得最终返回给用户的文档更为符合用户的实际需求,具体的实现这里不赘述。步骤206 根据所述文档信息对应的文档与检索信息之间的关联度对所述检索信息对应的文档信息进行排序;本步骤的具体实现可以包括分别计算各个文档与检索信息之间的关联度;按照关联度的非升序顺序对所述文档信息进行排序。其中,文档与检索信息之间的关联度可以依据文档中出现检索信息中关键字的次数确定。步骤207 向用户显示排序后的文档信息。另外,当向用户显示了文档信息后,还可以进一步由用户启动二次检索,通过其他关键词对第一次输入的检索信息对应的文档信息进行进一步的限制,以得到理想的检索结果,进行二次检索的方法和前述的检索方法相似,区别仅在于,只需要对检索结果中得到的文档信息对应的文档进行检索即可。步骤208 根据用户的点击操作,从电力数据库中获取用户指示的文档信息对应的文档,将所述文档向用户展现。其中,可以通过新建新的页面,或者让用户进行下载,或者其他方式进行文档的展现,这里并不限制。与上述的检索方法相对应的,本发明实施例还提供一种基于云存储的电力信息检索系统,如图3所示,该系统可以包括建立单元310,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库;云存储系统320,用于对电力数据库以及索引数据库进行云存储;确定单元330,用于获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;查找单元340,用于从索引数据库中查找得到各个关键词对应的文档集合;处理单元350,用于根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;第一展现单元360,用于将所述文档信息向用户进行展现。优选地,如图3所示,该系统还可以包括第二展现单元370,用于根据用户的点击操作,从电力数据库中获取用户点击的文档信息对应的文档,将所述文档向用户展现。优选地,建立单元310可以包括分词子单元,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理;建立子单元,用于根据得到的分词结果确定每个词项所对应的、包含该词项的文档集合,以词项为主字段,建立所述索引数据库。优选地,如图3所示,该系统还可以包括排序单元380,用于对检索信息对应的文档信息,按照文档信息所对应文档与检索信息之间的关联度进行排序。图3所示的检索系统中,建立基于电力信息的电力数据库,根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述索引数据库存储于云存储系统中,从而后续用户可以输入由电力主题词表中的词项构成的检索信息,进行电力信息文档的检索,从而实现了专门针对电力信息的检索;而且,将电力数据库以及索引数据库存储于云存储系统中,从而可以提高对于电力信息的检索速度。本领域普通技术人员可以理解,实现上述实施例的方法的过程可以通过程序指令相关的硬件来完成,所述的程序可以存储于可读取存储介质中,该程序在执行时执行上述方法中的对应步骤。所述的存储介质可以如R0M/RAM、磁碟、光盘等。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
权利要求
1.一种基于云存储的电力信息检索方法,其特征在于,包括根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述电力数据库以及索引数据库存储于云存储系统中;获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;从索引数据库中查找得到各个关键词对应的文档集合;根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;将所述文档信息向用户进行展现。
2.根据权利要求1所述的方法,其特征在于,还包括根据用户的点击操作,从电力数据库中获取用户点击的文档信息对应的文档,将所述文档向用户展现。
3.根据权利要求1所述的方法,其特征在于,根据得到的分词结果建立索引数据库包括根据分词结果确定每个词项所对应的、包含该词项的文档集合,以词项为主字段,建立所述索引数据库。
4.根据权利要求1至3任一项所述的方法,其特征在于,还包括对检索信息对应的文档信息,按照文档信息所对应文档与检索信息之间的关联度进行排序;相应的,向用户进行展现的文档信息为排序后的文档信息。
5.一种基于云存储的电力信息检索系统,其特征在于,包括建立单元,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库;云存储系统,用于对电力数据库以及索引数据库进行云存储; 确定单元,用于获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;查找单元,用于从索引数据库中查找得到各个关键词对应的文档集合; 处理单元,用于根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;第一展现单元,用于将所述文档信息向用户进行展现。
6.根据权利要求5所述的系统,其特征在于,还包括第二展现单元,用于根据用户的点击操作,从电力数据库中获取用户点击的文档信息对应的文档,将所述文档向用户展现。
7.根据权利要求5所述的系统,其特征在于,建立单元包括分词子单元,用于根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理;建立子单元,用于根据得到的分词结果确定每个词项所对应的、包含该词项的文档集合,以词项为主字段,建立所述索引数据库。
8.根据权利要求5至7任一项所述的系统,其特征在于,还包括排序单元,用于对检索信息对应的文档信息,按照文档信息所对应文档与检索信息之间的关联度进行排序。
全文摘要
本发明公开了一种基于云存储的电力信息检索方法,包括根据预设的电力主题词表的分词词库对预设的电力数据库中的各个文档进行分词处理,根据得到的分词结果建立索引数据库,所述电力数据库以及索引数据库存储于云存储系统中;获取用户的检索信息,根据所述检索信息确定检索信息的关键词,以及关键词之间的逻辑关系;从索引数据库中查找得到各个关键词对应的文档集合;根据关键词之间的逻辑关系对所述文档集合进行处理,得到检索信息对应的文档信息;将所述文档信息向用户进行展现。还提供了一种基于云存储的电力信息检索系统,该方法及系统能够实现对于电力信息的检索,且提高了检索速度。
文档编号G06F17/30GK102156712SQ20111005439
公开日2011年8月17日 申请日期2011年3月8日 优先权日2011年3月8日
发明者吴凯峰, 吴铧明, 孙雪芬, 张 荣, 徐杰锋, 方东煦, 曹汝滨, 李云, 肖政 申请人:北京友友天宇系统技术有限公司, 北京天云融创科技有限公司, 国网信息通信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1