基于智能搜索的电网企业信息集成系统的快速检索方法

文档序号:6597732阅读:142来源:国知局
专利名称:基于智能搜索的电网企业信息集成系统的快速检索方法
技术领域
本发明涉及智能搜索方法,特别涉及一种在电网企业信息集成系统中以资源作为
最小展示单位,通过关键字匹配、报表信息关联和建立并优化索引等实现智能搜索,对电网 企业相关模型数据进行快速、准确定位的检索方法。
背景技术
目前,电网企业经过多年信息化建设,形成了多个相对独立的信息系统,各系统积
累了大量的业务数据,而众多业务处理系统相互独立,信息资源不能共享,这已成为电网企
业信息化建设进一步发展所面临的巨大挑战。集成信息平台的信息搜索技术为不同平台间
的数据访问提供了快速、有效的手段,而智能化的搜索技术是实现这一手段的关键。 关键节点信息的快速、准确定位对电网企业管理水平有重大影B向,以电网调度自
动化系统为例,随着电力系统的快速发展,互联电网规模越来越大,电网调度自动化系统所 包含的设备数量和数据大大增加,而计算机显示屏幕的限制不可能同时显示所有信息。与 此同时,电网的安全稳定运行需要电网调度专业人员及时掌握关键节点的运行状态等信 息,而传统的电网调度自动化系统在调度显示中通过鼠标逐层点击显示相关节点信息,由 此带来不便,花费时间长,影响系统的管理效率和电网的运行水平。因此,电网企业集成信 息系统迫切需要进行搜索技术的研究。 基于知识库系统的智能搜索引擎是一种高效搜索引擎技术,它将搜索引擎技术与 语言学相结合,从知识或概念层面分析用户的检索提问,实现搜索引擎对搜索词在语义层 次上的理解,经知识库使搜索词规范化和有序化后,再交给搜索引擎进行搜索。以自然语言 文字形式提出的搜索条件的处理,可以使得智能搜索引擎查询变得更为简单,易于操作,搜 索服务更具智能化和人性化。正因如此,作为新一代信息检索工具的智能搜索引擎凭着自 身的优点,被越来越多地应用到各个领域。 在电网企业集成信息化系统中,应用智能搜索技术对模型对象、集成数据,以及其 他资源提供统一、便捷的定位手段,能方便快速地搜索到统一信息平台的模型和运行数据。 而各系统中除模型和集成数据之外的重要信息,例如各业务系统中的各种应用界面及各种 报表等也是各级用户非常关心的,利用智能搜索技术也可以方便快捷地定位这些信息。电 网企业集成信息系统的模型对象和集成数据具有其独特的特点,互联网(Internet)上所 应用的智能搜索技术在此并不适用,需开发适于电网企业集成信息系统的智能搜索引擎。
有鉴于此,本发明旨在提供一种基于智能搜索技术的电网企业信息集成系统的快 速检索方法。

发明内容
本发明针对电网企业信息系统存在孤立系统间的数据访问等问题,提供一种基于 智能搜索技术的电网企业信息集成系统的快速检索方法。本发明的目的在于利用智能搜 索技术,通过提供多种检索方式和优化排序方法,从整合了大量电网生产或资产相关模型
4数据及运行数据的电网企业集成信息系统的海量信息中准确、快速地检索出用户想要的数
据,实现关键词搜索在1秒内返回搜索结果,从而提高电网的运行管理水平。 为了达到以上目的,本发明提出区分数据类型分别编制索引和制定采样更新频
率,采用分模块设计实现多种检索方式,采用关键词相关搜索技术提高输入效率,采用搜索
统计排序等方法实现检索信息的快速定位。 本发明的技术解决方案如下 —种基于智能搜索的电网企业信息集成系统的快速检索方法,包括以下步骤 步骤A :基于关键词使用搜索引擎全文搜索;中文分词算法为开源的mmseg4j中文
分词算法,词库为自带sogou词库; 所述步骤A中包括以下步骤 步骤A1 :用户输入关键词到关键词搜索页面; 步骤A2 :提交关键词搜索到检索器; 步骤A3 :检索器发送搜索索引到主数据索引; 步骤A4 :主数据索引发还搜索结果给用户; 步骤B :采用开源的中文分词算法和词库建立索引; 所述步骤B中包括以下步骤 步骤B1 :区分数据类型,对电网模型和资产模型核心数据的属性信息列出要被索 引的属性信息并全部建立索引、统一命名方式,而对量测数据量仅对量测类型元数据进行 索引; 步骤B2 :进行包括离线全局索引、在线索引、适时优化索引三个方面内容的索引 维护; 步骤C:提供关键词搜索输入框,根据输入的关键词对索引文件特定的数据属性 进行检索; 所述步骤C中包括以下步骤 步骤Cl :用户输入关键词,进行关键词搜索; 步骤C2 :提交关键词搜索到后台搜索引擎; 步骤C3 :后台搜索引擎发送搜索索引到主数据索引; 步骤C4 :主数据索引发还搜索结果给用户; 步骤C5 :用户获取相关搜索列表; 步骤C6 :用户获发送关键词到数据库进行搜索; 步骤C7 :检索相关搜索列表并加入该搜索索引; 步骤C8 :发送相关搜索列表到用户; 步骤D :分类目录检索可以实现常用信息的分类检索。 所述步骤A1之前还包括管理维护人员输入数据到数据库,数据库建立索引并发 送到索引器,索引器中建立主要数据索引。 所述步骤B2中,当建立在线索引计划任务时,通过配置运行周期来执行计划任 务,从而启动索引器去维护最新的索引,实现在线对数据进行实时索引; 当重建索引、优化索引时,与在线索引同时进行在线索引的拷贝,在拷贝的基础上 再重建或者优化,待重建索引或优化索引完毕后,再与在线索引合并。
所述步骤C中,搜索请求发送给后台搜索引擎之后,后台搜索引擎返回HTML格式
的搜索结果,为了以后方便地将统一信息平台信息搜索作为公共服务发布。 所述步骤C中,搜索结果分页展示,每一条目就是一个模型对象或者运行数据,每
一条目的链接指向该模型对象或运行数据的详细页面,并高亮显示搜索关键词。 所述步骤C中,用户在搜索框输入关键词时,能够根据常用应用需求和检索历史
统计数据在下拉框下边提示用户可能会搜索的关键词列表。 所述步骤C中,实现关键词拼音识别技术,在用户未切换输入法的情况下输入了拼音,要求能够在搜索框下给出相应的中文关键词提示功能。 所述步骤C中,每一次关键词搜索,如果搜索到信息后,将关键词发送到服务器后台,后台的相关搜索服务将会检索一个独立的相关搜索索引,初次访问如果这个索引不存在则建立这个索弓I ,并将该关键词加入索引。 所述步骤C中,每次关键词搜索,都会检索相关搜索索引,如果有相关的关键词,则会返回相关关键词列表,前台只要展示这个列表即可。 所述步骤C中,搜索统计在后台实现,在前台展示,以结合前面的相关搜索进行统一设计。 本发明由于采用了以上技术方案,使之与现有技术相比,本发明具有以下优点
1、本发明使用中文分词算法建立索引;区分数据类型,对电网模型和资产模型等核心数据的属性信息全部建立索引并统一命名方式,而对量测数据量仅对量测类型元数据进行索引;进行包括离线全局索引、在线索引、适时优化索引三个方面内容的索引维护。
2、本发明提供关键词搜索输入框,根据输入的关键词对索引文件特定的数据属性进行检索;进行服务器检索格式和返回展示格式的转换以提高检索效率,对搜索结果分页展示,并高亮显示搜索关键词;对输入的关键词进行智能识别、自动提示和拼音识别;采用自适应搜索结果排序算法;将相关搜索显示在搜索列表下方;进行搜索统计和排序。
3、本发明的分类目录检索可以实现常用信息的检索,如变电站、电厂、线路和运行数据,用户可以更加直观地检索数据。


图1为本发明的一种基于智能搜索技术的电网企业信息集成系统的快速检索方法的流程图。
图2为本发明中的基于关键词使用搜索引擎全文搜索的流程图。 图3为本发明中的根据输入的关键词对索引文件特定的数据属性进行检索的流程图。 图4为本发明中的基于关键词的全文搜索的示意图。
图5为本发明中的关键词搜索的示意图。
图6为本发明中以变电站为分类词的检索图。
具体实施例方式
下面结合附图和实施例对本发明作详细说明。 参看图1至图4,本发明的一种基于智能搜索技术的电网企业信息集成系统的快速检索方法,包括以下步骤 步骤A:基于关键词使用搜索引擎全文搜索。中文分词算法为开源的mmseg4j中文分词算法,词库为自带sogou词库。 所述步骤A中,如图2和图4所示,包括以下步骤
步骤Al :用户输入关键词到关键词搜索页面;
步骤A2 :提交关键词搜索到检索器;
步骤A3 :检索器发送搜索索引到主数据索引;
步骤A4 :主数据索引发还搜索结果给用户。 所述步骤A1之前还包括管理维护人员输入数据到数据库,数据库建立索引并发送到索引器,索引器中建立主要数据索引。
步骤B :采用开源的中文分词算法和词库建立索引。
所述步骤B中包括以下步骤 步骤B1 :区分数据类型,对电网模型和资产模型等核心数据的属性信息列出要被索引的属性信息并全部建立索引、统一命名方式,而对量测数据量仅对量测类型元数据进行索引; 步骤B2 :进行包括离线全局索引、在线索引、适时优化索引三个方面内容的索引维护。 当建立在线索引计划任务时,通过配置运行周期来执行计划任务,从而启动索引器去维护最新的索引,实现在线对数据进行索引,具备一定的实时性。 优化索引时不重建索引。当重建索弓l、优化索引时,可以与在线索引同时进行,但是,需要做一次在线索引的拷贝,在拷贝的基础上再重建或者优化;待重建索引或优化索引完毕后,再与在线索引合并,合并过程中,不允许在线索引写入。 步骤C:提供关键词搜索输入框,根据输入的关键词对索引文件特定的数据属性进行检索。
如图3所示,所述步骤C中包括以下步骤 步骤Cl :用户输入关键词,进行关键词搜索; 步骤C2 :提交关键词搜索到后台搜索引擎; 步骤C3 :后台搜索引擎发送搜索索引到主数据索引; 步骤C4 :主数据索引发还搜索结果给用户; 步骤C5 :用户获取相关搜索列表; 步骤C6 :用户获发送关键词到数据库进行搜索; 步骤C7 :检索相关搜索列表并加入该搜索索引; 步骤C8 :发送相关搜索列表到用户。 所述步骤C中,提供关键词搜索输入框,根据输入的关键词对索引文件特定的数据属性进行检索。搜索请求发送给服务器之后,服务器端返回HTML格式的搜索结果,为了以后方便地将统一信息平台信息搜索作为公共服务发布,特设计搜索引擎服务端返回json格式的结果,json的格式较为简便且比较通用,也方便以后作为服务提供给外部调用者,在搜索前台页面再将json格式转化为html展示。搜索结果分页展示,每一条目就是一个模型对象或者运行数据,每一条目的链接指向该模型对象或运行数据的详细页面,并高亮显
7示搜索关键词。 根据用户输入关键词进行智能识别,具体设计为以下几个关键技术来实现语义识别智能化 (1)实现可以配置同义词。如果配置了"机组"的同义词是"同步电机",当用户搜索"外高桥机组"时,搜索引擎除了会搜索机组相关的信息外,还会转换为"外高桥同步电机"去搜索信息。 (2)自动提示功能。用户在搜索框输入关键词时,能够根据常用应用需求和检索历史统计数据在下拉框下边提示用户可能会搜索的关键词列表。 (3)实现关键词拼音识别技术。在用户未切换输入法的情况下输入了拼音,要求能够在搜索框下给出相应的中文关键词提示功能。 为了得到更加准确的搜索结果,需要设计强大的结果排序算法对搜索结果进行优化排序,搜索结果最符合用户需求的排在最前面,可以考虑在索引建立时加入排序因子、配置索引各字段属性的比重和考虑热门搜索量等实现排序算法。 采用动态建立"相关搜索索引"的办法实现相关搜索,相关搜索显示在搜索列表下方,如用户搜索"徐行"之后,下边的相关搜索会显示"徐行主变"、"徐行主变有功"、"徐行线路"等相关搜索,其中"相关搜索索引"是独立的索引,与前面的信息搜索主索引没有任何关联。 每一次关键词搜索,如果搜索到信息后,将关键词发送到服务器后台,后台的相关搜索服务将会检索一个独立的"相关搜索索引",初次访问如果这个索引不存在则建立这个索引,并将该关键词加入索引。 每次关键词搜索,都会检索"相关搜索索引",如果有相关的关键词,则会返回相关关键词列表,前台只要展示这个列表即可。 搜索统计排名,搜索统计在后台实现,在前台展示,可以结合前面的相关搜索进行统一设计。关键词搜索的示意图参看图5所示。 步骤D :分类目录检索可以实现常用信息的分类检索。如变电站、电厂、线路和运行数据,用户可以更加直观地检索数据。参看图6,图示为以变电站为分类词的检索图。
综上所述,本发明使用中文分词算法建立索引;区分数据类型,对电网模型和资产模型等核心数据的属性信息全部建立索引并统一命名方式,而对量测数据量仅对量测类型元数据进行索引;进行包括离线全局索引、在线索引、适时优化索引三个方面内容的索引维护。本发明提供关键词搜索输入框,根据输入的关键词对索引文件特定的数据属性进行检索;进行服务器检索格式和返回展示格式的转换以提高检索效率,对搜索结果分页展示,并高亮显示搜索关键词;对输入的关键词进行智能识别、自动提示和拼音识别;采用自适应搜索结果排序算法;将相关搜索显示在搜索列表下方;进行搜索统计和排序。本发明的分类目录检索可以实现常用信息的检索,如变电站、电厂、线路和运行数据,用户可以更加直观地检索数据。 当然,本技术领域内的一般技术人员应当认识到,上述实施例仅是用来说明本发明,而并非用作对本发明的限定,只要在本发明的实质精神范围内,对上述实施例的变化、变型等都将落在本发明权利要求的范围内。
权利要求
一种基于智能搜索的电网企业信息集成系统的快速检索方法,其特征在于,包括以下步骤步骤A基于关键词使用搜索引擎全文搜索;中文分词算法为开源的mmseg4j中文分词算法,词库为自带sogou词库;所述步骤A中包括以下步骤步骤A1用户输入关键词到关键词搜索页面;步骤A2提交关键词搜索到检索器;步骤A3检索器发送搜索索引到主数据索引;步骤A4主数据索引发还搜索结果给用户;步骤B采用开源的中文分词算法和词库建立索引;所述步骤B中包括以下步骤步骤B1区分数据类型,对电网模型和资产模型核心数据的属性信息列出要被索引的属性信息并全部建立索引、统一命名方式,而对量测数据量仅对量测类型元数据进行索引;步骤B2进行包括离线全局索引、在线索引、适时优化索引三个方面内容的索引维护;步骤C提供关键词搜索输入框,根据输入的关键词对索引文件特定的数据属性进行检索;所述步骤C中包括以下步骤步骤C1用户输入关键词,进行关键词搜索;步骤C2提交关键词搜索到后台搜索引擎;步骤C3后台搜索引擎发送搜索索引到主数据索引;步骤C4主数据索引发还搜索结果给用户;步骤C5用户获取相关搜索列表;步骤C6用户获发送关键词到数据库进行搜索;步骤C7检索相关搜索列表并加入该搜索索引;步骤C8发送相关搜索列表到用户;步骤D分类目录检索可以实现常用信息的分类检索。
2. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其 特征在于,所述步骤A1之前还包括管理维护人员输入数据到数据库,数据库建立索引并 发送到索引器,索引器中建立主要数据索引。
3. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其特征在于,所述步骤B2中,当建立在线索引计划任务时,通过配置运行周期来执行计划任 务,从而启动索引器去维护最新的索引,实现在线对数据进行实时索引;当重建索引、优化索引时,与在线索引同时进行在线索引的拷贝,在拷贝的基础上再重 建或者优化,待重建索引或优化索引完毕后,再与在线索引合并。
4. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其 特征在于,所述步骤C中,搜索请求发送给后台搜索引擎之后,后台搜索引擎返回HTML格式 的搜索结果,为了以后方便地将统一信息平台信息搜索作为公共服务发布。
5. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其特征在于,所述步骤C中,搜索结果分页展示,每一条目就是一个模型对象或者运行数据, 每一条目的链接指向该模型对象或运行数据的详细页面,并高亮显示搜索关键词。
6. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其 特征在于,所述步骤C中,用户在搜索框输入关键词时,能够根据常用应用需求和检索历史 统计数据在下拉框下边提示用户可能会搜索的关键词列表。
7. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其 特征在于,所述步骤C中,实现关键词拼音识别技术,在用户未切换输入法的情况下输入了 拼音,要求能够在搜索框下给出相应的中文关键词提示功能。
8. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其 特征在于,所述步骤C中,每一次关键词搜索,如果搜索到信息后,将关键词发送到服务器 后台,后台的相关搜索服务将会检索一个独立的相关搜索索引,初次访问如果这个索引不 存在则建立这个索引,并将该关键词加入索引。
9. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法,其 特征在于,所述步骤C中,每次关键词搜索,都会检索相关搜索索引,如果有相关的关键词, 则会返回相关关键词列表,前台只要展示这个列表即可。
10. 根据权利要求1所述的基于智能搜索的电网企业信息集成系统的快速检索方法, 其特征在于,所述步骤C中,搜索统计在后台实现,在前台展示,以结合前面的相关搜索进 行统一设计。
全文摘要
本发明涉及一种基于智能搜索的电网企业信息集成系统的快速检索方法,包括以下步骤A基于关键词使用搜索引擎全文搜索。B采用开源的中文分词算法和词库建立索引;区分数据类型,对电网模型和资产模型核心数据的属性信息列出要被索引的属性信息并全部建立索引、统一命名方式,而对量测数据量仅对量测类型元数据进行索引;进行包括离线全局索引、在线索引、适时优化索引三个方面内容的索引维护;C提供关键词搜索输入框,根据输入的关键词对索引文件特定的数据属性进行检索。D分类目录检索可以实现常用信息的分类检索。本发明的分类目录检索可以实现常用信息的检索,如变电站、电厂、线路和运行数据,用户可以更加直观地检索数据。
文档编号G06F17/30GK101789006SQ20101010261
公开日2010年7月28日 申请日期2010年1月29日 优先权日2010年1月29日
发明者吴湘, 吴超, 徐尧强, 施绮, 朱爱玲, 李 灿, 陈琰, 马欢 申请人:华东电网有限公司;上海东云信息技术发展有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1