基于能力匹配和本体推理的开放地理信息服务发现方法

文档序号:6586800阅读:202来源:国知局
专利名称:基于能力匹配和本体推理的开放地理信息服务发现方法
技术领域
本发明涉及地理信息服务技术领域,尤其涉及一种基于能力匹配和本体推理的开
放地理信息服务发现方法。
背景技术
网络信息检索技术在生活中扮演者重要的角色,如百度、谷歌等,地理空间信息服务所扮演的角色也越来越重要,如在电子地图方面,有google map、 virtual map、百度地图、图行天下、搜狗地图等,它们能提供地图搜索、公交乘换、公交路线、自驾出行等功能,给人们的生活带来极大的方便。 为了实现地理空间信息的共享与互操作,开放地球空间信息联盟(0GC)开发了一系列空间数据服务规范,主要包含Web地图服务(丽S) 、 Web要素服务(WFS) 、 Web覆盖服务(WCS)和传感器观测服务(SOS),允许用户在万维网中通过标准的接口访问和操作地球空间信息。 目前的信息检索分为三个层次,即语形搜索、语义搜索和语用搜索。语形搜索是用户需求表达在语言表面上的意思,如传统的关键字搜索。语义搜索是通过本体论挖掘,在元数据结构层面上,解决对"模拟"的语言编码解码的问题,同时通过分词技术和语料库积累,解决关键字与文本的匹配问题。语用搜索是指用户表达意义的上下文环境,这是第三代搜索引擎的理念,智能化、个性化都要建立在这个基础之上。其中前者比较成熟,后两者需要结合行业的特点和用户的需求,目前还处于实验探索阶段。语形搜索,如雅虎、微软的搜索,不必要地扩大了搜索范围,出现过量无用信息的情况,增加了决策成本。在现阶段,语形搜索只适合与大众媒体型广告结合,而不适合与特定领域结合。第二个层次是语义搜索,如Google等,其关键是采用0ntology。第三个层次是语用搜索,雅虎、Google都在积极努力地进化到这个阶段。语用搜索是个性化定制搜索引擎,一旦实现了语用级搜索,就可以实现一对一的信息发布和一对一的信息定制。 WWW上存在大量的0WS服务信息,例如采用"丽S"关键字搜索,Baidu、 Yahoo和Google分别有266000、252000和4520000相关页面连接,这些连接包含丽S服务的地址、文章、新闻、规范等信息。虽然目前有一些地理空间范围或地名敏感的空间搜索引擎(参见文献1),但提取有效的0WS服务连接信息仍然是一个挑战。 在信息技术领域,本体被认为是"概念的规范化"。本体论应用在信息检索中的著名项目包括(onto)2Ageni、 Ontobroker和SKC。 (onto)2Ageni的目的是为了帮助用户检索到所需要的WWW上已有的本体论,主要采用了参照本体论。参照本体论是以WWW上已有的本体论为对象建立起来的本体论,它保存有各类本体论的元数据。Ontobroker面向的是WWW上的网页资源,目的是为用户检索到所需要的网页,这些网页含有用户所关心的内容。SKC目标是解决信息系统语义异构的问题,实现异构的自治系统之间的互操作。
为了描述数据集和科学概念的语义,美国和欧洲开展了多个地学本体项目的研究。如美国NASA的地球和环境术语语义WEB (SWEET)和NGA的基于语义WEB的地学知识发现。SWEET采用OWL语言进行本体建模,涉及地球系统科学及相关领域的几千个术语(例如NASA的全球变化主目录GCMD、地球系统建模语言ESML、地球系统建模框架ESMF、网格计算和开放地理信息联盟所包含术语),它提供了地球系统科学高层次语义描述;地理信息元数据本体项目遵循ISO 19115和FGDC元数据标准,对数据提供者、观测仪器、传感器和数据体本身及之间联系增加了语义描述信息,便于对数据集统一理解;基于语义WEB的地学知识发现,在SWEET基础上发展了地球空间数据挖掘本体。然而适合于0GC服务的本体定义还较少。 语义网络服务(Semantic Web Service, SWS)使用语义网提供的语义表达手段来描述网络服务,从而实现网络服务的智能化。SWS主要关注服务发现,调解,组合,执行,评估和有效判断等。语义网络服务的研究产生了网络服务本体(Web Ontology LanguageforServices, OWL-S)来描述网络服务的本体。语义web技术提供了网络环境下空间信息管理和地学知识发现的新视角,而服务本体建模与推理是语义Web开发关键环节。使用本体来描述空间信息服务的语义以实现空间信息服务的智能化,如Raluca研究了满足地理空间网络服务的语义执行。当前对空间信息服务的语义描述大多以OWL-S描述,陈建杰等提出了基于语义的空间信息web服务框架(参见文献2),乐鹏等研究了 OGC标准兼容的地理空间网络服务链OWL-S描述到BPEL描述的自动转化(参见文献3)。 空间数据搜索目前还主要采用地理范围或地名数据库匹配的方式,并且只对连接中的HTML页面内容敏感,对连接中的空间信息服务及其能力的XML内容不敏感。例如"CIHU"空间数据隐形搜索引擎(参见文献4),使用地名从WWW页面中获得地图服务器中提供的相应区域的栅格地图;Google展示了在美国境内使用地名匹配技术获得相应区域的地图。 文献1 :白玉琪,杨崇俊.空间信息搜索引擎研究[J].中国矿业大学学报,2004,(1); 文献2 :陈建杰,杨树锋,李长江,一种基于本体的空间信息Web服务实现方法[J].浙江大学学报(工学版),2006, (3); 文献3:Yue Peng, Gong Jianya, Di Liping, 2008. Automatic transformationfrom semanticdescription to syntactic specification for geo_processing servicechains, Web and WirelessGeographical Information Systems—8th InternationalSymposium, V5373 LNCS, pp50_62,2008 ; 文献4 :张建兵,杨崇俊,.海量空间信息隐形搜索的研究[J].计算机工程,2006,(22)。

发明内容
本发明的目的是提供一种语义化的高精度、高效率地发现开放地理信息服务方法。 为达到上述目的,本发明采用如下的技术方案 任意设定分布式地理信息服务数据源,指定Internet上分布的各种地理信息服务; 使用开放地理信息服务搜索引擎进行搜索,进一步包括页面爬行、OWS查询、页面分析、连接探测、连接合成和记录生成六个子步骤; 使用0WS服务本体实例生成器生成0WL-S本体实例和OWL-S本体实例注册;
使用基于语义的多协议OWS客户端进行搜索查询,进一步包括解析客户端请求、推理查询、查询结果返回和可视化三个子步骤。 依据OWL-S类、0WS能力Schema、OWS和OWL-S映射关系建立OWS到OWL-S的转换样式表OWL-S. xsl ; 根据OWS链接得到OWS能力信息; 使用OWL-S. xsl将OWS能力信息转换成OWL-S的实例。 得到OWL-S到ebRM的模型映射; 将OWL-S以映射模型CSW的标准接口存储到CSW中。 所述推理查询子步骤依据客户端的请求分为写推理规则、创建Model 、读数据、绑定推理器、得到In预odel和得到查询结果六个子步骤。
本发明具有以下优点和积极效果 1)灵活的部署,搜索引擎采用面向服务的体系来包装爬行、探测、匹配的过程,有利于服务的集群; 2)更高的OWS服务发现精度,实验表明服务链接命中率"Detect"方法是"Crawl"方法的10倍,达到40%,如图6,图7 ; 3)更好的OWS服务发现效率,实验表明有效服务链接命中平均响应时间"Detect"方法是"Crawl"方法的0. 44倍,达到39秒获得一个有效的服务链接,如图8,图9 ;
4)实现了从语法搜索到语义搜索的转变。


图1是本发明提供的基于能力匹配和本体推理的开放地理信息服务发现方法的流程图。 图2是本发明提供的基于能力匹配和本体推理的开放地理信息服务发现方法的关系图。 图3是本发明的OWS服务发现详细步骤图。 图4是本发明的OWS服务到OWL-S实例自动建立流程图。 图5是本发明的推理查询步骤图。 图6是本发明的OWS的丽S服务实例探测深度和探测结果图。 图7是本发明的OWS的丽S服务实例探测深度和探测精度图。 图8是本发明的OWS的丽S服务实例爬行和探测执行时间图。 图9是本发明的OWS的丽S服务实例不同结果的探测执行时间图。
具体实施例方式
OGC开放地理信息服务规范制定了地理信息服务的标准规范,实现了它们的共享与互操作,本体是共享概念模型的形式化规范说明,所以,以本体的形式形式化OGC开发地理信息服务是可行的,能力匹配和二次探测去掉无效的地理信息服务链接,得到有效的地理信息链接,再通过本体推理,得到类之间的直接关系和间接关系,所以精度得到提高。
下面以具体实施并结合附图对本发明作进一步说明 本发明提供的基于能力匹配和本体推理的开放地理信息服务发现方法,采用如下的技术方案,参见图1 : 步骤SI :任意设定分布式地理信息服务数据源,指定Internet上分布的各种地理信息服务; 分布式地理信息服务数据源包含了因特网中未知的大量地理信息服务(例如丽S、WFS、WCS和SOS)相关的页面,只要给定数据源的根URL就可以通过搜索引擎得到这些数据源Sll。 步骤S2 :使用开放地理信息服务搜索引擎进行搜索,它包括页面爬行、OWS查询、页面分析、连接探测、连接合成和记录生成六个子步骤; 下面结合图2-3详细描述页面爬行、OWS查询、页面分析、连接探测、连接合成和记录生成六个子步骤 爬行子步骤所示的S22, S17,使用OWS搜索引擎爬行步骤SI给定的分布式地理信息服务数据源的链接S21,抓取页面内容,建立索引,并生成链接的URL数据库S23 ;
OWS查询子步骤如S24,使用OWS关键字(如丽S的"丽S"和"Web M即Service",WFS的"WFS"和"Web Map Service"等等)对爬行子步骤建立的索引进行查询,获得潜在的OWS链接库S25 ; 页面分析子步骤如S26,潜在的OWS链接库中可能还有一些包含OWS关键字的链接。使用HTML解析器,对潜在链接页面内容进行全文检索,发现并存储这些含有OWS关键字的链接到潜在的OWS链接库中S27 ; 连接探测子步骤如S28, S18,根据潜在的OWS链接构造标准的OWS的"GetCapabilities"操作请求,并且通过HTTP Get或Post方法获得操作的响应,如果响应结构是XML文档,并且包含有Capabilities元素,则就可以获得OWS服务的连接和元数据S13 ; 连接合成子步骤如S29,探测子步骤得到的链接可能重复,合并重复链接,可以获得唯一的OWS列表; 记录生成子步骤如S30,每个OWS服务的能力生成一个记录S13。 步骤S3 :使用OWS服务本体实例生成器生成OWL-S本体实例和OWL-S本体实例注
册; OWL-S本体实例生成子步骤如S14,图4,首先依据OWL-S类,OWS能力Schema,和OWS和OWL-S映射关系建立OWS到OWL-S的转换样式表OWL-S. xsl,接着根据OWS链接得到OWS能力信息,然后使用OWL-S. xsl将OWS能力信息转换成OWL-S的实例;
OWL-S本体实例注册子步骤S15,使用基于ebRM的目录服务实现规范(CSW)对OWL-S本体实例注册,其步骤是首先得到OWL-S到ebRM的模型映射,再将OWL-S以映射模型CSW的标准接口存储到CSW中。 步骤S4 :使用基于语义的多协议OWS客户端进行搜索查询,包括解析客户端请求、推理查询、查询结果返回和可视化三个子步骤; 解析客户端请求子步骤客户端是一个可视化表单界面,用户在表单中输入请求条件即可。请求条件包括服务的类别、空间范围和名称等。通过获取表单信息得到请求条件参数; 推理查询子步骤如图5,依据客户端的请求得到结果查询结果分六小步,即写推 理规则,创建Model,读数据,绑定推理器,得到In预odel和得到查询结果。其中,推理规则 如下Rule a至Rule e。 Rule a :创建"Prof ile"禾口 "categoryName"的关系 〃[rl : ( a http://www.daml.Org/services/owl_s/l.l/Profile. owl#serviceCategory 7 b) ( 7 bhttp://www. daml. org/services/owl_s/l. 1/Profile. owl#categoryNamec)_>( ahttp://swe. whu. edu. cn/ows. owl#tl c)] 〃 ;
Rule b :仓寸建"Profile"禾口 "Thing"的关系 〃[rl : ( a http://www.daml.0rg/services/owl_s/l.l/Profile. owl#serviceParameter 7 c) ( 7 chttp://www. daml. org/services/owl_s/l. 1/Profile. owl#sParameterd)_>( dhttp://swe. whu. edu. cn/ows. owl#tl b)] 〃 ;
Rule c :创建"Layer", "feature"禾口 "Coverage"至lj "BBox"的关系
〃 [rl :( a http://swe.whu.edu.en/ows.owl#hasBBox b)_>( ahttp://swe. whu. edu. cn/ows. owl#tl b)]〃 ; Rule d :仓寸建/人"Layer", "feature"禾口 "Coverage"至lj "title"的关系
〃 [rl : ( a http://swe.whu.edu.en/ows.owl#title b)_>( a http://swe. whu. edu. cn/ ows. owl#tl b)]〃 ; Rule e :仓寸建"categoryName"禾口 "Thing"的关系 〃 [rl http:,
b) ( b http:, http:, d)( d
http: e_> ( c http:,
(7 a
/www. daml. org/services/owl_s/l. 1/Profile. owl#serviceParameter ww. daml. org/services/owl_s/l. 1/Profile. owl#sParameter c) (ww. daml. org/services/owl_s/l. 1/Profile. owl#serviceCategory /www. daml. org/services/owl_s/l. 1/Profile. owl#categoryName
swe. whu. edu. cn/ows. owl#tl e)) 〃 ;
查询结果返回和可视化子步骤推理查询得到满足条件服务的链接。根据链接和 请求参数可以对数据进行可视化。
附图6-9给出了本发明的执行结果图。
权利要求
一种基于能力匹配和本体推理的开放地理信息服务发现方法,其特征在于,包括以下步骤任意设定分布式地理信息服务数据源,指定Internet上分布的各种地理信息服务;使用开放地理信息服务搜索引擎进行搜索,进一步包括页面爬行、OWS查询、页面分析、连接探测、连接合成和记录生成六个子步骤;使用OWS服务本体实例生成器生成OWL-S本体实例和OWL-S本体实例注册;使用基于语义的多协议OWS客户端进行搜索查询,进一步包括解析客户端请求、推理查询、查询结果返回和可视化三个子步骤。
2. 根据权利要求1所述的基于能力匹配和本体推理的开放地理信息服务发现方法,其特征在于,所述生成OWL-S本体实例进一步包括以下子步骤依据OWL-S类、0WS能力Schema、0WS和0WL-S映射关系建立OWS到OWL-S的转换样式 表OWL-S. xsl ;根据OWS链接得到OWS能力信息;使用OWL-S. xsl将OWS能力信息转换成OWL-S的实例。
3. 根据权利要求1或2所述的基于能力匹配和本体推理的开放地理信息服务发现方 法,其特征在于,所述OWL-S本体实例注册进一步包括以下子步骤得到OWL-S到ebRM的模型映射;将OWL-S以映射模型CSW的标准接口存储到CSW中。
4. 根据权利要求1所述的基于能力匹配和本体推理的开放地理信息服务发现方法,其 特征在于所述推理查询子步骤依据客户端的请求分为写推理规则、创建Model、读数据、绑定推 理器、得到In预odel和得到查询结果六个子步骤。
全文摘要
本发明涉及地理信息服务技术领域,尤其涉及一种基于能力匹配和本体推理的开放地理信息服务发现方法。本发明包括设定分布式地理信息服务数据源,使用OWS搜索引擎进行搜索,使用OWS服务本体实例生成器生成OWL-S本体实例和注册,使用基于语义的多协议OWS客户端进行搜索查询。本发明较传统搜索引擎提高了开放地理信息服务发现精度和效率,实现了从语法搜索到语义搜索的转变,证明它是开放地理信息服务高精度、高效率发现和语义化比较实用可靠的方法。
文档编号G06F17/30GK101706824SQ20091027294
公开日2010年5月12日 申请日期2009年11月27日 优先权日2009年11月27日
发明者何杰, 陈泽强, 陈能成 申请人:武汉大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1