一种基于领域知识的古建筑保护技术信息管理系统及方法

文档序号:6618985阅读:279来源:国知局
专利名称:一种基于领域知识的古建筑保护技术信息管理系统及方法
技术领域
本发明属于古建筑保护领域,具体的涉及一种为古建筑保护技术信息系统,基于
领域知识的古建筑保护技术信息管理的方法和系统。
背景技术
古建筑是全人类的文化依存,历史遗留下来的宝贵财富,是历史痕迹中各种物质、 非物质因素的重要载体,对我们认识历史、认识前人的轨迹有着无比重要的价值,就是在当 代社会,其在历史、文化、艺术、科学、宗教等领域和这些领域内派生出来的旅游、品牌、经济 方面都蕴含着突出的普遍价值。当作为城市一部分的古建筑,他们是城市的凝固,是一座城 市区别于其他城市的标志性符号,是地域文化的代表,是城市的灵魂。 面对经济的发展,古建筑的使用和开发在经济利益的驱动下,范围不段扩大,古建 筑的可持续性使用遭受着严峻的挑战。古建筑在使用过程中的保护问题显得越发突出。尤 其在我国,人口众多,古建筑又多为木质结构,不易保护,更加增加了保护和修复的难度和责任。 随着信息技术的发展,特别是网络技术和大规模知识处理技术的迅猛发展,为古 建筑保护提供了有利的技术和工具支持。 近年来,随着文化保护领域多个信息化项目的启动,信息技术对于古建保护领域 的重要作用得到业界的认可。数字近景测量技术、激光三维扫描测量和虚拟现实技术的发 展也为在不接触文物的前提下,实现了古建筑的测量、数字化保护和复原;网上博物馆的建 立等有效的增加了我国古建筑的展出频次,取得了良好的文化传播效果。同时这些项目,也 带来了大量的数据库,积累了 T数量级的数据信息。 但是,当前在古建筑领域开展的信息化工作中,尚未体现出数据之间的关联性和 背后隐含的知识内容。具体的使用者经常面对"数据很多,知识很少"的困局。面对海量 信息,文物保护工作迫切需要知识的支撑。知识的内涵体现在语义方面,有多种表现形式, 即声音、图像、视频、文字等,知识的传播形式可借助于Web和TCP/IP技术。因此,未来是 K0D (Knowledge On Demand)的模式,即"任何人在任何时间,从任何地点,都可以获取任何 模式的知识。"知识管理已经成为信息技术智能化发展的一个重要方向,是目前科研人员普 遍接受的处理海量数据的方法之一。

发明内容
为充分发挥信息技术在古建筑保护领域的强大作用,解决目前"海量数据,知识匮 乏"、海量数据的使用率偏低的使用困局,进一步挖掘和使用古建保护领域中相关知识,促 进古建筑保护知识的研究,利用知识管理技术,整理古建筑保护领域的各种知识,本发明提 出了一种基于领域知识的古建筑保护技术信息管理系统及方法。 为了达成所述目的,本发明一方面提出了基于领域知识的古建筑保护技术信息管 理系统,其技术方案如下
具有古建筑保护知识库与古建筑保护知识库管理平台连接,用于存储能够为古建 筑保护信息提供语义分类标准的古建筑保护知识,限定古建筑保护领域的专业术语、描述 专业术语之间的关系,提供逻辑推理功能;古建筑保护知识管理平台与古建筑保护知识库 之间可以是C/S结构或者是B/S结构; 古建筑保护知识管理平台与知识工程师连接,为知识工程师提供管理古建筑保护
知识库的工作平台,除知识工程师通过古建筑保护知识库管理平台对古建筑保护知识库内
的内容进行修改外,其他人员和单元均不能对古建筑保护知识库的内容进行更改; 数据管理单元与古建筑保护数据库双向数据连通,数据索引单元和古建筑保护知
识库对数据管理单元和古建筑保护数据库之间的数据交换起到辅助作用;数据管理单元只
能改变古建筑保护数据库中的内容,不能改变古建筑保护知识库、数据索引单元以及其他
部分的内容,数据管理单元利用数据索引单元中的双数据索引为古建筑保护工作者提供古
建筑信息语义查询功能;同时,数据管理单元向古建筑保护数据库发送古建筑保护工作者
的查询信息、管理指令和上传的结构化非结构化数据; 古建筑保护工作者与数据管理单元连接,对与古建筑保护相关的数字信息进行分 类,经过语义标注后将数据上传至古建筑保护数据库;古建筑保护工作者通过数据管理单 元增删修改古建筑保护相关的数字信息; 对外知识服务单元与含有古建筑保护知识库、数据索引单元和古建筑保护数据库 的知识数据库单元相连,以WebService的形式对外提供分布式知识、数据查询服务,接收 普通使用者的查询请求,从古建筑保护知识库、数据索引单元和古建筑保护数据库中获得 数据和知识,返回给普通使用者;对外知识服务单元不能修改古建筑保护数据库、古建筑保 护知识库、数据索引单元中的内容。 优选地,所述数据索引单元与古建筑保护知识库和古建筑保护数据库相连,对古 建筑保护工作者上传的古建筑保护数字化信息利用古建筑保护知识库提供的领域知识形 成双数据索引。 优选地,所述古建筑保护数据库含有相互独立的古建筑结构化信息数据库、古建 筑保护非结构化信息数据库和古建筑保护结构重建信息数据库;通过古建筑保护知识库将 古建筑结构化信息数据库、古建筑保护非结构化信息数据库和古建筑保护结构重建信息数 据库相互关联;由古建筑保护知识库为古建筑结构化信息数据库、古建筑保护非结构化信 息数据库和古建筑保护结构重建信息数据库提供语义标签索引,语义标签决定了古建筑结 构化信息数据库、古建筑保护非结构化信息数据库和古建筑保护结构重建信息数据库中的 数据的分类;利用古建筑保护知识库提供的语义标签与语义分类,以及古建筑保护非结构 化信息数据库提供的数据,经过倒排序和语义标签关联,形成语义索引,存储在数据索引单 元中; 古建筑结构化信息数据库用于存储与古建筑保护知识库中存储的具体古建筑单 体相关的古建筑保护数值数据,其中至少包括残损勘察信息; 古建筑非结构化信息数据库,用于存放与建筑保护知识库中古建筑保护相关的文 字、图片、音视频等各种电子化数据文件;其中,存储的数据文件按照古建筑保护知识库中 对古建保 领域的知识表示进行分类,每个数据文件都拥有语义标签;为数据索引单元提 供倒排序所需要的数据信息;
古建筑保护三维结构信息数据库,用于存放古建筑保护知识库中所涉及的古建筑单体的三维结构信息。 优选地,所述双数据索引包括关键字倒排序索引和语义标签分类索引两部分;将古建筑保护非结构化数据库中的全部电子资源得到文字信息进行关键字倒排序,形成关键字倒排序索引;同时根据古建筑保护工作人员利用数据管理单元管理古建筑保护非结构化数据时形成的语义标签,根据古建筑保护知识库标注的信息所属类别进行聚类,形成以语义标签和语义类别为索引的语义标签分类索引。 优选地,所述以WebService的形式对外提供分布式知识、数据查询服务,这些服务具体包括由关键词查找相关知识节点的服务、由属性查询知识节点或概念的服务、知识节点的路径查询服务、知识节点的父节点查询服务、知识节点的兄弟节点查询服务、知识节点成员子节点查询服务、知识节点父子关系子节点查询服务、知识节点的所有属性查询服务、知识节点的特定属性查询服务、知识节点的资料查询服务、特定类型的资料查询服务。
为了达成所述目的,本发明第二方面,提出基于领域知识的古建筑保护技术信息管理方法,该信息管理方法包括步骤如下 步骤Sl :知识工程师在分析古建筑保护技术领域所涉及的基本概念和相关词汇、概念之间的组成、继承关系、概念的属性关系后,以通用术语(通用概念)为基础,利用古建筑保护知识库管理平台构建领域术语(ontology),形成领域知识分类依据;
步骤S2 :古建筑保护工作者通过数据管理单元管理古建筑保护相关的信息数据,包括对数据上传、查询、删除和修改; 步骤S3 :数据索引单元定期根据古建筑保护知识库和古建筑保护数据库的数据编制关键字倒排序索引和语义标签分类索引,同时为古建筑保护工作人员通过数据管理单元查询古建筑保护知识和信息数据的操作提供索引; 步骤S4 :古建筑保护知识和信息的普通用户通过对外展示服务单元检索古建筑
保护知识和相关信息数据。
优选地,该数据上传的具体步骤为 从古建筑保护知识库获得古建筑保护领域知识库领域知识分类知识树,浏览分类情况; 步骤a):选择或检索所需要管理的信息数据在知识树上所属的类别或古建筑单体名称; 步骤b):判断是否为结构化数据,如果是非结构化数据,则依据所选的古建筑在古建筑保护知识库中的结构化数据填写结构化数据表格,上载结构化数据到古建筑保护数据库;如果不是非结构化数据,填写、删除或修改非结构化数据的基本信息、非结构化数据的文件类型,经过为非结构化数据增加、输出或重新生成语义标签后,在古建筑保护数据库中更新非结构化数据、基本信息和语义标签; 步骤c):如果是古建筑单体所有的结构化数据,则按照古建筑保护知识库中存储的古建筑单体的结构化数据表格依次填写,填写完毕后,在古建筑保护数据库中更新古建筑单体相关的结构化数据。 优选地,所述生成语义标签可以分为手工、半手工和自动三种类型;其中( — )手工生成语义标签是古建筑保护工作者人工选择待管理相关文件所属的
7类别,根据文件内容填写语义标签;之后,数据管理单元2将文件和其所属于类别以及语义标签同时存储到古建筑保护非结构化信息数据库中;[OO33] ( 二 )自动生成语义标签是 步骤S31 :对拟操作的古建筑保护相关文件进行文字抽取,获取其中含有的文字信息; 步骤S32 :对中文进行分词,获得词汇,去除停止词之后,将具有实体意义的词汇转换成为概念映射; 步骤S33 :以古建筑保护知识库5中对古建筑信息所划分类别为依据,对该文件进行文本分类; 步骤S34 :将分类的文本与所属类别关联存储,完成"划分语义类别"操作,提取对该文件中所含的关键概念,完成"提取语义标签"的操作; 步骤S35 :将所获得的语义类别和语义标签合并去重作为最终结果,在古建筑保护非结构化数据库中更新拟操作的古建筑保护相关文件、所属于的语义类别和语义标签;
半手工生成语义标签是执行自动生成语义标签的方法中的步骤S31、 S32、 S33和S34后,获得拟操作的古建筑保护信息所属类别和语义标签,在经过步骤S35人工修正之后,在古建筑保护非结构化数据库中更新拟操作的古建筑保护相关文件、所属于的语义类别和语义标签。 本发明的有益效果本发明提出的将知识管理引入到古建筑保护领域的系统和方法,可以有效的提高数据的使用率,挖掘数据内部蕴含的各种隐含知识,能够帮助解决古建筑保护技术及传统工艺急需解决的难点、热点和瓶颈问题,提高古代建筑保护和文物保护信息化的技术水平和能力,形成具有中国特色的古代建筑保护技术体系,从而推动我国古代建筑及其它文物保护领域的技术发展带来更丰厚的经济回报。 在知识经济迅猛发展的背景下,本发明将有助于将古代文化遗产保护工作带入以网络互动、知识服务为主要手段的全新发展阶段。由本发明所涉及的古建筑保护知识体系和服务可以衍生出如网上古建筑知识浏览、古建筑网络博物馆等多种电子产品,同时经过文物展品的数字化之后,可以使文物脱离文物本体,进而减少对文物本体的使用,提高文物展出频率,也有利于减少对文物的损耗;具有巨大的经济效益。同时,在基于领域知识的古建筑保护技术信息管理系统的基础上,可以建立古建筑保护知识网络课堂教育、网上古建筑文化和知识浏览、古建筑知识检索与服务等相应的应用,有利于加强大众对古建筑的保护意识,增强对古建筑文物专家提供知识服务的能力,具有巨大的社会效益。总起来说,本发明不仅具有良好的经济前景,更加具有良好的社会效益。


图1是一种基于领域知识的古建筑保护技术信息管理系统的结构示意图; 图2是一种基于领域知识的古建筑保护技术信息管理系统的古建筑保护数据库
结构示意图; 图3是一种基于领域知识的古建筑保护技术信息管理方法的数据上传方法流程图; 图4是一种基于领域知识的古建筑保护技术信息管理方法的非结构化信息自动和半自动生成语义标签的方法流程图; 图5是一种基于领域知识的古建筑保护技术信息管理系统的古建筑保护知识库结构示意图; 图6是一种基于领域知识的古建筑保护技术信息管理系统的古建筑保护知识库中知识树的组成示意图; 图7是一种基于领域知识的古建筑保护技术信息管理系统的结构化数据存储结构示意图; 图8是一种基于领域知识的古建筑保护技术信息管理系统的古建保护技术知识树示例; 图9是一种基于领域知识的古建筑保护技术信息管理方法的方法流程示意图。
具体实施例方式
下面结合图例对本发明中提出的一种基于领域知识的古建筑保护技术信息管理
系统具体组成及具体使用方法做出说明。应该指出的是,本文所描述的过程仅仅是为了说
明本发明在某一个应用中的使用情况,是为了更加清楚的认识和了解本发明,而不是对本
发明的限制。 —、系统组成 图1是一种基于领域知识的古建筑保护技术信息管理系统的结构示意图,如图所示基于领域知识的古建筑保护技术信息管理系统由数据管理单元6、古建筑保护知识库5、古建筑保护数据库4、古建筑保护知识库管理平台2、对外知识服务单元9、数据索引单元IO等六部分组成。 数据管理单元6的作用在于古建筑保护工作者7通过数据管理单元,依据6从古建筑保护知识库5获得的古建筑保护信息的分类知识,对用户数据进行分类,经过语义标注后将数据上传至古建筑保护数据库4;数据管理单元6依靠数据索引单元10、古建筑保护知识库5和古建筑保护数据库4为古建筑保护工作者7提供针对古建筑信息的语义查询功能;古建筑保护工作者7通过数据管理单元6增删修改编辑古建筑保护数据库4中所有的相关数据。数据管理单元6可以提供多种检索方式,其可以依据古建筑保护知识库5中的知识分类,按照类别进行知识浏览,并显示与目标知识节点相关的各种数据;亦可以输入查
询语句,根据数据索引单元io提供的语义索引和关键字索引直接检索到相关的电子数据
资源等。在使用过程中,当古建筑保护工作者7向数据管理单元6发出查询请求时,数据管理单元6根据用户请求的不同,从古建筑保护知识库5中返回相关知识,依靠数据索引单元10提供的索引功能,查找到古建筑保护数据库4中的数据返回。当古建筑保护工作者7向数据管理单元6发送增加、修改或者删除数据信息的命令时,数据管理单元6直接操作古建筑保护数据库4中的各种数据,数据索引单元10按照预先设定的机制(例如增量索引或重新索引),重新编制索引。 古建筑保护知识库5的作用在于用于存储本领域的相关知识,限定古建筑保护领域的专业术语、描述专业术语之间的关系,提供逻辑推理功能;为古建筑保护的信息数据提供语义分类依据。如图5所示,古建筑保护知识库5可以分为命名实体库、概念库、同义概念库、知识树等四部分。概念库用来存储公共基本概念、古建筑保护领域内的专业概念等;命名实体库用来存储与古建筑保护相关的人名、地名、机构名等;同义概念库用来成对的存储意义相同的两个概念;知识树用来存储古建保护领域中对相关概念的层级偏序关系的描述。其中,概念库是同义概念库、命名实体库和知识树的基础。 古建筑保护数据库4的作用在于存储古建筑保护技术相关的数字化信息。
古建筑保护知识管理平台2的作用在于为知识工程师1提供管理古建筑保护知识库的工作平台。提供古建筑保护技术知识体系维护等功能,具体是指运用本管理平台,可以定义、增删、修改描述古建专业词汇相关概念;使用知识树描述古建领域知识,并具有更新、增删概念和知识树等功能;同时系统能够自动计算概念、知识节点以及节点属性之间的语义距离、进行知识一致性校验等;该管理平台提供良好的用户交互界面,知识工程师1通过系统页面浏览、查询或修改知识库内容,在知识工程师1修改数据之后,把查询或更新数据库的结果通过用户界面返回给用户。 数据索引单元10的作用在于对古建筑保护工作者7上传的数字化信息依据上传过程中的语义标注和语义分类形成数据索引。所述知识数据库单元3位于服务器端,与数据管理单元6、古建筑保护知识库管理平台5可以使C/S结构也可以是B/S结构。所述知识数据库单元3含有的数据索引单元10与古建筑保护知识库5和古建筑保护数据库4相连,对古建筑保护工作者7上传的古建筑保护数字化信息利用古建筑保护知识库5提供的领域知识形成双数据索引。 图2是一种基于领域知识的古建筑保护技术信息管理系统的古建筑保护数据库结构示意图,如图2所示,古建筑保护数据库4具体的由古建筑结构化信息数据库11、古建筑保护非结构化信息数据库12和古建筑保护三维结构信息数据库13组成。古建筑结构化信息数据库11、古建筑保护非结构化信息数据库12、古建筑保护三维结构信息数据库13之间相互独立,通过古建筑保护知识库5相互关联。古建筑保护知识库5为古建筑结构化信息数据库11、古建筑保护非结构化信息数据库12、古建筑保护三维结构信息数据库13提供语义标签索引,语义标签决定了古建筑结构化信息数据库11、古建筑保护非结构化信息数据库12、古建筑保护三维结构信息数据库13中的数据的分类;古建筑保护知识库5提供语义标签和古建筑保护非结构化信息数据库12提供数据,经过倒排序和语义标签关联,形成语义索引,存储在数据索引单元10中。 其中,古建筑结构化信息数据库ll用于存储与古建筑保护知识库(5)中存储的具体古建筑单体相关的古建筑保护数值数据,至少包括残损勘察信息。结构化数据(如木式结构的斗拱和斗拱各跳的残损、长度、高度、名称、编号等)因本身具备良好的数据结构,故直接存储在数据库中。特别地,结构化信息在存储过程中,采取自下而上的、按照古建筑的组成关系构建数据库。以木质建筑(如图7所示)为例,在数据库中,斗拱的各跳信息组成斗拱信息,斗拱信息、檩信息、柱子信息组成木式构建和木座勘察信息作为木式构建的必不可少的组成数据,木式构建、木式平面结构组成单体建筑,单体建筑与结构化资料表总表相联系。 非结构化信息数据库12,用于存放与古建筑保护技术相关的文档、图片、音视频等各种电子化数据文件。其中,存储的数据文件按照知识库5知识结构进行分类,每个数据文件都拥有语义标签;在具体实施过程中,可以将非结构化数据(图像、视频、音频、文档等)以文件形式进行存储。
古建筑保护三维结构信息数据库13,用于存放古建筑保护知识库5中所涉及的单体建筑及构件的三维结构信息。三维结构信息包括但不限于古建筑单体的三维仿真数据、三维仿真涉及的图片等。 如图1所示,数据索引单元10与古建筑保护知识库5、古建筑保护非结构化数据库12 二者相连,其利用古建筑保护非结构化信息数据库12中各种电子资源所包含的文字和上传过程中每个文件对应的语义标签,形成以关键词和语义标签共同使用的双数据索引。
在数据索引单元10中存储的双数据索引包括关键字倒排序索引和语义标签分类索引两部分。古建筑保护非结构化数据库12中的全部电子资源得到文字信息进行关键字倒排序,形成关键字倒排序索引;根据古建筑保护工作人员7通过数据管理单元6管理古建筑保护非结构化数据时形成的语义标签根据古建筑保护知识库5标注的信息所属类别进行聚类,形成以语义标签和语义类别为索引的语义标签分类索引。 为了进一步明确语义标签分类索引,下面举例说明。假设现在有三个文件,分别为A、B和C。古建筑保护工作人员7在上传过程中对这三个文件标注了语义标签和所属类别,如表1所示。经过聚类后,形成的倒排序索引的形式如表2。
表1示例文件的语义标签
文件名语义标签所属类别
A太和殿历史照片
B独乐寺文献报告
C太和殿文献报告 表2示例文件形成的语义标签分类索引
语义标签和所属类别文件
太和殿A、C
独乐寺B
历史照片A
文献报告B、C 如图1所示,对外知识服务单元9的作用在于向古建筑保护信息用户8提供基于语义知识的检索服务的功能。这些语义检索服务是指以WebService形式为用户提供基于本体知识的、针对知识和数据的语义检索服务。其中的对外知识服务单元9以WebService模式对外提供分布式知识、数据查询服务。 所有的知识查询服务以字符串(string)形式传入参数,以满足XML格式的字符串格式(xmlstring)返回结果。
11
具体包括 ①由关键词查找相关知识节点服务其入口参数为关键词,返回结果是由关键词对应的概念所关联的知识节点ID列表。若找到知识节点,返回结果xmlstring有两级节点,该关键词为xmlstring根节点,相关的知识点ID号为第二级子节点。以查询跟"北京"相
关的知识节点为例,返回形式如下
〈北京>
〈ID>1750〈/ID>
〈ID>1751〈/ID>
〈ID>1752〈/ID>
〈/北京> ②由属性查询知识节点或概念服务入口为已知的属性名和属性值,出口为满
足该属性名或者属性值为查询输入的概念或知识节点的集合。若有满足要求的项,返
回xmlstring以attribute为根节点,多个满足要求的概念和知识点分别以Conc印t和
Knownode为并列第二级分节点,Conc印t中节点值为概念名,每个Knownode节点下包含知
识节点名称(用KnownodeName表示)和知识节点ID (用KnownodeID表示)两个第三级分
节点。以查询"时间"为"清朝"的知识为例,返回结果形式如下 〈attribute> 〈Conc印t〉材亍〈/Conc印t〉 〈Conc印t〉梁〈/Conc印t〉 〈Conc印t〉七架梁〈/Conc印t〉 〈Conc印t〉五架梁〈/Conc印t〉 _ 〈Knownode〉 〈KnownodeName>双步梁〈/KnownodeName> 〈KnownodeID>154〈/KnownodeCode>
〈/Knownode>
_ 〈Knownode>〈KnownodeName>檩〈/KnownodeName>
〈KnownodeID>191〈/KnownodeCode>
〈/Knownode>
_ 〈Knownode> 〈KnownodeName>样式雷〈/KnownodeName> 〈KnownodeID>4392〈/KnownodeCode>
〈/Knownode>
〈/attribute〉 ③知识节点的路径查询服务提供知识节点的知识路径查询服务,可用于知识层级查找或回溯。入口为目标知识节点ID(int数值,string类型),出口为该知识节点的知识路径。若有返回信息,使用xmlstring的层级节点反映知识节点的树状层级路径信息,从顶级知识一直到该知识点,xmlstring节点名为name,节点值为该级知识点名字,以查询ID为857的知识路径为例,返回结果显示如下
12
〈name>
:0100] 山西
:0101] 〈name>
:0102] 晋城
:0103] 〈name>
:0104] 陵川县
:0105] 〈name>西溪二仙庙〈/name>
:0106] 〈/name> :0107] 〈/name> 〈/name> ④知识节点的父节点查询服务提供知识节点的父节点查询服务,可用于具有上 下级关系的知识查询。入口为目标知识节点的ID(int数值,string类型),出口为该知识 点的父节点ID。若有父节点,返回父节点ID,结果的xmlstring仅有一级节点,节点名为 ParentID,内容为父节点ID。以查询ID为4的知识节点的父节点为例,结果显示如下
〈ParentID>2〈/P£irentID> ⑤知识节点的兄弟节点查询服务提供知识节点的兄弟节点查询服务,可用于同 级信息查询。入口为目标知识节点的ID(int数值,string类型),出口为该节点的兄弟节 点ID集合(包括目标知识节点)。有多个节点,返回兄弟节点ID集合,结果xmlstring串 有两级,根节点为brother空节点,第二级子节点为查询结果的各ID。以查询ID为4的兄 弟节点为例,返回结果显示如下
〈brother> 〈ID>3〈/ID> 〈ID>4〈/ID> 〈ID>5〈/ID> 〈ID>6〈/ID> 〈/brother〉 ⑥知识节点的成员子节点查询服务提供知识节点的成员子节点查询服务,可用 于整体部分关系的部分知识查询。入口为目标知识节点的ID(int数值,string类型),出 口为该节点的成员子节点ID集合。如果有多个成员子节点,返回兄弟节点ID集合,结果 xmlstring有两级,根节点为member空节点,第二级子节点为查询结果的各ID。以查询ID 为5的成员子节点为例,
〈member〉
〈ID>33〈/ID>
〈ID>34〈/ID>
〈/member> ⑦知识节点的父子关系子节点查询服务提供知识节点的父子子节点查询服务, 可用于具有上下级关系的下级知识查询。入口为目标知识节点的ID(int数值,string类 型),出口为该节点的父子子节点ID集合。如果有成员子节点,返回兄弟节点ID集合,结果 xmlstring有两级,根节点为child空节点,第二级子节点为查询结果的各ID。以查询ID为2的子节点为例,返回结果显示如下
〈child〉 〈childlD〉3〈/childlD〉
〈childlD〉4〈/childlD〉
〈childlD〉5〈/childlD〉
〈childlD〉6〈/childlD〉
〈/child〉 ⑧知识节点的所有属性查询服务提供知识节点的属性查询服务,可用于某知识
的详细信息查询。入口为目标知识节点的ID(int数值,string类型),出口为该节点的父
子子节点ID集合。如果知识节点拥有属性属性,返回属性集合,结果xmlstring有两级,根
节点为Attribute空节点,第二级子节点为查询结果各属性节点,以属性名为节点名,属性
值为节点值。以查询ID为857的知识点属性为例,返回结果显示如下 〈Attribute〉 〈碑记/> 〈碑文/> 〈地名 >陵川县〈/地名> 〈功能>寺庙〈/功能> 〈木刻雕像> 二仙〈/木刻雕像> 〈石碑 > 元好问石碑〈/石碑> 〈时间>金代〈/时间> 〈相关事件 > 宋徽宗事件〈/相关事件> 〈/Attribute〉 ⑨知识节点的特定属性查询服务提供知识节点的特定属性的查询服务,用于查 询某概念或知识节点的具体情况。入口为知识节点的ID(int数值,string类型)和特定 属性名(string),出口为该特定属性的属性值。若有有查询结果,xmlstring仅一级,节点 名为查询属性名,节点值为该属性值。以查询ID为857的"时代"属性举例,返回结果显示 如下〈时间>金代〈/时间> ⑩知识点的资料查询服务提供与知识节点相关的文件资料查询服务。入口为知
识点的ID(int数值,string类型),出口为知识点相关资料的信息集合。 如果查找到相关文件,结果xmlstring有三级,第一级根节点为data空节点,第二
级为资料的信息节点information,不同文件并列,第三级为资料的具体信息节点,包括知
识点ID、资料IDdataid、资料标题title、资料类型category、资料地址DIrStore、资料创建
时间TimeCreated、资料简要描述Discription、资料作者Author、资料上传者Uploader九
个子节点。以查询ID为30的资料为例,返回结果显示如下 〈data〉_ 〈information> 〈ID>30〈/ID> 〈dataid>98〈/dataid>
〈title〉古建筑施工工程〈/title〉
〈catagory>pdf〈/catagory> 〈DirStore>http://www. myschool. net. cn/building/data/other /185197189168214254202169185164. Pdf 〈/DirStore> 〈TimeCreated>2008-l-31上午CLIO: 37:01〈/TimeCreated〉 〈Diiscription〉内容涉及瓦石作、木作、油饰彩画作等的施工方法、施工工具、施 工过程、施工要求、质量与安全要求,材料的选取、加工,构件的制作、安装等。基本上古建筑 施工前需要做的准备、施工过程中的各个环节都有所涉及,是一部了解、学习和实践古建施 工的好资料、好帮手。 〈/Discription> 〈Author>未知〈/Author> 〈Uploader>王树金〈/Uploader> 〈/information> _〈information> 〈ID>30〈/ID> 〈dataid>100〈/dataid> 〈title〉古建筑施工〈/title> 〈catagory>pdf〈/catagory> 〈DirStore> http:〃www. text. net. cn/building/data/other/185197189168214 254202169185164.pdf 〈/DirStore> 〈TimeCreated>2008-l-31上午CLIO: 39:56〈/TimeCreated〉 〈Discription〉内容涉及瓦石作、木作、油饰彩画作等的施工方法、施工工具、施工
过程、施工要求、质量与安全要求,材料的选取、加工,构件的制作、安装……基本上古建筑
施工前需要做的准备、施工过程中的各个环节都有所涉及,是一部了解、学习和实践古建施
工的好资料、好帮手。〈/Discription〉 〈Author>未知〈/Author> 〈Uploader>王树金〈/Uploader> 〈/information> 〈/data> JJ特定类型的资料查询服务提供知识节点的某类非结构化资料查询服务。入口 为该知识节点的ID(int数值,string类型)和所要求的资料类型(string类型),出口为 知识点的该类型的资料集合。 查找到相关文件,结果xmlstring有三级,第一级根节点为data空节点,第二级为 资料的信息节点information,不同文件并列,第三级为资料的具体信息节点,包括知识点 ID、资料IDdataid、资料标题title、资料类型category、资料地址DIrStore、资料创建时间 TimeCreated、资料简要描述Discription、资料作者Author、资料上传者Uploader九个子节点。以查询ID为30的pdf类型的资料为例,返回结果显示如下 〈data〉 〈information> 〈ID>30〈/ID> 〈dataid>98〈/dataid> 〈title〉古建筑施工工程〈/title> 〈catagory>pdf〈/catagory> 〈DirStore> http://www. myschool. net. cn/building/ data/other/185197189168214254202169185164. Pdf 〈/DirStore> 〈TimeCreated>2008-l-31上午10:37:01〈/TimeCreated〉 〈Discription> 内容涉及瓦石作、木作、油饰彩画作等的施工方法、施工工具、施工过程、施工要
求、质量与安全要求,材料的选取、加工,构件的制作、安装等。基本上古建筑施工前需要做 的准备、施工过程中的各个环节都有所涉及,是一部了解、学习和实践古建施工的好资料、 好帮手。 〈/Discription> 〈Author>未知〈/Author> 〈Uploader>王树金〈/Uploader> 〈/information> _〈information> 〈ID>30〈/ID> 〈dataid>100〈/dataid> 〈title〉古建筑施工〈/title> 〈catagory>pdf〈/catagory> 〈DirStore>http://www. myschool. net. cn/building/data/other/1 85197189168214 254202169185164. Pdf 〈/DirStore> 〈TimeCreated>2008-l-31上午10:39:56〈/TimeCreated〉 〈Discription〉内容涉及瓦石作、木作、油饰彩画作等的施工方法、施工工具、施工
过程、施工要求、质量与安全要求,材料的选取、加工,构件的制作、安装等。古建筑施工前需 要做的准备、施工过程中的各个环节都有所涉及,是一部了解、学习和实践古建施工的好资 料、好帮手。 〈/Discription> 〈Author>未知〈/Author> 〈Uploader>王树金〈/Uploader> 〈/information> 〈/data>
其中资料类型是指数据文件的类型,比如"文档"、txt、 jpg、 pdf等。 —般地,这些方法以WebService的形式对外发布,有利于实现分布式的部署和实施。 二、系统内部关联关联( — )在本系统中,古建筑保护知识库管理平台2与古建筑保护知识库5相连,知 识工程师1通过古建筑保护知识管理平台2管理古建筑保护知识库5中的领域知识。除知 识工程师1和古建筑保护知识库管理平台2之外,其他人员和单元均不能对古建筑保护知 识库5的内容进行更改。古建筑保护知识管理平台2与古建筑保护知识库5之间既可以是 C/S结构,也可以是B/S结构。 ( 二 )在本系统中,对外知识服务单元9与古建筑保护知识库5、数据索引单元10 和古建筑保护数据库4三者相连,接受普通使用者8的查询请求,从古建筑保护知识库5、数 据索引单元10和古建筑保护数据库4中获得数据和知识,返回给普通使用者。对外知识服 务单元9不能修改古建筑保护数据库4、古建筑保护知识库5、数据索引单元10中的内容。
(三)在本系统中,数据管理单元6与古建筑保护数据库4双向数据连通,数据索 引单元10和古建筑保护知识库5对数据管理单元6和古建筑保护数据库4之间的数据交 换起到辅助作用。数据管理单元6只能改变古建筑保护数据库4中的内容,不能改变古建 筑保护知识库5、数据索引单元10以及其他部分的内容。(四)在本系统中,数据索引单元10与古建筑保护知识库5、古建筑保护数据库4 中的古建筑保护非结构化信息数据库12相关联。古建筑保护知识库5中的古建保护领域 相关词汇和概念、以及古建筑保护非结构化信息数据库12中所包含的词汇为数据索引单 元10提供索引的标示。(五)在本系统中,古建筑保护知识库5还与古建筑保护数据库4相连。如前述,
古建筑保护知识库5中的概念与古建筑保护数据库4中的数据关联存储。(六)古建筑保护知识库5、古建筑保护数据库4和数据索引单元10共同构成了
古建筑保护信息系统的知识数据库单元3。知识数据库一般单独存储于服务器端。 三、基于领域知识的古建筑保护技术信息管理方法( — )方法概述 本发明涉及的基于领域知识的古建筑保护技术信息管理方法,如图9所示,可以 概述为以下步骤 1)知识工程师1在分析古建筑保护技术领域所涉及的基本概念和相关词汇、概念 之间的组成、继承关系、概念的属性关系后,以通用术语(通用概念)为基础,利用古建筑保 护知识库管理平台2构建领域术语(ontology),形成领域知识分类依据;
2)古建筑保护工作者7通过数据管理单元6管理古建筑保护相关的信息数据,包 括对数据上传、查询、删除和修改; 3)数据索引单元10定期根据古建筑保护知识库5和古建筑保护数据库4的数据 编制关键字倒排序索引和语义标签分类索引,同时为古建筑保护工作人员7通过数据管理 单元6查询古建筑保护知识和信息数据的操作提供索引;例如,用户通过数据管理单元(6) 查询"独乐寺"相关的知识和信息数据。假设在数据索引单元10中,文件A、文件B等与独 乐寺为索引,则会给用户返回文件A和文件B。
4)古建筑保护知识和信息的普通用户8通过对外知识服务单元9检索古建筑保护 知识和相关数据信息。
( 二 )古建保护领域知识的表示与构建方法
(1)领域知识的表示方法 1)古建筑领域的知识表达采用基于概念知识树语义表达模型。 2)在概念知识树语义表达模型中,概念为语义的基本表达单元,简单的概念可以 通过组合形成复杂概念。概念用{属性,关系} 二元组表示;属性是由{属性名,属性值} 表示的二元组;属性名称的类型是简单概念或复合概念,属性值的类型是概念、数字、字符 串、数组、时间或布尔值,用于界定概念的内涵;关系包括父子继承关系和部分组成关系两 类。 一个词可能对应多个简单概念,一个概念可能由多个词表示。 所述概念与词汇之间是多对多的关系。 一词多义称同名概念,多词一义称同义概 念。同名概念用词加下标形式区分,如"先生"这个词有三个基本语义,分别对应三个概念, "先生_1"是老师,"先生_2"是对丈夫的称呼,"先生_3"表示尊称。同义概念在知识体系 中用同义关系描述,如概念"先生_1"与"老师_1"是同义概念,则在这两个概念之间建立 一个同义关系。 3)在特定领域内,概念与概念之间存在着关系。知识树用来描述概念与概念之间 的关系,以树状结构表示。知识树的节点成为知识节点。知识树上父子节点之间的关系是父 子关系或者组成关系。知识节点包括知识节点名称、知识节点语义、知识节点的属性等三部 分。知识节点的名称以词表示,知识节点的语义以概念形式描述。知识节点的属性包括属 性名和属性值两部分。属性名以概念形式定义,属性值可以是概念、字符串、数字、数组等。
概念知识树的可以用以下BNF表达式加以说明。
〈知识树 >::=〈知识树名称X顶层节点>*
〈知识树名称 >::=〈字符串>
〈顶层节点 >::=〈节点>*〈节点 >::=〈序列号 >〈节点名称 >〈节点概念 > [〈父类节点 >][与父节点关系] [〈子类节点>*][〈节点属性>]〈序列号〉 〈节点名称
〈节点概念
〈语义表达
〈父类节点
〈与节点关系 〈子类节点
〈节点属性
〈属性名称
〈属性值〉
〈符号>::: 其中*表示出现一次或者多次, (2)领域知识的构建方法
字符串> 〈字符串> 〈语义表达> 〈概念> 〈节点> =〈父子关系) 〈节点>
〈属性名称x属性值〉 〈概念>/〈复合概念> 符号>
■/〈字符串V〈浮点数
整体与局部关系
日期V〈语义表达
表示或,[]表示可选。
18
2. 1在基本概念的基础上,分析古建筑保护技术领域的特有概念和词汇之间的关 系,建立并完善古建筑保护知识库5中的概念库; 2. 2分析概念与概念之间的同义关系,整理古建筑保护领域的命名实体,如"样式 雷"等,丰富同义概念库17和命名实体库15。 2. 3分析概念与概念之间的上下位组成关系,构建领域知识树;分析知识树之间 的关系,确定各知识节点的属性和属性值;将相关知识存储到知识树16中。如图6所示,经 过分析,将知识分为建筑物相关、保护技术相关、建筑常识和维修制度等四部分知识。其中, 建筑物相关又分为书籍、时间、人物、事件、资料、文物类别、附属文物、地名等八棵知识树; 保护技术相关又分为维修工具、建筑材料等两棵知识树;建筑常识分为以组成关系构建的 单体建筑结构和常规数据两棵知识树;维修制度单独作为一棵知识树。在这些知识树中,各 知识树与知识树之间通过属性互相联系。例如,文物类别和附属文物知识树中涉及的具体 的建筑,又通过"建造时间"、"重修时间"等关系与时间知识树相联系,通过"地点"关系同 "地名"知识树相联系。 2. 4对古建筑保护领域知识库5中的知识进行一致性检查,解决知识矛盾。
2. 5根据实际应用不断重复2. 1-2. 4步骤,完善知识库。
(3)古建筑保护技术知识树示例 为了更清楚的说明知识树的构建形式,下面以"文物保护技术"知识树为例,对知
识树的形式进行说明。需要注意的是,下述的示例知识树,仅仅是为了说明古建筑保护技术
领域的知识树构成,而不构成对本发明具体实施过程中知识树的具体组织的限制。"古建保护技术"知识树,如图8所示,主要描述建筑物保护的内容,引起残损的病
害,以及针对病害的可采用的维修工艺。"古建保护技术"树由八层知识节点组成,第一层节
点是该知识树的树根,第二层节点描述古建筑保护中所需要保护的内容,第三层节点记录
病害的名称,第四层节点对与病害相关的材料的类型进行定义,第五层节点描述维修方法
的类别,第六层描述具体的维修方法,第七层定义第六层中的维修方法相关信息的类别,第
八层对具体维修步骤进行说明。 在第一层中,方法中用知识节点"古建保护技术"来表示该知识树的树根。该知识 树其中记录了相关的维修制度,常规数据等。 在第二层中,知识节点是对保护的内容进行了分类说明。分类的粒度依保护内容 的不同而不同。例如,"装饰保护"可以细分为"雕刻保护"、"彩画保护"以及"壁画保护"; 而"雕刻保护"又可细分为"雕砖保护"、"石雕保护"和"木雕保护"。 在第三层中,知识节点描述对木建筑造成损害的病害。例如,"结构性砖墙开裂"可 能是造成墙面损害的一种病害名称。 在第四层中,知识节点用"多媒体","案例"等定义与病害相关的材料的类型。
在第五层中,知识节点根据保护内容以及病害的不同致因对维修方法进行分类。 例如,在"墙面保护"中,根据致因可将维修方法分为"针对砖石墙体强度不足的维修方 法","针对地基沉降的维修方法",以及"针对雨水与风化等的维修方法"等。
在第六层中,知识节点对某一致因的维修方法进行详细描述,同一致因的维修方 法可能包含一种或多种,如"针对砖石墙体强度不足的维修方法"拥有"方法一"、"方法二" 和"方法三"等三个不同的方法。
19
在第七层中,知识节点定义了与第六层定义的维修方法相关资料的类别,图8中 列出了 "多媒体","案例"和"维修步骤"等类别。 在第八层中,如果维修方法是分多个步骤进行操作,知识节点在这一层对这些步 骤进行描述,否则该层节点为空。(三)古建筑保护工作者通过数据管理单元管理古建筑相关的信息数据
(1) —般步骤 如图3所示,先介绍其一般步骤如下 i.从古建筑保护技术知识库5获得古建筑分类知识树,浏览分类情况; ii.选择或检索所需要管理的信息数据在知识树上所属的类别或古建筑单体名
称; iii.判断是否为结构化数据,如果为否,则是非结构化数据,则填写、删除或修改 编辑非结构化数据的基本信息(至少包括,作者、来源、上传者或修改者、上传或修改时间、 内容提要等)、非结构化数据的文件类型,为非结构化数据增加、输出或重新生成语义标签 后,在古建筑保护数据库4中更新非结构化数据、基本信息和语义标签;如果是结构化数
据,则依据所选的古建筑在古建筑保护知识库中的结构化数据填写结构化数据表格,上载 结构化数据到古建筑保护数据库;
(2)生成语义标签的方法 请参阅图4,生成语义标签的方法可以分为手工、半手工和自动三种类型;如图4
中所示,内部方框14之内的步骤表示自动生成语义标签的方法,不包括步骤S36 ;而方框15
之内的所有步骤表示半自动生成语义标签方法,包括步骤S36。其中 A.手工生成语义标签具体是指古建筑保护工作者7人工选择待管理古建保护相
关文件所属的类别,根据文件内容填写语义标签,之后,数据管理单元2将文件和其所属于
类别以及语义标签同时存储到古建筑保护非结构化信息数据库12中; B.自动生成语义标签具体步骤 步骤S31 :对拟操作的古建筑保护相关文件进行文字抽取,获取其中含有的文字 信息; 步骤S32 :对中文进行分词,获得词汇,在去除停止词之后,将具有实体意义的词 汇转换成为概念; 步骤S33 :以古建筑保护知识库5中对古建筑信息所划分类别为依据,对该文件进 行文本分类; 步骤S34 :将分类的文本与所属类别关联存储,完成"划分语义类别"操作,提取对 该文件中所含的关键概念,完成"提取语义标签"的操作; 步骤S35 :将所获得的语义类别和语义标签合并去重作为最终结果,在古建筑保 护非结构化数据库12中更新拟操作的古建筑保护相关文件、所属于的语义类别和语义标 签; C.半手工生成语义标签具体是指执行自动生成语义标签的方法中的步骤S31、 S32、S33和S34后,获得拟操作的古建筑保护信息所属类别和语义标签,在经过步骤S35人 工修正,即人工校对对目标文件标注的语义标签和划分的语义类别是否正确。在修正之后, 在古建筑保护非结构化数据库12中更新拟操作的古建筑保护相关文件、所属于的语义类别和语义标签。(四)古建筑保护系统对外提供知识服务 普通用户通过综合使用对外知识服务单元9中所存储的如前所述的WebService 接口 ,查询获得其需要的数据或知识。 以下面剧本为例来说明具体服务及其组合的应用过程 某家三代人爷爷爸爸妈妈和小明。爷爷是一个古建筑专家,最近接到一项古建保 护维修工程,想知道该工程涉及哪些的具体维修保护标准和法律制度④,该古建的相关资 料及可能的维修历史⑧;爸爸妈妈是古建筑爱好者,加上平时爱旅游,喜欢到处走走看看, 特别喜欢看一些古建筑,所以有时会找一些古建筑专家对他们感兴趣的古建的贡献和评 价,比如看梁思成对佛光寺的研究资料 ,或者这段时间就对清代的建筑比较感兴趣,想 多找找这些方面的资料⑨,去佛光寺旅游时会事先查查东大殿的壁画有哪些 ,文殊寺建 筑结构类型⑧等;小明十多岁,会经常问爸妈一些比较常识性的东西,比如有同学去佛光 寺玩过,回家就会问爸爸妈妈"佛光寺在哪 ","佛光寺是何时建造的⑧","佛光寺包括哪
些建筑①","去佛光寺玩顺便还可以去哪玩(D"等问题。 对上剧本分析,需要几大功能需求 1)某知识点的资料查询@ (服务的简单组合)。 2)某关键词相关的资料查询⑧(服务的简单组合)。 3)某几个关键词相关的资料查询 (服务组合结果的解析组合)。 4)由属性查某些知识⑨(单服务)。 5)查某些知识的层级关系①(服务的简单组合)。 6)查某些知识的更详细的属性信息⑧ (服务的简单组合)。
属性传递查询,比如某建筑的同一属性的其他建筑(D (服务的多级组合)。
对于以上的功能需求(使用数字加右括号,如"l)"表示),以在具体实施方式
"系 统组成"中叙述的对外服务单元9提供的服务(对应地,以下以带圆圈的数字表示)为基 础,其对应的解决方法是 1)确切知道某知识点的ID,直接调用⑩服务;不确切知道知识点ID,组合①和⑩ 务即可。 2)同一服务的不同输入的结果的组合(取交集)处理,即对服务结果解析然后根 据结果元素判断组合条件,属于其他服务单元工作。具体到本例子,以"梁思成"和"佛光寺" 为关键词分别完成2)服务后得到各自的资料xmlstring (⑩的结果的结构),求资料ID的 交集。 3)直接调用②服务。 4)调用①服务找到知识对应的ID号,后根据需要传入ID调用③,④,⑤,⑥,⑦服 务,如在地域领域,要查某地点属于哪一区域管辖,即可以通过调用服务④查该节点的父节 点来实现;再如查行政管辖范围,调用服务⑦查子节点,在具体古建筑方面,若查询某建筑 的组成,则可调用服务⑥查该节点的成员子节点或服务⑦该节点的父子子节点。具体调用方式同2)。 5)先调用1服务找到对应的知识ID号,然后根据需要传入ID调用⑧,⑨服务。具 体调用方式同上。 6)组合①,②和⑨服务。类同2)调用方式组合①和⑨,得到结果字符串后根据⑨ 的结果说明解析得到②的入口参数,调用②获取答案。 以上所述,仅为本发明中的具体实施方式
,但本发明的保护范围并不局限于此,任 何熟悉该技术的人在本发明所揭露的技术范围内,可理解想到的变换或替换,都应涵盖在 本发明的包含范围之内。
权利要求
一种基于领域知识的古建筑保护技术信息管理系统,其特征在于该系统包括具有古建筑保护知识库(5)与古建筑保护知识库管理平台(2)连接,用于存储能够为古建筑保护信息提供语义分类标准的古建筑保护知识,限定古建筑保护领域的专业术语、描述专业术语之间的关系,提供逻辑推理功能;古建筑保护知识管理平台(2)与古建筑保护知识库(5)之间可以是C/S结构或者是B/S结构;古建筑保护知识管理平台(2)与知识工程师(1)连接,为知识工程师(1)提供管理古建筑保护知识库的工作平台,除知识工程师(1)通过古建筑保护知识库管理平台(2)对古建筑保护知识库(5)内的内容进行修改外,其他人员和单元均不能对古建筑保护知识库(5)的内容进行更改;数据管理单元(6)与古建筑保护数据库(4)双向数据连通,数据索引单元(10)和古建筑保护知识库(5)对数据管理单元(6)和古建筑保护数据库(4)之间的数据交换起到辅助作用;数据管理单元(6)只能改变古建筑保护数据库(4)中的内容,不能改变古建筑保护知识库(5)、数据索引单元(10)以及其他部分的内容,数据管理单元(6)利用数据索引单元(10)中的双数据索引为古建筑保护工作者(7)提供古建筑信息语义查询功能;同时,数据管理单元(6)向古建筑保护数据库(4)发送古建筑保护工作者(7)的查询信息、管理指令和上传的结构化非结构化数据;古建筑保护工作者(7)与数据管理单元(6)连接,对与古建筑保护相关的数字信息进行分类,经过语义标注后将数据上传至古建筑保护数据库(4);古建筑保护工作者(7)通过数据管理单元(6)增删修改古建筑保护相关的数字信息;对外知识服务单元(9)与含有古建筑保护知识库(5)、数据索引单元(10)和古建筑保护数据库(4)的知识数据库单元(3)相连,以WebService的形式对外提供分布式知识、数据查询服务,接收普通使用者(8)的查询请求,从古建筑保护知识库(5)、数据索引单元(10)和古建筑保护数据库(4)中获得数据和知识,返回给普通使用者;对外知识服务单元(9)不能修改古建筑保护数据库(4)、古建筑保护知识库(5)、数据索引单元(10)中的内容。
2. 如权利要求1所述的基于领域知识的古建筑保护技术信息管理系统,其特征在于 所述数据索引单元(10)与古建筑保护知识库(5)和古建筑保护数据库(4)相连,对古建筑 保护工作者(7)上传的古建筑保护数字化信息利用古建筑保护知识库(5)提供的领域知识 形成双数据索引。
3. 如权利要求1所述的基于领域知识的古建筑保护技术信息管理系统,其特征在于 所述古建筑保护数据库(4)含有相互独立的古建筑结构化信息数据库(11)、古建筑保护非 结构化信息数据库(12)和古建筑保护结构重建信息数据库(13);通过古建筑保护知识库 (5)将古建筑结构化信息数据库(11)、古建筑保护非结构化信息数据库(12)和古建筑保护 结构重建信息数据库(13)相互关联;由古建筑保护知识库(5)为古建筑结构化信息数据库(11) 、古建筑保护非结构化信息数据库(12)和古建筑保护结构重建信息数据库(13)提供 语义标签索引,语义标签决定了古建筑结构化信息数据库(11)、古建筑保护非结构化信息 数据库(12)和古建筑保护结构重建信息数据库(13)中的数据的分类;利用古建筑保护知 识库(5)提供的语义标签与语义分类,以及古建筑保护非结构化信息数据库(12)提供的数 据,经过倒排序和语义标签关联,形成语义索引,存储在数据索引单元(10)中;古建筑结构化信息数据库(11)用于存储与古建筑保护知识库(5)中存储的具体古建筑单体相关的古建筑保护数值数据,其中至少包括残损勘察信息;古建筑非结构化信息数据库(12),用于存放与建筑保护知识库(5)中古建筑保护相关的文字、图片、音视频等各种电子化数据文件;其中,存储的数据文件按照古建筑保护知识库(5)中对古建保护领域的知识表示进行分类,每个数据文件都拥有语义标签;为数据索引单元提供倒排序所需要的数据信息;古建筑保护三维结构信息数据库(13),用于存放古建筑保护知识库(5)中所涉及的古建筑单体的三维结构信息。
4. 如权利要求1所述的基于领域知识的古建筑保护技术信息管理系统,其特征在于所述双数据索引包括关键字倒排序索引和语义标签分类索引两部分;将古建筑保护非结构化数据库(12)中的全部电子资源得到文字信息进行关键字倒排序,形成关键字倒排序索引;同时根据古建筑保护工作人员(7)利用数据管理单元(6)管理古建筑保护非结构化数据时形成的语义标签,根据古建筑保护知识库(5)标注的信息所属类别进行聚类,形成以语义标签和语义类别为索引的语义标签分类索引。
5. 如权利要求1所述的基于领域知识的古建筑保护技术信息管理系统,其特征在与以WebService的形式对外提供分布式知识、数据查询服务,这些服务具体包括由关键词查找相关知识节点的服务、由属性查询知识节点或概念的服务、知识节点的路径查询服务、知识节点的父节点查询服务、知识节点的兄弟节点查询服务、知识节点成员子节点查询服务、知识节点父子关系子节点查询服务、知识节点的所有属性查询服务、知识节点的特定属性查询服务、知识节点的资料查询服务、特定类型的资料查询服务。
6. —种基于领域知识的古建筑保护技术信息管理方法,其特征在于该信息管理方法包括步骤如下步骤S 1 :知识工程师(1)在分析古建筑保护技术领域所涉及的基本概念和相关词汇、概念之间的组成、继承关系、概念的属性关系后,以通用术语(通用概念)为基础,利用古建筑保护知识库管理平台(2)构建领域术语(ontology),形成领域知识分类依据;步骤S2 :古建筑保护工作者(7)通过数据管理单元(6)管理古建筑保护相关的信息数据,包括对数据上传、查询、删除和修改;步骤S3 :数据索引单元(10)定期根据古建筑保护知识库(5)和古建筑保护数据库(4)的数据编制关键字倒排序索引和语义标签分类索引,同时为古建筑保护工作人员(7)通过数据管理单元(6)查询古建筑保护知识和信息数据的操作提供索引;步骤S4 :古建筑保护知识和信息的普通用户通过对外知识服务单元检索古建筑保护知识和相关信息数据。
7. 如权利要求6所述的基于领域知识的古建筑保护技术信息管理方法,其特征在于该数据上传的具体步骤为从古建筑保护知识库获得古建筑保护领域知识库领域知识分类知识树,浏览分类情况;步骤a):选择或检索所需要管理的信息数据在知识树上所属的类别或古建筑单体名称;步骤b):判断是否为结构化数据,如果是非结构化数据,则依据所选的古建筑在古建筑保护知识库中的结构化数据填写结构化数据表格,上载结构化数据到古建筑保护数据库;如果不是非结构化数据,填写、删除或修改非结构化数据的基本信息、非结构化数据的文件类型,经过为非结构化数据增加、输出或重新生成语义标签后,在古建筑保护数据库中更新非结构化数据、基本信息和语义标签;步骤c):如果是古建筑单体所有的结构化数据,则按照古建筑保护知识库中存储的古建筑单体的结构化数据表格依次填写,填写完毕后,在古建筑保护数据库中更新古建筑单体相关的结构化数据。
8.如权利要求6所述的基于领域知识的古建筑保护技术信息管理方法,其特征在于所述生成语义标签可以分为手工、半手工和自动三种类型;其中(一) 手工生成语义标签是古建筑保护工作者人工选择待管理相关文件所属的类别,根据文件内容填写语义标签;之后,数据管理单元2将文件和其所属于类别以及语义标签同时存储到古建筑保护非结构化信息数据库中;(二) 自动生成语义标签是步骤S31 :对拟操作的古建筑保护相关文件进行文字抽取,获取其中含有的文字信息;步骤S32 :对中文进行分词,获得词汇,去除停止词之后,将具有实体意义的词汇转换成为概念映射;步骤S33 :以古建筑保护知识库5中对古建筑信息所划分类别为依据,对该文件进行文本分类;步骤S34 :将分类的文本与所属类别关联存储,完成"划分语义类别"操作,提取对该文件中所含的关键概念,完成"提取语义标签"的操作;步骤S35 :将所获得的语义类别和语义标签合并去重作为最终结果,在古建筑保护非结构化数据库中更新拟操作的古建筑保护相关文件、所属于的语义类别和语义标签;(三) 半手工生成语义标签是执行自动生成语义标签的方法中的步骤S31、 S32、 S33和S34后,获得拟操作的古建筑保护信息所属类别和语义标签,在经过步骤S35人工修正之后,在古建筑保护非结构化数据库中更新拟操作的古建筑保护相关文件、所属于的语义类别和语义标签。
全文摘要
本发明为一种基于领域知识的古建筑保护技术信息管理系统及方法,为解决古建筑保护过程中电子化数据很多但是知识很少的难题,本发明的系统由数据管理单元、古建筑保护知识库、古建筑保护数据库、古建筑保护知识管理平台、对外知识服务单元和数据索引单元等六部分组成。方法包括知识工程师构建古建保护领域知识库;古建筑保护工作者依据领域知识分类针对结构化数据和非结构化数据分别以不同的方式上传到古建筑保护数据库,并管理这些数据;采用基本知识服务自由组合的形式对外提供基于WebService的古建筑保护知识检索服务。本发明可以有效利用古建筑保护领域的知识,提高现有的大量古建保护技术相关数据和信息的使用效率,为本行业创造丰厚的经济效益。
文档编号G06Q50/00GK101763574SQ20091008587
公开日2010年6月30日 申请日期2009年6月3日 优先权日2009年6月3日
发明者任禾, 刘旸, 陈琳, 马良俊, 高一波 申请人:中国科学院自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1