天然气与管道技术标准体例库的建立方法

文档序号:6489326阅读:140来源:国知局
天然气与管道技术标准体例库的建立方法
【专利摘要】本发明是一种天然气与管道技术标准体例库的建立方法,涉及数字数据处理装置和管道系统【技术领域】。其建立步骤如下:(1)标准专业分类;(2)分析每类标准体例特征,并参与进化;(3)提炼体例元素;提炼体例元素时,补充同义词;(4)建立体例结构表;同时补充同义词;(5)进化,进化后重新参与分析每类标准体例特征分析;(6)体例库建立完成。本发明所建立的系统能够实现从“基本字段信息”到“重要技术指标”的高效的标准信息检索。
【专利说明】天然气与管道技术标准体例库的建立方法
【技术领域】
[0001]本发明是一种天然气与管道技术标准体例库的建立方法,涉及数字数据处理装置和管道系统【技术领域】。
【背景技术】
[0002]随着信息技术与网络技术的发展,信息共享系统已经在各个行业广泛应用,大大提高了各行业工作劳动效率与便捷性,天然气与管道行业在信息化技术应用方面一直走在行业前列,随着业务、技术的进一步发展,仅仅提供文献级别的检索、浏览等功能已经不能满足用户的需求,必须进行更深一步的挖掘与服务,以满足用户需求。目前常用的标准检索方式为“基本字段信息”检索,一般仅能提供对标准名称、主题词进行检索,不能实现对技术指标的精确定位与检索、不同标准中同一技术指标的对比。概括起来,传统检索方式对技术标准的使用效果有以下几方面的局限性。
[0003](I)不能对技术标准内容进行精确检索
[0004]传统数据库检索方式是通过分类、标题、摘要及叙词等手段对标准文献进行题录数据加工,来实现对技术标准与技术法规的检索。但是技术指标一般会分散在不同技术标准与技术法规中,传统的检索方式只能通过题录数据库检索到相关标准,逐一阅读原文技术指标的内容。但是这样的方法很浪费时间,并且难以保障查全率。
[0005](2)不能同时检索到不同标准的技术指标,并实现不同标准的同一技术指标的对比。
[0006]在检索过程中,经常会出现同一产品的技术指标同时存在国际标准、国家标准、行业标准、地方标准和企业标准等不同的标准中,用户经常需要对不同标准中的相同产品的技术指标进行对比研究,这是传统检索方式所不能满足的。
[0007]标准内容提取与展示系统是标准信息检索的最新发展方向。这种新型的检索方式通过对标准技术指标的系统提取和有效组织,能够实现从“基本字段信息”到“重要技术指标”的高效的标准信息检索。对于负责油气管道工程建设的工程项目管理人员、实施人员,可以实现利用关键指标控制管道设计和施工建设;对于油气管道运行操作人员、管理人员,可以实现查询、对比操作参数、方法;对于科研人员,可以实现国内外标准关键指标差异分析、判断技术差异,分析体系内各标准间的协调性。
[0008]CN102591878A公开了一种技术标准内容提取与展示系统的建立方法,《石油规划设计》2011年第22卷第6期“天然气与管道标准信息管理系统开发方案研究”公开了一种天然气与管道标准信息管理系统的开发方案,但该系统仅能进行标准全文检索,无法实现标准内容的提取与展示,也并未公开建立天然气与管道标准体例库的方法,其技术并不完

口 ο
[0009]标准内容提取与展示技术是一种新的标准检索技术,目前国外未见以此技术开发的商业数据库。在国内,只有中国标准化研究院将标准内容提取与展示技术初步应用在食品、农产品的国家标准、行业标准中,并建设了相应的提取与展示系统平台,实现对标准内容指标的提取与展示。目前国内外尚未见到天然气与管道技术标准内容提取与展示系统的建立方法。
[0010]要实现天然气与管道标准内容提取与展示,必须使不同标准相关内容在同一检索词下能够被同时检索到,进而实现内容展示和对比。一种可行的方法就是对具有相同结构的标准文献进行标准结构分析,并依据油气管道标准文献的规范条款或技术指标,建立起来能够涵盖天然气与管道标准中出现的所有有效检索指标和属性的重要架构,作为标准内容提取与展示以及各标准内容具有可比性的架构载体。然而目前尚没有这样的方法,需要研究开发相应的方法用以作为实现天然气与管道标准内容提取与展示技术的基础。

【发明内容】

[0011]本发明的目的是发明一种将相同的结构提取并重新组织形成体例库作为标准内容具有可比性的架构、实现从多个标准中提取与展示相同内容或指标、实现从“基本字段信息”到“重要技术指标”的高效的标准信息检索的天然气与管道技术标准体例库的构建方法。
[0012]本发明是天然气与管道技术标准内容提取与展示系统中体例库的建立方法,天然气与管道技术标准内容提取与展示系统的建立方法如图1所示,主要包括以下步骤:
[0013](I)使用光学字符识别(OCR)工具对天然气与管道标准文献全文进行数字化加工,使标准文献数字化;
[0014](2)建立天然气与管道标准本体库、体例库、题录数据库;
[0015](3)建立天然气与管道标准内容数据库;
[0016](4)开发天然气与管道标准内容提取与展示系统平台,用于标准内容提取、展示与对比。
[0017]天然气与管道技术标准体例库的建立方法如图2所示,建立步骤如下:
[0018](I)标准专业分类;
[0019](2)分析每类标准体例特征,并参与进化;
[0020](3)提炼体例元素;提炼体例元素时,补充同义词;
[0021](4)建立体例结构表;同时补充同义词;
[0022](5)进化,进化后重新参与分析每类标准体例特征分析;
[0023]( 6 )体例库建立完成。
[0024]所述天然气与管道标准体例库建立具体方法为:
[0025]( I)对现有天然气与管道标准按照专业主题范畴分布进行标准专业分类;
[0026](2)分析每类标准体例特征:分析同一主题范畴标准的体例特征,根据专业特点以及体例的结构相似度大小判断是否需要将同一主题范畴的标准继续细分为不同类;
[0027](3)提炼体例元素:分析同一类中所有标准的体例特征,提炼出每项标准的体例元素,将此类中不同标准的相似体例元素合并或集成,赋予具有精确性和唯一性的术语名称,即体例元数据名称;
[0028]体例元素建立的原则为:每一类标准的一级体例元素要涵盖此类标准的所有内容,要保证标准知识的完整性;二级、三级以及其他级体例元素要具有共同性,即对于含有相同一级体例元素的标准,应该均能提炼出此一级体例元素下的二级、三级以及其他级体例元素;
[0029](4)建立体例结构表:根据标准类别划分体例元素属性归属,包括行业归属、主体归属、结构归属,分别赋予体例元数据行业名称、体例元数据主体名称、体例元数据结构名称,并分别赋予体例元数据行业代码、体例元数据主体代码、体例元数据结构代码;对于有同义词的体例元素,应补充每一项体例元素据的同义词,增加用户的检索入口,建立体例结构表;
[0030](5)进化:对不能满足要求的体力元素重新进行体例特征分析、提炼体例元素、补充同义词、建立体例结构表;
[0031](6)完成体例库的建立:整合集成体例结构表,建立体例库。
[0032]本发明取得了以下有益效果:
[0033](I)有效的对天然气与管道标准进行结构分解,将相同的结构提取并重新组织形成体例库;可以有效的对标准结构进行分解,提取结构相同;
[0034](2)本发明构建的体例库应用于天然气与管道标准内容提取与展示系统,可作为标准内容具有可比性的架构,作为能够实现从多个标准中提取与展示相同内容或指标的基础,最终实现从“基本字段信息”到“重要技术指标”的高效的标准信息检索。
【专利附图】

【附图说明】
[0035]图1天然气与管道标准内容提取与展示系统建立流程图
[0036]图2体例库构建流程图
【具体实施方式】
[0037]实施例.以本例来说明本发明的【具体实施方式】并对本发明作进一步的说明。本例是一实验方法,其流程如图2所示。
[0038]本天然气与管道标准体例库建立具体方法为:
[0039]( I)对现有天然气与管道标准按照专业主题范畴分布进行标准专业分类;
[0040](2)分析每类标准体例特征:分析同一主题范畴标准的体例特征,根据专业特点以及体例的结构相似度大小判断是否需要将同一主题范畴的标准继续细分为不同类;
[0041 ] (3)提炼体例元素:分析同一类中所有标准的体例特征,提炼出每项标准的体例元素,将此类中不同标准的相似体例元素合并或集成,赋予具有精确性和唯一性的术语名称,即体例元数据名称;
[0042]体例元素建立的原则为:每一类标准的一级体例元素要涵盖此类标准的所有内容,要保证标准知识的完整性;二级、三级以及其他级体例元素要具有共同性,即对于含有相同一级体例元素的标准,应该均能提炼出此一级体例元素下的二级、三级以及其他级体例元素;
[0043](4)建立体例结构表:根据标准类别划分体例元素属性归属,包括行业归属、主体归属、结构归属,分别赋予体例元数据行业名称、体例元数据主体名称、体例元数据结构名称,并分别赋予体例元数据行业代码、体例元数据主体代码、体例元数据结构代码;对于有同义词的体例元素,应补充每一项体例元素据的同义词,增加用户的检索入口,建立体例结构表;[0044](5)进化:对不能满足要求的体力元素重新进行体例特征分析、提炼体例元素、补充同义词、建立体例结构表;
[0045](6)完成体例库的建立:整合集成体例结构表,建立体例库。
[0046]本例的体例元素如表I所示。
[0047]本例的体例表如表2所示。
[0048]表I天然气与管道运行类体例元素
【权利要求】
1.一种天然气与管道技术标准体例库的建立方法,其特征是建立步骤如下: (1)标准专业分类; (2)分析每类标准体例特征,并参与进化; (3)提炼体例元素;提炼体例元素时,补充同义词; (4)建立体例结构表;同时补充同义词; (5)进化,进化后重新参与分析每类标准体例特征分析; (6)体例库建立完成。
2.根据权利要求1所述的天然气与管道技术标准体例库的建立方法,其特征是体例库建立具体方法为: (1)对现有天然气与管道标准按照专业主题范畴分布进行标准专业分类; (2)分析每类标准体例特征:分析同一主题范畴标准的体例特征,根据专业特点以及体例的结构相似度大小判断是否需要将同一主题范畴的标准继续细分为不同类; (3)提炼体例元素:分析同一类中所有标准的体例特征,提炼出每项标准的体例元素,将此类中不同标准的相似体例元素合并或集成,赋予具有精确性和唯一性的术语名称,即体例元数据名称; 体例元素建立的原则为:每一类标准的一级体例元素要涵盖此类标准的所有内容,要保证标准知识的完整性;二级、三级以及其他级体例元素要具有共同性,即对于含有相同一级体例元素的标准,应该均能提炼出此一级体例元素下的二级、三级以及其他级体例元素; (4)建立体例结构表:根据标准类别划分体例元素属性归属,包括行业归属、主体归属、结构归属,分别赋予体例元数据行业名称、体例元数据主体名称、体例元数据结构名称,并分别赋予体例元数据行业代码、体例元数据主体代码、体例元数据结构代码;对于有同义词的体例元素,应补充每一项体例元素据的同义词,增加用户的检索入口,建立体例结构表; (5)进化:对不能满足要求的体力元素重新进行体例特征分析、提炼体例元素、补充同义词、建立体例结构表; (6)完成体例库的建立:整合集成体例结构表,建立体例库。
【文档编号】G06F17/30GK103699539SQ201210366592
【公开日】2014年4月2日 申请日期:2012年9月28日 优先权日:2012年9月28日
【发明者】刘冰, 税碧垣, 刘艳双, 郑娟, 姚学军, 李云杰, 张欣 申请人:中国石油天然气股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1