天然气与管道技术标准题录数据库的构建方法

文档序号:6489321阅读:283来源:国知局
天然气与管道技术标准题录数据库的构建方法
【专利摘要】本发明是一种天然气与管道技术标准题录数据库的建立方法,涉及数字数据处理装置和管道系统【技术领域】。它包含以下步骤:(1)确定标准文献主题;(2)判别标准文献归属的体例;(3)标准体例结构分析;(4)划分标准内容为独立条目;(5)条目数据的分析和加工;(6)初步完成数据库建立;(7)条目格式与内容校对修改;(8)完成题录数据库建立。本发明所建立的系统能够实现从“基本字段信息”到“重要技术指标”的高效的标准信息检索。
【专利说明】天然气与管道技术标准题录数据库的构建方法
【技术领域】
[0001]本发明是一种天然气与管道技术标准题录数据库的构建方法,涉及数字数据处理装置和管道系统【技术领域】。
【背景技术】
[0002]随着信息技术与网络技术的发展,信息共享系统已经在各个行业广泛应用,大大提高了各行业工作劳动效率与便捷性,天然气与管道行业在信息化技术应用方面一直走在行业前列,随着业务、技术的进一步发展,仅仅提供文献级别的检索、浏览等功能已经不能满足用户的需求,必须进行更深一步的挖掘与服务,以满足用户需求。目前常用的标准检索方式为“基本字段信息”检索,一般仅能提供对标准名称、主题词进行检索,不能实现对技术指标的精确定位与检索、不同标准中同一技术指标的对比。概括起来,传统检索方式对技术标准的使用效果有以下几方面的局限性。
[0003](I)不能对技术标准内容进行精确检索
[0004]传统数据库检索方式是通过分类、标题、摘要及叙词等手段对标准文献进行题录数据加工,来实现对技术标准与技术法规的检索。但是技术指标一般会分散在不同技术标准与技术法规中,传统的检索方式只能通过题录数据库检索到相关标准,逐一阅读原文技术指标的内容。但是这样的方法很浪费时间,并且难以保障查全率。
[0005](2)不能同时检索到不同标准的技术指标,并实现不同标准的同一技术指标的对比。
[0006]在检索过程中,经常会出现同一产品的技术指标同时存在国际标准、国家标准、行业标准、地方标准和企业标准等不同的标准中,用户经常需要对不同标准中的相同产品的技术指标进行对比研究,这是传统检索方式所不能满足的。
[0007]标准内容提取与展示系统是标准信息检索的最新发展方向。这种新型的检索方式通过对标准技术指标的系统提取和有效组织,能够实现从“基本字段信息”到“重要技术指标”的高效的标准信息检索。对于负责油气管道工程建设的工程项目管理人员、实施人员,可以实现利用关键指标控制管道设计和施工建设;对于油气管道运行操作人员、管理人员,可以实现查询、对比操作参数、方法;对于科研人员,可以实现国内外标准关键指标差异分析、判断技术差异,分析体系内各标准间的协调性。
[0008]CN102591878A公开了一种技术标准内容提取与展示系统的建立方法,《石油规划设计》2011年第22卷第6期“天然气与管道标准信息管理系统开发方案研究”公开了一种天然气与管道标准信息管理系统的开发方案,但该系统仅能进行标准全文检索,无法实现标准内容的提取与展示,也并未公开建立天然气与管道标准题录数据库的方法,其技术并不完善。
[0009]标准内容提取与展示技术是一种新的标准检索技术,目前国外未见以此技术开发的商业数据库。在国内,只有中国标准化研究院将标准内容提取与展示技术初步应用在食品、农产品的国家标准、行业标准中,并建设了相应的提取与展示系统平台,实现对标准内容指标的提取与展示。目前国内外尚没有天然气与管道技术标准内容提取与展示系统的建立方法。
[0010]传统的检索系统数据加工录入方式一般仅仅是对标准名称、标准号、主题词、等基本字段信息及标准全文等进行加工录入。这种传统的数据加工录入无法满足天然气与管道标准内容提取与展示系统数据加工录入要求。要实现标准内容和指标等的深层次提取和展示,必须对本体、体例、指标等数据进行有效组织,形成内在有机联系的系统和统一的检索规则。因此必须研究新的数据组织形式和加工录入方式。

【发明内容】

[0011]本发明的目的是发明一种能够本体、体例、指标深层分解的检索数据进行有效组织、形成内在有机联系的系统和统一的检索规则、完成标准内容提取与展示数据的录入、实现标准内容的深层检索的天然气与管道技术标准题录数据库的构建方法。
[0012]本发明是天然气与管道技术标准内容提取与展示系统中题录数据库的建立方法,天然气与管道技术标准内容提取与展示系统的建立方法如图1所示,主要包括以下步骤:
[0013](I)使用光学字符识别(OCR)工具对天然气与管道标准文献全文进行数字化加工,使标准文献数字化;
[0014](2)建立天然气与管道标准本体库、体例库、题录数据库;
[0015](3)建立天然气与管道标准内容数据库;
[0016](4)开发天然气与管道标准内容提取与展示系统平台,用于标准内容提取、展示与对比。
[0017]天然气与管道标准题录数据库建立包含以下步骤:
[0018](I)确定标准文献主题;
[0019](2)判别标准文献归属的体例;
[0020]( 3)标准体例结构分析;
[0021](4)划分标准内容为独立条目;
[0022](5)条目数据的分析和加工;
[0023]( 6 )初步完成数据库建立;
[0024](7)条目格式与内容校对修改;
[0025]( 8 )完成题录数据库建立。
[0026]所述天然气与管道标准题录数据库建立具体过程为:
[0027](I)确定标准文献主题:有单主体和多主题之分;若是多主题标准,可以拆分成多个单主题处理;
[0028]( 2 )判别标准文献归属体例;
[0029](3)标准体例结构分析,使该体例下的所有标准均可以和该体例完全匹配;
[0030](4)划分标准条目:将标准内容划分成多个独立条目,使得每一个条目成为一个检孛占.[0031](5)条目数据的加工:对于标准中的每一个条目均要进行主体对象、技术指标、提取与展示类、计量单位、内容注释与引用的细致分析;
[0032]主题对象:提炼条目的主题对象为一级指标;当条目无主题对象时,则以整个标准的主题对象作为一级指标;并对主题对象的同义词以及注释进行补充;
[0033]技术指标:将条目中所描述的王题对象属性,作为二级指标;并对技术指标的冋义词以及注释进行补充;
[0034]提取与展示类:当条目中技术指标是按照特定类别进行细分而形成的细化类别,将细化的类别填入提取与展示指标类项目中;
[0035]计量单位:对于数据库不能识别的单位,用语言进行描述;
[0036]内容注释:
[0037]引用条目:
[0038](6)条目格式的校准:完成条目加工的标准,进行格式、内容的校对;
[0039](7)完成题录数据库的建立。
[0040]本发明的有益效果:
[0041]本发明为天然气与管道标准题录数据库的构建方法,通过该方法能够将本体、体例、指标等深层分解的检索数据进行有效组织,形成内在有机联系的系统和统一的检索规贝U,完成标准内容提取与展示数据的录入,最终实现标准内容的提取与展示等深层检索功倉泛。
【专利附图】

【附图说明】
[0042]图1天然气与管道标准内容提取与展示系统建立流程图
[0043]图2天然气与管道标准题录数据库构建流程图
【具体实施方式】
[0044]实施例.以本例来说明本发明的【具体实施方式】并对本发明作进一步的说明。本例是一实验方法,其构成如图2所示。
[0045]本例主要包括以下步骤:
[0046](I)确定标准文献主题:有单主体和多主题之分;若是多主题标准,可以拆分成多个单主题处理;
[0047]( 2 )判别标准文献归属体例;
[0048](3)标准体例结构分析,使该体例下的所有标准均可以和该体例完全匹配;
[0049](4)划分标准条目:将标准内容划分成多个独立条目,使得每一个条目成为一个检孛占.[0050](5)条目数据的加工:对于标准中的每一个条目均要进行主体对象、技术指标、提取与展示类、计量单位、内容注释与引用的细致分析;
[0051]主题对象:提炼条目的主题对象为一级指标;当条目无主题对象时,则以整个标准的主题对象作为一级指标;并对主题对象的同义词以及注释进行补充;
[0052]技术指标:将条目中所描述的主题对象属性,作为二级指标;并对技术指标的同义词以及注释进 行补充;
[0053]提取与展示类:当条目中技术指标是按照特定类别进行细分而形成的细化类别,将细化的类别填入提取与展示指标类项目中;
[0054]计量单位:对于数据库不能识别的单位,用语言进行描述;[0055]内容注释:
[0056]引用条目:
[0057](6)条目格式的校准:完成条目加工的标准,进行格式、内容的校对;
[0058](7)完成题录数据库的建立。
[0059]本例经试用,本方法能够将本体、体例、指标等深层分解的检索数据进行有效组织,形成内在有机联系的系统和统一的检索规则,完成标准内容提取与展示数据的录入,最终实现标准内容的提取与展示等深层检索功能。
【权利要求】
1.一种天然气与管道技术标准题录数据库的建立方法,其特征是它包含以下步骤: (1)确定标准文献主题; (2)判别标准文献归属的体例; (3)标准体例结构分析; (4)划分标准内容为独立条目; (5)条目数据的分析和加工; (6)初步完成数据库建立; (7 )条目格式与内容校对修改; (8)完成题录数据库建立。
2.根据权利要求1所述的天然气与管道技术标准题录数据库的建立方法,其特征是题录数据库建立具体过程为: (I)确定标准文献主题:有单主体和多主题之分;若是多主题标准,可以拆分成多个单主题处理; (2 )判别标准文献归属体例; (3)标准体例结构分析,使该体例下的所有标准均可以和该体例完全匹配; (4)划分标准条目:将标准内容划分成多个独立条目,使得每一个条目成为一个检索占.(5)条目数据的加工:对于标准中的每一个条目均要进行主体对象、技术指标、揭示类、计量单位、内容注释与引用的细致分析; 主题对象:提炼条目的主题对象为一级指标;当条目无主题对象时,则以整个标准的主题对象作为一级指标;并对主题对象的同义词以及注释进行补充; 技术指标:将条目中所描述的主题对象属性,作为二级指标;并对技术指标的同义词以及注释进行补充; 揭示类:当条目中技术指标是按照特定类别进行细分而形成的细化类别,将细化的类别填入揭示指标类项目中; 计量单位:对于数据库不能识别的单位,用语言进行描述; 内容注释: 引用条目: (6)条目格式的校准:完成条目加工的标准,进行格式、内容的校对; (7)完成题录数据库的建立。
【文档编号】G06F17/30GK103699537SQ201210366325
【公开日】2014年4月2日 申请日期:2012年9月28日 优先权日:2012年9月28日
【发明者】刘冰, 吴凯旋, 赵晋云, 马伟平, 王禹钦, 姚学军, 税碧垣, 刘艳双 申请人:中国石油天然气股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1