一种卷烟技术标准数据处理方法及装置与流程

文档序号:11707736阅读:166来源:国知局
一种卷烟技术标准数据处理方法及装置与流程
本发明涉及卷烟信息
技术领域
,特别是涉及一种卷烟技术标准数据处理方法及装置。
背景技术
:目前,信息的碎片化是当前社会面临的集中问题,数据库是将零碎的信息变为规范化、可视化的手段,目前,烟草行业大量使用了数据库系统,以解决信息共享问题。但是,对于碎片化信息的检索和统计,当前大多数信息数据库系统均无法有效解决。对于烟草行业,各种质量指标、加工要求、操作规范等信息只能采用整合的标准文件的方式进行查询,能够查询到具体内容且能够对指标进行检索和统计的数据库还没有详细应用的实例,如何实现卷烟技术标准数据的检索查询是亟待解决的问题。技术实现要素:本发明的目的是提供一种卷烟技术标准数据处理方法及装置,以实现卷烟技术标准数据的检索查询。为解决上述技术问题,本发明提供一种卷烟技术标准数据处理方法,该方法包括:采用标签方式对卷烟技术标准数据进行分类,分为分类标签、指代标签和指标标签;将分类标签和指代标签相关联,建立分类标签和指代标签之间的第一关联数据库;将指代标签和指标标签相关联,建立指代标签和指标标签之间的第二关联数据库。优选的,所述采用标签方式对卷烟技术标准数据进行分类之前,还包括:将卷烟技术标准数据中的非结构化数据转化为结构化数据。优选的,采用标签方式对卷烟技术标准数据进行分类,分为分类标签、指代标签和指标标签之后,还包括:建立标签数据库,通过标签数据库存储分类标签、指代标签和指标标签。优选的,标签数据库包括分类标签数据库、指代标签数据库和指标标签数据库。本发明还提供一种卷烟技术标准数据处理装置,用于实现上述卷烟技术标准数据处理方法,该装置包括:标签模块,用于采用标签方式对卷烟技术标准数据进行分类,分为分类标签、指代标签和指标标签;第一关联模块,用于将分类标签和指代标签相关联,建立分类标签和指代标签之间的第一关联数据库;第二关联模块,用于将指代标签和指标标签相关联,建立指代标签和指标标签之间的第二关联数据库。优选的,所述标签模块还包括:转换单元,用于将卷烟技术标准数据中的非结构化数据转化为结构化数据。优选的,所述标签模块还包括:数据库建立单元,用于建立标签数据库,通过标签数据库存储分类标签、指代标签和指标标签。优选的,所述标签数据库包括分类标签数据库、指代标签数据库和指标标签数据库。本发明所提供的一种卷烟技术标准数据处理方法及装置,采用标签方式对卷烟技术标准数据进行分类,分为分类标签、指代标签和指标标签;将分类标签和指代标签相关联,建立分类标签和指代标签之间的第一关联数据库;将指代标签和指标标签相关联,建立指代标签和指标标签之间的第二关联数据库。可见,通过对卷烟技术标准内容的数据挖掘,将技术标准内容分割结构化处理后形成分类标签、指代标签、指标标签三类数据,通过构建关联数据库,建立了各种碎片化信息的内在联系,实现了数据存储、查询、统计分析等功能实现了零碎技术信息的整合,当对技术信息进行查询时,由于建立了关联数数据库,可以通过检索分类标签、指代标签和指标标签获得数据的所有信息,获得某个分类标签下所有的技术信息即卷烟技术标准数据,实现卷烟技术标准数据的检索查询。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明所提供的一种卷烟技术标准数据处理方法的流程图;图2为标签式标准数据系统示意图;图3为本发明所提供的一种卷烟技术标准数据处理装置的结构示意图。具体实施方式本发明的核心是提供一种卷烟技术标准数据处理方法及装置,以实现卷烟技术标准数据的检索查询。为了使本
技术领域
的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。请参考图1,图1为本发明所提供的一种卷烟技术标准数据处理方法的流程图,该方法包括:s11:采用标签方式对卷烟技术标准数据进行分类,分为分类标签、指代标签和指标标签;s12:将分类标签和指代标签相关联,建立分类标签和指代标签之间的第一关联数据库;s13:将指代标签和指标标签相关联,建立指代标签和指标标签之间的第二关联数据库。可见,该方法中,通过对卷烟技术标准内容的数据挖掘,将技术标准内容分割结构化处理后形成分类标签、指代标签、指标标签三类数据,通过构建关联数据库,建立了各种碎片化信息的内在联系,实现了数据存储、查询、统计分析等功能实现了零碎技术信息的整合,当对技术信息进行查询时,由于建立了关联数数据库,可以通过检索分类标签、指代标签和指标标签获得数据的所有信息,获得某个分类标签下所有的技术信息即卷烟技术标准数据,实现卷烟技术标准数据的检索查询。基于上述方法,具体的,步骤s11中,采用标签方式对卷烟技术标准数据进行分类之前,还包括:将卷烟技术标准数据中的非结构化数据转化为结构化数据。进一步的,步骤s11中,采用标签方式对卷烟技术标准数据进行分类,分为分类标签、指代标签和指标标签之后,还包括:建立标签数据库,通过标签数据库存储分类标签、指代标签和指标标签。进一步的,标签数据库包括分类标签数据库、指代标签数据库和指标标签数据库。根据烟草行业的统一部署,烟草信息化技术得到了系统性的推进发展。企业标准信息化体系逐渐从后台走向前台,成为企业“创新的动因和归宿”。当前,如oa、erp、mis、mes、pdm等各种信息化技术、信息化平台都在烟草企业中生根发芽,并成为企业管理的重要手段。但是,信息膨胀、信息孤岛、非结构化信息、信息矛盾等问题充斥,成为企业在信息化建设进程中不可避免、难以调和的矛盾。因此需要借助某些手段,对各种信息特别是企业标准信息的内容进行规范,建立各种信息内容之间的联系。本方法保证技术标准的严谨准确,实现对卷烟技术标准信息的规范和关联,完善了系统对各种信息的查询、统计和分析功能,本方法通过采用标签方式建立数据库系统,建立碎片信息的标签,实现了卷烟技术标准的检索、统计功能。详细的,指标标签是用来指代标签的描述信息,它是将技术标准内容分割结构化后的产物,是组成标准的最小组成部分。指标标签组成指标数据库,是所有标准描述内容的集合。表1为指标标签具体内容。表1其中,id采用32位数字字母组成,具备唯一性特征。在卷烟技术信息数据系统构建过程中,指代标签被定义为可以指代一种实物,如一种烟叶、卷烟纸、滤棒或其他原材料,也可以是一种技术要求,如产品设计要求、卷接过程技术要求、包装过程技术要求等。它通过关联指标标签来表征一种实物、一种操作、一种要求或其组合。表2为指代标签具体内容。表2id指代标签名称自描述信息c……322感官质量设计值90.5分。c……h82卷接技术要求84(30+54)×24.2mmc……j13卷接技术要求84(24+60)×24.2mmc……562横螺纹卷烟纸60cu,36g/m2分类标签是根据技术标准的属性进行定义,一般为树形结构的一个节点。分类标签与指代标签关联,确定了指代标签在技术标准中的具体应用。建立如卷烟牌号、原料、材料、卷接要求、包装要求等分类标签,就实现了标准内容的全面覆盖。表3为分类标签具体内容,表4为另一种分类标签内容。表3表4由于三类标签都是来源于卷烟技术标准,标签的物理特征与含义比较清晰,故这三类标签构建时相对简单,只需根据卷烟技术标准应体现出的分类构建分类标签,根据各种技术要求建立指标标签,而指代型标签则需要根据标准构建过程中进行定义,以便于标签的相互关联。应当注意的是,指标标签、指代标签都应是唯一不重复的,这是在查询关联项时实现统计分析功能的关键。具体的,本方法通过对卷烟技术标准内容的数据挖掘,将技术标准内容分割结构化处理后形成分类标签、指代标签、指标标签三类数据。通过构建标签数据库和关联数据库,建立了各种碎片化信息的内在联系,实现了数据存储、查询、统计分析等功能。通过信息重构,可以实现技术标准的再现,并为标准的制定提供科学决策。本方法按照标签的方式对卷烟技术标准进行了分类,分别是分类标签、指代标签和指标标签,分别建立数据库采用标签方式对数据库进行三层定义,实现了零碎技术信息的整合,当对技术信息进行查询时,可以通过检索唯一的标签获得数据的所有信息,包括其指向的分类,也可以通过分类查询,获得某个分类标签下所有的技术信息。通过建立基于标签的卷烟技术标准数据库,实现了卷烟技术标准分类数据化,以及技术标准的重构,方便地实现了标准的查询、统计、修订、存档等功能,保证了标准的唯一性和通用性。其中,关系型数据库是目前较为通用的数据库类型,通过内建关系模型可以呈现较为复杂的数据。但是,同一种关系模型大多只能进行一种关系运算,实现卷烟技术标准这种较为复杂的数据集,关系模型将十分复杂,直接应用必然带来较大的数据冗余。需要通过扩展关系数据库之间的拓扑结构,实现数据表和数据表之间的关联连接,通过以标准信息内生关联建立起来的混合拓扑结构关联模式是本发明采用的信息关联方式。数据的自然分类是构建信息关联最好的方法,想要数据进行自然分类,必须使数据具备一些实体化的特征,方可在数据处理过程中不会由于人为的疏漏导致数据错误或丢失。本文采用标签的形式,将卷烟技术标准的信息虚拟成为三种类型的标签,分别是指标标签、指代标签和分类标签。通过三种标签有条件的相互关联,实现了技术标准的分散式构建,如图2。对于三种标签关联项的查询,则能够实现标准最核心的查询、统计、分析等基本功能。同时,技术标准的构建是基于标签关联的,所以标准的各种操作仅局限于新建标签以及标签的关联。详细的,卷烟技术标准数据是由大量结构化或非结构化数据构成的,它的信息可以是具体的技术指标、描述性的文字要求也可能指向某种实物,既可以是原材料技术要求,也可以是过程加工要求或者半成品、成品质量要求。卷烟技术标准是多种信息混合构成的集合体,非结构化数据或者多层级的结构化数据占据主流。现在卷烟企业都是将各种技术信息糅合形成卷烟的制造标准,但是信息孤立甚至相互矛盾的状况比较突出。标准的信息化到标准内容的信息化是企业信息化技术必须经历的过程,智能整合碎片化的信息实现标准的重构,解决标准的搜索、统计、纠错和自我完善等问题。想要实现这一目的,就必须将所有信息结构化,使之成为计算机可以读取的数据内容。其中,非结构化数据转化为结构化数据是其实现关键。将非结构数据分割重构为结构化数据,以及利用指代、虚拟对非结构数据进行定义,利用文件系统和数据库结合等方式都能将非结构化信息结构化。其中,零碎的没有关联的数据是没有意义的信息,将数据进行定义才使得无意义的内容变成具备具体含义的有用信息。在将各种技术标准内容打散为结构化的数据后,需要通过信息的相互关联为数据进行定义,而进行多重定义则能使信息内容逐渐丰富,从而使数据信息形象化、实体化。模仿现实物品的实物标签,是标签式技术标准数据系统实现的原理。其中,可以将指代型标签作为现实中的实物,粘贴分类标签和指标标签,来表明实物的具体功能及应用。鉴于标签自身属性的特征,所有标签都是围绕指代型标签进行关联,这是本发明的基础。详细的,根据卷烟技术标准数据系统的标签式模型,仅需建立两种类型的数据库,即可实现系统的建立。一种是标签数据库,一种是关联数据库。标签数据库用以储存上述三种类型的标签,关联数据库则通过标签id字段映射的方式关联其中两种标签,实现对标签的定义。本发明保证了标签数据的相对独立性,在对关联数据库的操作时不会影响标准的基础内容,维护更加方便快捷。两种数据库操作基本上集中在新建标签以及标签关联两个方面。其中,在构建完成两种类型的数据库,建立标签并关联后,查询方式变得非常简单。通过标签相互的关联关系可以查询到与之相关的标签,由于这种关联关系是双向的,任意一个标签都可以查询到与之关联的标签,在查询的同时即可实现相应的统计与分析的功能。由于三种标签涵盖了技术标准中各种信息,使得碎片信息的查询变成了可行。如分类标签的设置合理,建立起技术标准为模板的分类模型,通过查询功能完全可以实现技术标准的重构。技术标准由文字信息化向数字信息化是信息化过程中非常艰难的一步,本发明通过将技术标准的信息虚拟构建成分类标签、指代标签、指标标签,通过标签的关联实现了标准内容信息化,解决了碎片信息的存储、查询、统计分析等功能。标签式标准系统是基于技术标准数据挖掘构建的,将非结构化数据结构化,建立的关联数据体系,能够实现产品技术标准的重构。请参考图3,图3为本发明提供的一种卷烟技术标准数据处理装置,用于实现上述卷烟技术标准数据处理方法,该装置包括:标签模块101,用于采用标签方式对卷烟技术标准数据进行分类,分为分类标签、指代标签和指标标签;第一关联模块102,用于将分类标签和指代标签相关联,建立分类标签和指代标签之间的第一关联数据库;第二关联模块103,用于将指代标签和指标标签相关联,建立指代标签和指标标签之间的第二关联数据库。可见,该装置中,通过对卷烟技术标准内容的数据挖掘,将技术标准内容分割结构化处理后形成分类标签、指代标签、指标标签三类数据,通过构建关联数据库,建立了各种碎片化信息的内在联系,实现了数据存储、查询、统计分析等功能实现了零碎技术信息的整合,当对技术信息进行查询时,由于建立了关联数数据库,可以通过检索分类标签、指代标签和指标标签获得数据的所有信息,获得某个分类标签下所有的技术信息即卷烟技术标准数据,实现卷烟技术标准数据的检索查询。基于上述装置,具体的,标签模块还包括:转换单元,用于将卷烟技术标准数据中的非结构化数据转化为结构化数据。进一步的,标签模块还包括:数据库建立单元,用于建立标签数据库,通过标签数据库存储分类标签、指代标签和指标标签。进一步的,标签数据库包括分类标签数据库、指代标签数据库和指标标签数据库。以上对本发明所提供的一种卷烟技术标准数据处理方法及装置进行了详细介绍。本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本
技术领域
的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1