一种对数据质量进行评价的方法

文档序号:6521877阅读:325来源:国知局
一种对数据质量进行评价的方法
【专利摘要】本发明涉及一种对数据质量进行评价的方法,包括以下步骤:a.建立逻辑对象规则模型,抽象出逻辑处理的要求与规则,建立一种逻辑对象的逻辑规则模型;b.根据逻辑对象规则模型建立逻辑规则描述语言,依照逻辑规则与标准,建立一种进行数据质量评价的逻辑规则描述语言,所述逻辑规则描述语言由逻辑定义、逻辑解析、逻辑执行三部分构成;c.逻辑规则解析,针对逻辑规则描述语言,建立逻辑规则描述语言的规则引擎,完成对逻辑规则描述语言的处理,从而实现规则的逻辑判断,完成对数据质量的评价;逻辑规则引擎包含逻辑规则描述语言解析、正确性检验与规则执行三部分;本发明具有易于维护、易于扩展、适应性强的特点。
【专利说明】一种对数据质量进行评价的方法
【技术领域】
[0001]本发明涉及一种评价方法,尤其是对数据质量进行评价的方法。
【背景技术】
[0002]随着各类业务应用信息系统的推广与应用,越来越多的企业开始关注各种业务数据的质量,并在数据质量的提升方面开始着手开展大量的治理工作;同时,相应的针对各类数据质量的评价考核办法也随着信息系统的应用得到进一步完善,多数单位与企业都针对不同的部门、专业、领域等方面进行了数据质量考核工作。
[0003]同时,随着数据质量考核评价标准与规则的不断变化,现有的考核评价信息系统难以适应这些考核评价办法的变化调整需求。在此背景下,本发明提出一种对数据质量进行评价的方法,利用信息化技术手段,实现能够快速适应各种考核评价的变化。

【发明内容】

[0004]本发明的目的在于提供一种对数据质量进行评价的方法,包括以下步骤:
a、建立逻辑对象规则模型,抽象出逻辑处理的要求与规则,建立一种逻辑对象的逻辑规则模型;
b、根据逻辑对象规则模型建立逻辑规则描述语言,依照逻辑规则与标准,通过分析与抽象,建立一种进行数据质量评价的逻辑规则描述语言,所述逻辑规则描述语言由以下几部分构成,
(1)逻辑定义:按照数据评价的要求,进行逻辑规则的定义;
(2)逻辑解析:通过从逻辑规则库中取出定义的逻辑规则,通过解析,转化成计算机程序所能识别的语言语法,供程序执行,得到结果;
(3)逻辑执行:根据逻辑解析结果,进行执行和计算;
C、逻辑规则解析,针对逻辑规则描述语言,建立逻辑规则描述语言的规则引擎,通过逻辑规则引擎自动完成对逻辑规则描述语言的处理,从而实现规则的逻辑判断,完成对数据质量的评价;逻辑规则引擎包含逻辑规则描述语言解析、正确性检验与规则执行三部分;
(1)逻辑规则描述语言解析:依照逻辑规则,对逻辑规则描述语言进行解析处理;
(2)正确性检验:识别出不合理的解析结果,对逻辑规则设置进行正确性检验分析;
(3)规则执行:通过解析,转化成计算机程序所能识别的语言语法,程序根据逻辑解析结果,进行执行和计算;
所述逻辑规则包括区间型逻辑规则和非区间型逻辑规则。
[0005]本发明的有益效果:
(I)易于维护:将数据质量评价业务逻辑的变化过程用逻辑规则描述语言来描述,与程序独立,便于普通业务人员对各种业务逻辑规则进行动态更新。
[0006](2)易于扩展:本逻辑规则总结了各类数据质量评价实际业务应用中的各种类型的定义和解析,易于扩展。[0007](3)适应性强:通过使用基于数据质量评价逻辑规则定义与解析和计算,能够适应各种考核评价类系统的应用与变化。
【专利附图】

【附图说明】
[0008]图1为本发明的逻辑规则解析处理流程图;
图2为本发明的逻辑规则处理结构图。
【具体实施方式】
[0009]下面结合附图对本发明的进行详细说明。[0010]本发明的目的在于提供一种对数据质量进行评价的方法,包括以下步骤:
a、建立逻辑对象规则模型,抽象出逻辑处理的要求与规则,建立一种逻辑对象的逻辑规则模型;
b、根据逻辑对象规则模型建立逻辑规则描述语言,依照逻辑规则与标准,通过分析与抽象,建立一种进行数据质量评价的逻辑规则描述语言,所述逻辑规则描述语言由以下几部分构成,
(1)逻辑定义:按照数据评价的要求,进行逻辑规则的定义;
(2)逻辑解析:通过从逻辑规则库中取出定义的逻辑规则,通过解析,转化成计算机程序所能识别的语言语法,供程序执行,得到结果;
(3)逻辑执行:根据逻辑解析结果,进行执行和计算;
C、逻辑规则解析,针对逻辑规则描述语言,建立逻辑规则描述语言的规则引擎,通过逻辑规则引擎自动完成对逻辑规则描述语言的处理,从而实现规则的逻辑判断,完成对数据质量的评价;逻辑规则引擎包含逻辑规则描述语言解析、正确性检验与规则执行三部分;
(1)逻辑规则描述语言解析:依照逻辑规则,对逻辑规则描述语言进行解析处理;
(2)正确性检验:识别出不合理的解析结果,对逻辑规则设置进行正确性检验分析;正确性检验包含对逻辑规则进行解析后的结果的逻辑预分析,识别不合理的逻辑规则定义,提供防止设置错误的规则的方法。
[0011](3)规则执行:通过解析,转化成计算机程序所能识别的语言语法,程序根据逻辑解析结果,进行执行和计算;执行规则是使用多重产生式的系统知识表达方式,其基本表达方式为:CASE逻辑对象WHEN逻辑规则THEN (逻辑结论)。
[0012]所述逻辑规则包括区间型逻辑规则和非区间型逻辑规则。
[0013]区间型的逻辑规则主要实现某个数据在某个逻辑区间范围时的处理,这种逻辑的业务描述归纳如下:
1、点类型的区间:这种区间类型允许逻辑判断区间为某个点值时的规则设置与处理,描述如下:当Z=Xl时,取值=Kl (或执行某个计算);Z=X2时,取值=K2 (或执行某个计算);Ζ=Χ3时,取值=Κ3 (或执行某个计算)……;不满足区间时候,取值=KO (或执行某个计算)。这种区间型的处理在系统允许的长度范围类可以无限制扩充。
[0014]2、连续的区间:这种区间类型允许逻辑判断区间为某段连续的值时的规则设置与处理,描述如下:
当Ζ>=Χ1时,取值=Kl (或执行某个计算);Χ1〈Ζ〈=Χ2时,取值=Κ2(或执行某个计算);X2〈Z〈=X3时,取值=K3(或执行某个计算)……;不满足区间时候,取值=KO (或执行某个计算)。这种区间型的处理在系统允许的长度范围类可以无限制扩充。(其中,Χ1〈Χ2〈Χ3〈Χη)
3、非连续的区间:这种区间类型允许逻辑判断区间为多段非连续的值时的规则设置与处理,描述如下:
当Ζ>=Χ1时,取值=Kl (或执行某个计算);Χ2〈Ζ〈Χ4时,取值=Κ2(或执行某个计算);Χ5〈Ζ〈=Χ6时,取值=Κ3(或执行某个计算)……;不满足区间时候,取值=KO (或执行某个计算)。这种区间型的处理在系统允许的长度范围类可以无限制扩充。(其中,Χ1〈Χ2〈Χ3〈…〈Χη)
非区间型的逻辑规则主要实现某个数据在非区间范围时的处理,所有非区间型的逻辑规则,在本文中,统称为“非区间型逻辑规则”;这种逻辑的业务描述归纳如下:
I常数型的逻辑规则:此类逻辑规则处理不需要计算,直接使用逻辑规则中定义数值,如:设定常数为K,则只要采用此逻辑规则配置的程序都自动计算为:取值=K ;如:默认给10分。
[0015]2、计算公式类的逻辑规则:这种逻辑规则满足任意合法的计算公式的定义、解析与计算,如:(Κ1-Χ)/Κ2*Κ3。其中,Κ1,Κ2,Κ3为常量,X为某个变量值,该值由系统计算后得到,再代入本公式计算得出结果。
[0016]3、递减类型 的逻辑规则:这种逻辑规则满足“总数为Ζ,每少X个,扣Y,扣完为止”,少于X个之内不扣,超过X个才扣;通过x、Y、z的关系,得出临界值后,得出某个计算公式,结合2进行定义和计算,得出结果。如:100%得满分,每减少1%扣I分,扣完为止。
[0017]4、递增类型的逻辑规则:这种逻辑规则满足“总数为Z,“每增加X个,扣Y,扣完为止”,增加X之内不扣,超过X小时才扣;通过x、y、z的关系,得出临界值后,得出某个计算公式,结合2进行定义和计算,得出结果。如:0%得满分,每增加1%扣I分,扣完为止。
[0018]本方法主要针对数据质量的评价规则进行定义、解析与处理,常应用于对数据质量的及时性、完整性、准确性以及数据明细的规范性等数据评价需求中,如:数据质量的检查、数据质量评价标准制定以及数据质量评价等方面。
[0019]本发明的基本思想是:依照数据质量评价指标考核体系的规则与标准,抽象出逻辑处理的要求与规则,建立一种满足各种指标考核评价应用的逻辑规则模型,根据此规则模型,设计一种能实现这些逻辑规则模型的描述语言,实现基于自定义的考核评价标准逻辑语言规则定义与解析和计算的方法。通过对各类逻辑规则进行分析与抽象,设计一种基于自定义的考核评价标准逻辑规则描述语言和解析引擎。使实际的业务规则从程序中独立出来,业务逻辑处理规则的变化,只需要对逻辑规则进行定义、调整即可;提供了一种业务人员易理解、维护简便的逻辑规则语言;从而实现了各类考核评价中的各类指标体系的业务应用。
【权利要求】
1.一种对数据质量进行评价的方法,其特征在于,包括以下步骤: a、建立逻辑对象规则模型,抽象出逻辑处理的要求与规则,建立一种逻辑对象的逻辑规则模型; b、根据逻辑对象规则模型建立逻辑规则描述语言,依照逻辑规则与标准,通过分析与抽象,建立一种进行数据质量评价的逻辑规则描述语言,所述逻辑规则描述语言由以下几部分构成, (1)逻辑定义:按照数据评价的要求,进行逻辑规则的定义; (2)逻辑解析:通过从逻辑规则库中取出定义的逻辑规则,通过解析,转化成计算机程序所能识别的语言语法,供程序执行,得到结果; (3)逻辑执行:根据逻辑解析结果,进行执行和计算; C、逻辑规则解析,针对逻辑规则描述语言,建立逻辑规则描述语言的规则引擎,通过逻辑规则引擎自动完成对逻辑规则描述语言的处理,从而实现规则的逻辑判断,完成对数据质量的评价;逻辑规则引擎包含逻辑规则描述语言解析、正确性检验与规则执行三部分; (1)逻辑规则描述语言解析:依照逻辑规则,对逻辑规则描述语言进行解析处理; (2)正确性检验:识别出不合理的解析结果,对逻辑规则设置进行正确性检验分析; (3)规则执行:通过解析,转化成计算机程序所能识别的语言语法,程序根据逻辑解析结果,进行执行和计算。
2.根据权利要求1所述的一种对数据质量进行评价的方法,其特征在于:所述逻辑规则包括区间型逻辑规则和非区间型逻辑规则。
【文档编号】G06F19/00GK103593586SQ201310636049
【公开日】2014年2月19日 申请日期:2013年12月3日 优先权日:2013年12月3日
【发明者】付萍萍, 陶振文, 陈燕青, 洪微明, 余鹏飞 申请人:国家电网公司, 国网江西省电力公司信息通信分公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1