一种信息整合的质量评估方法

文档序号:10471141阅读:499来源:国知局
一种信息整合的质量评估方法
【专利摘要】一种信息整合的质量评估方法,它以异构系统中信息实体的关键属性和名称关键词为基准,对异构系统间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;所述的对象一致性检查主要检查异构系统同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致。
【专利说明】
一种信息整合的质量评估方法
技术领域
[0001]本发明涉及一种可用于异构信息系统间基础信息整合过程中信息质量评估方法,它依据异构信息系统间基础信息关键属性信息差异来评估信息融合质量情况,主要用于信息系统的数据融合。
【背景技术】
[0002]由于异构系统之间存在数据颗粒度、信息维护规范、信息的完整存在差异,信息融合的难度非常高,融合后的信息质量好坏是异构系统间信息融合成效的重要标准,但融合后的信息质量核查和评估还没有一套行之有效的方法,只能通过简单的信息比对来判别异构系统间的信息实体是否一致,大部分还是在融合后信息再利用过程中发现存在的数据质量问题,这种事后再发现数据质量问题的方法,虽然对数据质量提升提供了一种途径,但是数据质量的提升周期非常漫长,也直接影响了信息融合的有效价值。

【发明内容】

[0003]本发明的目的在于克服现有技术存在的不足,而提供一种主要是为整合后的基础信息质量检查提供科学的评估方法,对融合后的信息进行数据质量检查,并利用检查结果开展针对性的数据治理和完善的信息整合质量评估方法。
[0004]本发明的目的是通过如下技术方案来完成的,一种信息整合的质量评估方法,该方法是:以异构系统中信息实体的关键属性和名称关键词为基准,对异构系统间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;所述的对象一致性检查主要检查异构系统同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致;
所述的属性一致性检查是从表示同一信息实体的关键属性入手,比对关键属性的信息是否一致,通过属性一致性检查可以发现异构系统间的信息维护差异及信息完整性,即对象符合的信息实体可能存在关键属性不一致的情况,需要在源业务系统中完善相应的相关信息,也可以间接发现同一信息实体表示的对象是否是同一个;
结合对象一致性检查和属性一致性检查两个维度的结果按权重计算出各类信息类别的信息融合质量。
[0005]本发明根据不符合字符数量累加得出不准确距离;根据字符符合度和不准确距离两个指标来衡量信息实体的对象是否一致;
所述的比对关键属性的信息是否一致,其中所述的关键属性包括电网设备台账中的电压等级、所属变电站、线路长度、容量。
[0006]本发明可以对信息融合的数据质量进行快速科学评估,在异构系统信息融合过程中及时发现问题数据,及时修正问题数据,与传统事后核查的方式相比,所花费的大力人力成本和时间成本大大减少,数据质量提升更加直接,数据的可信度更高。
【附图说明】
[0007]图1是本发明所述对象一致性检查的示意图。
【具体实施方式】
[0008]下面将结合附图及具体实施例对本发明作详细的介绍:本发明所述的一种信息整合的质量评估方法,该方法是:以异构系统中信息实体的关键属性和名称关键词为基准,对异构系统间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;所述的对象一致性检查主要检查异构系统同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致;
所述的属性一致性检查是从表示同一信息实体的关键属性入手,比对关键属性的信息是否一致,通过属性一致性检查可以发现异构系统间的信息维护差异及信息完整性,即对象符合的信息实体可能存在关键属性不一致的情况,需要在源业务系统中完善相应的相关信息,也可以间接发现同一信息实体表示的对象是否是同一个;
结合对象一致性检查和属性一致性检查两个维度的结果按权重计算出各类信息类别的信息融合质量。
[0009]本发明所述根据不符合字符数量累加得出不准确距离;根据字符符合度和不准确距离两个指标来衡量信息实体的对象是否一致;
所述的比对关键属性的信息是否一致,包括电网设备台账中的电压等级、所属变电站、线路长度、容量。
[0010]实施例:本发明在“输变配业务电能质量监测分析与应用”中提出并应用。在输配电运行质量数据融合前期发现各业务系统的基础台账差异非常大,通过简单的名称匹配自动对应方式和人工逐条对应方式效果不理想,对应错误率较高,需要投入更多的人力物力对这部分数据进行校核。通过该发明构建了电网基础台账整合数据质量监控信息化工具,实时评估各类基础台账信息的整合质量。应用本发明后,使得基础台账整合的工作周期缩短了 50%左右,数据准确性也显著提高,经测算,各类基础数据的综合准确率达到了 98%以上。
[0011]图1所示是本发明所述对象一致性检查的示意图,通过双向逐字比对和关键字比对得出信息符合度和信息不准确距离,再根据两个指标得出相关信息实体的关联程度;如系统A:海新丝织有限公司,系统B:海宁新海新纺织有限公司,两系统的不准确距离如图所示,符合度为75% ;而当另一状态下,系统A:变为海新纺织有限公司,它与系统B:海宁新海新纺织有限公司的不准确距离如图所示,两系统的符合度为100%。
【主权项】
1.一种信息整合的质量评估方法,该方法是:以异构系统中信息实体的关键属性和名称关键词为基准,对异构系统间的信息实体进行全信息双向符合度检查,主要包括对象一致性检查和属性一致性检查两部分;其特征在于所述的对象一致性检查主要检查异构系统同一信息实体的是否表示同一个对象,通过信息实体名称进行双向逐字比对,计算出两边一致的字符数量,并给出信息符合度,符合度过低的说明存在疑似对象不一致; 所述的属性一致性检查是从表示同一信息实体的关键属性入手,比对关键属性的信息是否一致,通过属性一致性检查可以发现异构系统间的信息维护差异及信息完整性,即对象符合的信息实体可能存在关键属性不一致的情况,需要在源业务系统中完善相应的相关信息,也可以间接发现同一信息实体表示的对象是否是同一个; 结合对象一致性检查和属性一致性检查两个维度的结果按权重计算出各类信息类别的信息融合质量。2.根据权利要求1所述的信息整合的质量评估方法,其特征在于所述根据不符合字符数量累加得出不准确距离;根据字符符合度和不准确距离两个指标来衡量信息实体的对象是否一致; 所述的比对关键属性的信息是否一致,包括电网设备台账中的电压等级、所属变电站、线路长度、容量。
【文档编号】G06F17/30GK105824847SQ201510010016
【公开日】2016年8月3日
【申请日】2015年1月9日
【发明人】吴国威, 周辉
【申请人】国网浙江省电力公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1