一种统一数据模型兼容性检测的模型匹配方法及系统与流程

文档序号:29972103发布日期:2022-05-11 11:38阅读:100来源:国知局
一种统一数据模型兼容性检测的模型匹配方法及系统与流程

1.本发明涉及电力系统统一数据模型领域,特别是一种统一数据模型兼容性检测的模型匹配方法及系统。


背景技术:

2.统一数据模型基于公共信息模型(cim),结合实际的业务需求进行扩展,已成为各业务系统进行设计开发、上线运行所必须遵循的标准体系。在统一数据模型标准体系下,为了保障电网的智能、安全、稳定运行,对电网中的信息系统必须进行严格的综合检测与诊断分析,保证信息系统都是符合统一数据模型标准体系的要求,从而实现网内数据交换的统一性、标准性、规范性。
3.因此,需要在全周期对各平台和应用系统的实现、上线、运行和升级的全生命周期进行管控,使得各系统都能够符合统一数据模型规范,促进数据融通、减少数据重复加工和实现数据需求快速响应作用。通过统一数据模型兼容性检测,明确业务应用在设计、建设、交付及运行各阶段需要遵从的管控要求,推进统一数据模型在业务应用和数据中台建设过程中发挥基础支撑和规范管理的作用,为打造企业级的中台服务及应用奠定坚实基础。
4.在进行统一数据模型兼容性检测的过程中,进行模型匹配是检测的基础,需要明确业务系统的模型对应到统一数据模型的哪个模型,在实际匹配过程中,实体类相对较少,实体类之间的匹配相对容易,但实体类下的属性数据量大,实体类的继承及关联也不一致,各业务系统对属性的命名又不统一,这就导致在进行属性的匹配时存在以下问题:
5.(1)由于简单的拼写错误导致无法在对应的统一数据模型属性。
6.(2)命名不一致导致采用名称无法进行完全匹配。
7.(3)有些属性并不在对应实体类下,而在其子类下或关联实体类下,从而无法进行匹配。


技术实现要素:

8.基于此,有必要针对上述传统的方式存在的问题,提供一种统一数据模型兼容性检测的模型匹配方法及系统,以实现属性的快速准确匹配,解决命名不一致导致的匹配问题,实现对实体类下属性的全方位匹配。
9.为此,本发明采用的一种技术方案为:一种统一数据模型兼容性检测的模型匹配方法,其包括以下步骤:
10.分析统一数据模型实体类的关联、继承和派生关系;
11.根据实体类自身及其相关的实体类,列出所有的属性列表;
12.根据属性名称、别名和描述进行模糊匹配。
13.进一步地,所述分析统一数据模型实体类的关联、继承和派生关系的步骤包括:
14.根据实体类的继承关系,分析其继承的父类及父类的继承;
15.根据实体类的派生关系,分析其派生的子类及子类的派生;
16.根据实体类的关联关系,分析其关联的实体类及其继承、派生。
17.进一步地,根据实体类自身及其相关的实体类,列出所有的属性列表的步骤包括:
18.根据实体类下的属性,优先添加到属性列表;
19.根据继承关系,添加继承父类的属性到属性列表;
20.根据派生关系,添加派生子类的属性到属性列表;
21.根据关联关系,添加关联实体类的属性到属性列表。
22.进一步地,所述根据属性名称、别名和描述进行模糊匹配的步骤包括:
23.根据属性名称、别名和描述进行精确匹配,如果匹配不成功进入下一步;
24.根据属性名称、别名和描述进行匹配度计算;
25.匹配度达到设定阈值的属性,根据匹配度进行排序,匹配度高的属性为匹配属性。
26.本发明采用的另一种技术方案为:一种统一数据模型兼容性检测的模型匹配系统,其包括:
27.实体类关系分析单元:分析统一数据模型实体类的关联、继承和派生关系;
28.属性列表列出单元:根据实体类自身及其相关的实体类,列出所有的属性列表;
29.模糊匹配单元:根据属性名称、别名和描述进行模糊匹配。
30.进一步地,所述实体类关系分析单元的具体内容包括:
31.根据实体类的继承关系,分析其继承的父类及父类的继承;
32.根据实体类的派生关系,分析其派生的子类及子类的派生;
33.根据实体类的关联关系,分析其关联的实体类及其继承、派生。
34.进一步地,所述属性列表列出单元的具体内容包括:
35.根据实体类下的属性,优先添加到属性列表;
36.根据继承关系,添加继承父类的属性到属性列表;
37.根据派生关系,添加派生子类的属性到属性列表;
38.根据关联关系,添加关联实体类的属性到属性列表。
39.进一步地,所述模糊匹配单元的具体内容包括:
40.根据属性名称、别名和描述进行精确匹配,如果匹配不成功进入下一步;
41.根据属性名称、别名和描述进行匹配度计算;
42.匹配度达到设定阈值的属性,根据匹配度进行排序,匹配度高的属性为匹配属性。
43.本发明具有的有益效果如下:本发明以快速准确实现业务模型属性匹配为目标,确定业务模型对应的统一数据模型实体类,根据实体类的关联、继承、派生关系,对实体类及相关的实体类下的属性进行排列,根据属性的名称、别名、描述信息进行模糊匹配,实现属性的快速准确匹配;通过模糊匹配,纠正简单拼写错误导致的无法匹配;综合名称、别名、描述信息进行匹配,解决命名不一致导致的匹配问题;分析实体类的关系,实现对实体类下属性的全方位匹配。
附图说明
44.图1为本发明一个实施例的统一数据模型兼容性检测的模型匹配方法流程图;
45.图2为本发明一个实施例的分析统一数据模型实体类的关联、继承、派生关系流程图;
46.图3为本发明一个实施例的根据实体类自身及其相关的实体类,列出所有的属性列表流程图;
47.图4为本发明一个实施例的根据属性名称、别名、描述进行模糊匹配流程图;
48.图5为本发明另一个实施例的统一数据模型兼容性检测的模型匹配系统的结构图。
具体实施方式
49.下面结合说明书附图对本发明的具体实施方式作详细描述。
50.实施例1
51.本发明以快速准确实现业务模型属性匹配为目标,确定业务模型对应的统一数据模型实体类,根据实体类的关联、继承、派生关系,对实体类及相关的实体类下的属性进行排列,根据属性的名称、别名、描述信息进行模糊匹配,实现属性的快速准确匹配。
52.图1示出了一个实施例的统一数据模型兼容性检测的模型匹配方法流程图,包括以下步骤:
53.s10,分析统一数据模型实体类的关联、继承和派生关系。
54.统一数据模型基于cim模型,采用面向对象的方式描述,主要包括实体类、属性、关联等元素。实体类是对现实世界中的对象的抽象,例如变电站,通过一个英文名称来唯一标识;属性是对实体类的细化描述,例如变电站的名称、容量、位置等;关联描述多个实体类之间的关系,例如变电站内包含电压等级区,变电站实体类和电压等级区实体类之间有相应的包含关联;继承是一类特殊的关联,用来描述实体类之间的泛化关系,子类继承父类,与之相对应的是派生,父类派生出子类。
55.根据业务系统的类名定位到统一数据模型中的对应名称的实体类,根据实体类的继承、派生、关联关系等进行分析可能的属性映射。
56.在本实施例中,该步骤主要是根据实体类的关系,分析其相关的实体类;参见图2所示,图2为一个实施例的分析统一数据模型实体类的关联、继承、派生关系流程图,包括如下步骤:
57.s101,根据实体类的继承关系,分析其继承的父类及父类的继承。
58.具体地,根据所使用的统一数据模型,分析实体类的继承父类,如果继承父类也有继承,递归分析继承父类的继承关系,列出实体类所有的上级继承关系相关的实体类。例如实体类classa继承自classb,classb继承自classc,则实体类classa的继承关系相关的实体类包含classb和classc。
59.s102,根据实体类的派生关系,分析其派生的子类及子类的派生。
60.具体地,根据所使用的统一数据模型,分析实体类的派生子类,如果派生子类也有派生,递归分析派生子类的派生关系,列出实体类所有的下级派生关系相关的实体类。例如实体类classa有派生子类classb,classb有派生子类classc,则实体类classa的派生关系相关的实体类包含classb和classc。
61.s103,根据实体类的关联关系,分析其关联的实体类及其继承、派生。
62.具体地,根据所使用的统一数据模型,分析实体类的关联关系,如果关联实体类有继承和派生,也包含关联实体类的继承和派生实体类。例如实体类classa关联实体类
classb,classb继承自classc,classb有派生子类classd,则实体类classa的关联关系相关的实体类包含classb、classc和classd。
63.综上所述,对于步骤s10,根据实体类的关系,分析其相关的实体类,保证下面步骤进行的可行性。
64.s20,根据实体类自身及其相关的实体类,列出所有的属性列表。
65.在本实施例中,主要是根据实体类自身及其相关的实体类,按照顺序添加实体类下的属性,形成具有顺序的属性列表;参见图3所示,图3为一个实施例的根据实体类自身及其相关的实体类,列出所有的属性列表流程图,包括如下步骤:
66.s201,根据实体类下的属性,优先添加到属性列表。
67.具体地,实体类下的属性,作为第一优先级添加到属性列表,在进行属性匹配时,优先从实体类自身的属性开始匹配。
68.s202,根据继承关系,添加继承父类的属性到属性列表。
69.具体地,根据s101分析的实体类的继承关系,添加继承实体类下的属性到属性列表,优先添加实体类的直接继承实体类下的属性。例如实体类classa继承自classb,classb继承自classc,先添加实体类classb下的属性,再添加实体类classc下的属性。
70.s203,根据派生关系,添加派生子类的属性到属性列表。
71.具体地,根据s102分析的实体类的派生关系,添加派生实体类下的属性到属性列表,优先添加实体类的直接派生实体类下的属性。例如实体类classa派生子类classb,classb派生子类classc,先添加实体类classb下的属性,再添加实体类classc下的属性。
72.s204,根据关联关系,添加关联实体类的属性到属性列表。
73.具体地,根据s103分析的实体类的关联关系,添加关联实体类下的属性到属性列表,优先添加实体类的关联实体类下的属性,其次添加关联实体类的继承实体类下的属性。例如classa关联实体类classb,classb继承自classc,classb派生子类classd,先添加实体类classb下的属性,再添加classc下的属性,最后添加classd下的属性。
74.综上所述,对于步骤s20,根据实体类自身及其相关的实体类,按照顺序添加实体类下的属性,形成具有顺序的属性列表,为后续的属性匹配提供基础。
75.s30,根据属性名称、别名、描述进行模糊匹配。
76.在本实施例中,主要是根据属性的名称、别名、描述信息,与s20形成的属性列表进行匹配,选择其中匹配度最高的属性作为匹配属性;参见图4所示,图4为一个实施例的根据属性名称、别名、描述进行模糊匹配流程图,包括如下步骤:
77.s301,根据属性名称、别名、描述进行精确匹配,如果匹配不成功进入下一步;
78.具体地,如果根据名称、别名、描述信息可以精确匹配到属性,则匹配成功,不进行其余步骤,如果匹配不成功进入步骤s302。
79.s302,根据属性名称、别名、描述进行匹配度计算;
80.属性的名称是英文的,进行匹配时将要比较的字符串一个横向(str1)一个纵向(str2)形成一个矩阵,矩阵的取值为对应位置字符串变为相同字符串所需要的最少变化操作步骤:f(i,j)=min{f(i-1,j-1),f(i-1,j),f(i,j-1),f(i-2,j-2)}+1,其中f(i-1,j-1)是通过替换字符的操作步骤,f(i,j-1)是插入字符的操作步骤,f(i-1,j)是删除字符的操作步骤,f(i-2,j-2)是交换字符的操作步骤。最终两个字符串的匹配度为:1-f(i,j)/max
(str1.len,str2.len)。
81.别名和描述是中文的,进行匹配时首先要根据中文语言的特性,将中文的匹配分为发音匹配和字形匹配。
82.在中文的拼写时,采用拼音的方式输入,经常会发生输入拼音相同的错误中文词,针对这部分发音基本相同的中文,将中文首先转换为带声调的拼音字母,再按照英文的匹配度进行计算。
83.五笔码根据中文的字形拆分形成的字母,每个中文不多于4个字母,对于中文中字形类似的文字错误,可以将中文转换为对应的五笔码,再按照英文的匹配度进行计算。
84.分别将中文转换为带声调的拼音和五笔码后进行英文的匹配,取两者平均值作为中文的匹配度,可以很好的解决中文输入中发音类似或书写类似而产生的输入错误情况。
85.s303,匹配度达到设定阈值的属性,根据匹配度进行排序,匹配度最高的属性为匹配属性。
86.具体地,将属性进行匹配度计算,按照匹配度进行排序,形成一个属性列表,匹配度高的属性排在前面。只有匹配度达到设定阈值的属性,例如匹配度超过90%,才认为与属性存在匹配可能。如果所有属性匹配度都达不到阈值,则匹配失败,没有对应的匹配属性。如果存在超过匹配度阈值的属性,以匹配度最高的属性作为匹配属性。如果多个属性的匹配度相同,以属性在属性列表中的顺序为依据,在属性列表中靠前的属性作为匹配属性。
87.综上所述,对于步骤s30,根据属性的名称、别名、描述信息,与s20形成的属性列表进行匹配,选择其中匹配度最高的属性作为匹配属性。
88.本发明的统一数据模型兼容性检测的模型匹配方法,通过模糊匹配,纠正简单拼写错误导致的无法匹配;综合名称、别名、描述信息进行匹配,解决命名不一致导致的匹配问题;分析实体类的关系,实现对实体类下属性的全方位匹配。
89.实施例2
90.图5示出了另一个实施例的统一数据模型兼容性检测的模型匹配系统的结构图,包括以下单元:
91.实体类关系分析单元:分析统一数据模型实体类的关联、继承和派生关系;
92.属性列表列出单元:根据实体类自身及其相关的实体类,列出所有的属性列表;
93.模糊匹配单元:根据属性名称、别名和描述进行模糊匹配。
94.具体地,所述实体类关系分析单元的具体内容包括:
95.根据实体类的继承关系,分析其继承的父类及父类的继承;
96.根据实体类的派生关系,分析其派生的子类及子类的派生;
97.根据实体类的关联关系,分析其关联的实体类及其继承、派生。
98.具体地,所述属性列表列出单元的具体内容包括:
99.根据实体类下的属性,优先添加到属性列表;
100.根据继承关系,添加继承父类的属性到属性列表;
101.根据派生关系,添加派生子类的属性到属性列表;
102.根据关联关系,添加关联实体类的属性到属性列表。
103.具体地,所述模糊匹配单元的具体内容包括:
104.根据属性名称、别名和描述进行精确匹配,如果匹配不成功进入下一步;
105.根据属性名称、别名和描述进行匹配度计算;
106.匹配度达到设定阈值的属性,根据匹配度进行排序,匹配度高的属性为匹配属性。
107.实施例2中未进行详细说明的部分参见实施例1。
108.以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1