监控规则的处理方法和装置、处理器及电子设备与流程

文档序号:30950767发布日期:2022-07-30 07:27阅读:155来源:国知局
监控规则的处理方法和装置、处理器及电子设备与流程

1.本技术涉及金融科技领域,具体而言,涉及一种监控规则的处理方法和装置、处理器及电子设备。


背景技术:

2.在大数据领域,需要对数据质量进行合理性监控。通常是对目标数据配置一些监控规则策略,以保证目标数据的质量。当目标数据符合监控规则时,则目标数据正确,进入下一步目标数据加工任务;当目标数据不符合监控规则时,则目标数据正确数据错误,停止下一步工作。而随着大数据的发展,需要对目标数据设置各类监控规则,例如,数据字段的空值率小于10%、字段枚举值个数等于2等,但是这类监控规则目前无法实现自动化配置,只能通过技术人员基于过往经验进行人工配置。
3.针对相关技术中只能通过人工的方式对目标数据信息进行监控规则的部署工作,导致部署监控规则的效率比较低的问题,目前尚未提出有效的解决方案。


技术实现要素:

4.本技术的主要目的在于提供一种监控规则的处理方法和装置、处理器及电子设备,以解决相关技术中只能通过人工的方式对目标数据信息进行监控规则的部署工作,导致部署监控规则的效率比较低的问题。
5.为了实现上述目的,根据本技术的一个方面,提供了一种监控规则的处理方法。该方法包括:获取待配置监控规则的目标元数据的第一字段信息;计算所述第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值;将相似值最高的初始相似度值作为目标相似度值,并将所述目标相似度值对应的监控规则作为预设监控规则;依据所述目标相似度值和所述预设监控规则,确定所述目标元数据的目标监控规则。
6.进一步地,计算所述第一字段信息与每个监控规则的第二字段信息的相似度,得到多个初始相似度值,包括:计算所述第一字段信息中的第一字段名称和所述第二字段信息中的第二字段名称的相似度,得到相似度值一;计算所述第一字段信息中的第一字段中文描述信息和所述第二字段信息中的第二字段中文描述信息的相似度,得到相似度值二;计算所述第一字段信息中的第一字段类型和所述第二字段信息的第二字段类型的相似度,得到相似度值三;将所述相似度值一,所述相似度值二和所述相似度值三输入线性回归模型中进行计算处理,输出所述初始相似度值。
7.进一步地,计算所述第一字段信息中的第一字段名称和所述第二字段信息中的第二字段名称的相似度,得到相似度值一,包括:将所述第一字段名称按照预设规则分割为多个第一元素;将所述第二字段名称按照所述预设规则分割为多个第二元素,其中,所述第一元素的数量和所述第二元素的数量相同;计算每个第一元素与每个第二元素之间的相似度,得到每个第一元素对应的相似度值集合;将最大相似度值作为每个第一元素的相似度
值;计算所有第一元素的相似度值的平均值,并将所述平均值作为所述相似度值一。
8.进一步地,计算所述第一字段信息中的第一字段类型和所述第二字段信息的第二字段类型的相似度,得到相似度值三,包括:基于字段类型的隐式转换规则,计算所述第一字段类型和所述第二字段类型的相似度,得到相似度值三。
9.进一步地,依据所述目标相似度值和所述预设监控规则,确定所述目标元数据的目标监控规则,包括:获取所述预设监控规则的类型,其中,所述预设监控规则的类型为以下之一:比例类监控规则和阈值类监控规则;若所述预设监控规则的类型为所述比例类监控规则,判断所述目标相似度值是否大于预设数值一;若所述目标相似度值大于所述预设数值一,则将所述预设监控规则确定为所述目标元数据的目标监控规则。
10.进一步地,所述方法还包括:若所述预设监控规则的类型为所述阈值类监控规则,判断所述目标相似度值是否大于预设数值二,其中,所述预设数值二大于所述预设数值一;若所述目标相似度值大于所述预设数值二,则将所述预设监控规则确定为所述目标元数据的目标监控规则。
11.进一步地,在依据所述目标相似度值和所述预设监控规则,确定所述目标元数据的目标监控规则之后,所述方法还包括:依据所述第一字段信息中的第一数据库名称,第一数据表名称和第一字段名称,对所述目标元数据部署所述目标监控规则;在对所述目标元数据部署所述目标监控规则之后,将所述目标元数据与所述目标监控规则的对应关系存储至所述监控规则库中,以更新所述监控规则库。
12.为了实现上述目的,根据本技术的另一方面,提供了一种监控规则的处理装置。该装置包括:获取单元,用于获取待配置监控规则的目标元数据的第一字段信息;计算单元,用于计算所述第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值;选择单元,用于将相似值最高的初始相似度值作为目标相似度值,并将所述目标相似度值对应的监控规则作为预设监控规则;第一确定单元,用于依据所述目标相似度值和所述预设监控规则,确定所述目标元数据的目标监控规则。
13.进一步地,所述计算单元包括:第一计算子单元,用于计算所述第一字段信息中的第一字段名称和所述第二字段信息中的第二字段名称的相似度,得到相似度值一;第二计算子单元,用于计算所述第一字段信息中的第一字段中文描述信息和所述第二字段信息中的第二字段中文描述信息的相似度,得到相似度值二;第三计算子单元,用于计算所述第一字段信息中的第一字段类型和所述第二字段信息的第二字段类型的相似度,得到相似度值三;第四计算子单元,用于将所述相似度值一,所述相似度值二和所述相似度值三输入线性回归模型中进行计算处理,输出所述初始相似度值。
14.进一步地,所述第一计算子单元包括:第一分割模块,用于将所述第一字段名称按照预设规则分割为多个第一元素;第二分割模块,用于将所述第二字段名称按照所述预设规则分割为多个第二元素,其中,所述第一元素的数量和所述第二元素的数量相同;第一计算模块,用于计算每个第一元素与每个第二元素之间的相似度,得到每个第一元素对应的相似度值集合;选择模块,用于将最大相似度值作为每个第一元素的相似度值;第二计算模块,用于计算所有第一元素的相似度值的平均值,并将所述平均值作为所述相似度值一。
15.进一步地,所述第三计算子单元包括:第三计算模块,用于基于字段类型的隐式转换规则,计算所述第一字段类型和所述第二字段类型的相似度,得到相似度值三。
16.进一步地,所述第一确定单元包括:获取子单元,用于获取所述预设监控规则的类型,其中,所述预设监控规则的类型为以下之一:比例类监控规则和阈值类监控规则;判断子单元,用于若所述预设监控规则的类型为所述比例类监控规则,判断所述目标相似度值是否大于预设数值一;确定子单元,用于若所述目标相似度值大于所述预设数值一,则将所述预设监控规则确定为所述目标元数据的目标监控规则。
17.进一步地,所述装置还包括:判断单元,用于若所述预设监控规则的类型为所述阈值类监控规则,判断所述目标相似度值是否大于预设数值二,其中,所述预设数值二大于所述预设数值一;第二确定单元,用于若所述目标相似度值大于所述预设数值二,则将所述预设监控规则确定为所述目标元数据的目标监控规则。
18.进一步地,所述装置还包括:部署单元,用于在依据所述目标相似度值和所述预设监控规则,确定所述目标元数据的目标监控规则之后,依据所述第一字段信息中的第一数据库名称,第一数据表名称和第一字段名称,对所述目标元数据部署所述目标监控规则;更新单元,用于在对所述目标元数据部署所述目标监控规则之后,将所述目标元数据与所述目标监控规则的对应关系存储至所述监控规则库中,以更新所述监控规则库。
19.为了实现上述目的,根据本技术的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的监控规则的处理方法。
20.为了实现上述目的,根据本技术的一个方面,提供了一种电子设备,电子设备包括一个或多个处理器和存储器,存储器用于存储一个或多个处理器实现上述任意一项的监控规则的处理方法。
21.通过本技术,采用以下步骤:获取待配置监控规则的目标元数据的第一字段信息;计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值;将相似值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则;依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则,解决了相关技术中只能通过人工的方式对目标数据信息进行监控规则的部署工作,导致部署监控规则的效率比较低的问题。通过计算目标元数据的第一字段信息与每个监控规则的第二字段信息的相似度,选取最高相似度值对应的预设监控规则,来实现对目标元数据部署监控规则的工作,进而达到了提高部署监控规则的效率的效果。
附图说明
22.构成本技术的一部分的附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
23.图1是根据本技术实施例提供的监控规则的处理方法的流程图;
24.图2是根据本技术实施例提供的可选的监控规则的处理方法的流程图;
25.图3是根据本技术实施例提供的监控规则的处理装置的示意图;
26.图4是根据本技术实施例提供的电子设备的示意图。
具体实施方式
27.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
28.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
29.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
30.下面结合优选的实施步骤对本发明进行说明,图1是根据本技术实施例提供的监控规则的处理方法的流程图,如图1所示,该方法包括如下步骤:
31.步骤s101,获取待配置监控规则的目标元数据的第一字段信息。
32.具体地,在监控规则库中,包括多个监控规则和每个监控规则与其监控元数据的对应关系。那么通过监控规则库中可以确定没有配置监控规则的元数据,即上述目标元数据。然后获取目标元数据的第一字段信息,第一字段信息中至少包括数据库名称、数据表名称、字段名称、字段中文描述信息和字段类型等信息。
33.步骤s102,计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值。
34.具体地,每个监控规则包括数据库名称、数据表名称、字段名称、字段中文描述信息、字段类型、监控规则类型和监控规则算法等信息,即上述第二字段信息。计算第一字段信息与每个监控规则的第二字段信息的相似度,得到多个初始相似度值。
35.步骤s103,将相似值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则。
36.具体地,从所述多个初始相似度值中选取相似度值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则。
37.步骤s104,依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则。
38.综上所述,通过计算目标元数据的第一字段信息与每个监控规则的第二字段信息的相似度,选取最高相似度值对应的预设监控规则,来实现对目标元数据部署监控规则的工作,避免人工部署监控规则,提高了部署监控规则的效率。
39.可选地,在本技术实施例提供的监控规则的处理方法中,计算第一字段信息与每个监控规则的第二字段信息的相似度,得到多个初始相似度值,包括:计算第一字段信息中的第一字段名称和第二字段信息中的第二字段名称的相似度,得到相似度值一;计算第一字段信息中的第一字段中文描述信息和第二字段信息中的第二字段中文描述信息的相似度,得到相似度值二;计算第一字段信息中的第一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值三;将相似度值一,相似度值二和相似度值三输入线性回归模型中进行计算处理,输出初始相似度值。
40.具体地,分别计算第一字段信息中的第一字段名称和第二字段信息中的第二字段
名称的相似度,第一字段信息中的第一字段中文描述信息和第二字段信息中的第二字段中文描述信息的相似度,第一字段信息中的第一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值一,相似度值二和相似度值三。通过线性回归模型计算得到初始相似度值。其中线性回归模型可以采用下述公式计算得到初始相似度值:初始相似度值=0.4*相似度值一+0.3*相似度值二+0.3*相似度值三。
41.通过上述步骤,计算字段名称,字段中文描述信息和字段类型的相似度,能够有效提高确定目标元数据的监控规则的准确性。
42.可选地,在本技术实施例提供的监控规则的处理方法中,计算第一字段信息中的第一字段名称和第二字段信息中的第二字段名称的相似度,得到相似度值一,包括:将第一字段名称按照预设规则分割为多个第一元素;将第二字段名称按照预设规则分割为多个第二元素,其中,第一元素的数量和第二元素的数量相同;计算每个第一元素与每个第二元素之间的相似度,得到每个第一元素对应的相似度值集合;将最大相似度值作为每个第一元素的相似度值;计算所有第一元素的相似度值的平均值,并将平均值作为相似度值一。
43.具体地,大数据开发对字段名称的命名规则一般为:修饰词_原子指标_时间窗口,例如,最近1年交易笔数的命名为“trade_cnt_1y”;当对于多个修饰词时,顺序则由数据开发人员自行定义,例如,最近1年某一支付平台渠道流出他行交易笔数,则可命名为“zfb_out_th_cnt_1y”,也可以命名为“zfb_th_out_cnt_1y”。
44.假设第一字段名称为“zfb_out_th_cnt_1y”,第二字段名称为“zfb_th_out_cnt_1y”那么计算相似度值一的步骤为:
45.步骤一:按照“_”作为分隔符,对第一字段名称和第二字段名称进行分割,对应得出第一元素和第二元素;例如,第一元素为[zfb,out,th,cnt,1y],第二元素为[zfb,th,out,cnt,1y]。步骤二:计算每个第一元素与每个第二元素之间的相似度,并取最大相似度值;例如,计算第一元素zfb到[zfb,th,out,cnt,1y]的相似度分别是[1,0,0,0,0],取最大相似度值则为1;继续计算其它第一元素到每个第二元素相似度,均可以得到最大相似度值均为1。步骤三,计算所有第一元素的相似度值的平均值,并将平均值作为相似度值一。例如,相似度值一为(1+1+1+1+1)/5=1。通过上述步骤,可以准确计算字段名称的相似度值。
[0046]
可选地,在本技术实施例提供的监控规则的处理方法中,计算第一字段信息中的第一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值三,包括:基于字段类型的隐式转换规则,计算第一字段类型和第二字段类型的相似度,得到相似度值三。
[0047]
具体地,字段类型一般分为:整型、浮点型、字符型、日期型、布尔型。基于字段类型的隐式转换规则,短数据类型可以隐式转化成长数据类型,例如,int可以自动转化为bigint,float可以转化为double等。那么在计算相似度值三时,可以认为能够隐式转换的字段类型的相似度值为0.9,不可隐式转换的字段类型的相似度值为0,字段类型相同的相似度为1。通过上述方式,可以快速得到字段类型的相似度值,进而提高部署监控规则的效率。
[0048]
例如,目标元数据的字段名称,字段中文描述信息和字段类型分别为“trade_cnt_1m,最近1月交易笔数,bigint”。第一监控规则中的字段名称,字段中文描述信息和字段类型分别为“trade_amt_1m,最近1月交易金额,decimal”;第二监控规则中的字段名称,字段中文描述信息和字段类型分别为“trade_cnt_1y,最近1年交易笔数,bigint”。通过上述方
法,可以得到目标元数据与第一监控规则的字段名相似度为0.7778,中文描述相似度为0.75,字段类型相似度为0.9,最终相似度为0.8061。目标元数据与第二监控规则的字段名称相似度为0.8333,中文描述相似度为0.875,字段类型相似度为1,最终相似度为0.9333。选取最大的相似度值对应的监控规则作为预设监控规则,即将所述第二监控规则作为预设监控规则。
[0049]
可选地,在本技术实施例提供的监控规则的处理方法中,依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则,包括:获取预设监控规则的类型,其中,预设监控规则的类型为以下之一:比例类监控规则和阈值类监控规则;若预设监控规则的类型为比例类监控规则,判断目标相似度值是否大于预设数值一;若目标相似度值大于预设数值一,则将预设监控规则确定为目标元数据的目标监控规则。
[0050]
具体地,确定预设监控规则的类型,对于不同的类型设置不同的预设数据。监控规则的类型主要为比例类监控规则和阈值类监控规则。对于比例类监控规则,如果计算得到的目标相似度值大于0.8(上述预设数值一),则可以将该预设监控规则确定为目标元数据的目标监控规则。针对不同监控规则的类型,设置不同的判别要求,进一步提高了对目标元数据匹配监控规则的准确性。
[0051]
可选地,在本技术实施例提供的监控规则的处理方法中,该方法还包括:若预设监控规则的类型为阈值类监控规则,判断目标相似度值是否大于预设数值二,其中,预设数值二大于预设数值一;若目标相似度值大于预设数值二,则将预设监控规则确定为目标元数据的目标监控规则。
[0052]
具体地,对于阈值类监控规则,如果计算得到的目标相似度值大于0.95(上述预设数值二),则可以将该预设监控规则确定为目标元数据的目标监控规则。
[0053]
可选地,在本技术实施例提供的监控规则的处理方法中,在依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则之后,该方法还包括:依据第一字段信息中的第一数据库名称,第一数据表名称和第一字段名称,对目标元数据部署目标监控规则;在对目标元数据部署目标监控规则之后,将目标元数据与目标监控规则的对应关系存储至监控规则库中,以更新监控规则库。
[0054]
具体地,根据第一字段信息中的第一数据库名称,第一数据表名称和第一字段名称对目标云数据进行监控规则的部署工作。在部署完监控规则后,将目标元数据与目标监控规则的对应关系记录到监控规则库中,以便后续查询。
[0055]
本技术实施例提供的监控规则的处理方法,通过获取待配置监控规则的目标元数据的第一字段信息;计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值;将相似值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则;依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则,解决了相关技术中只能通过人工的方式对目标数据信息进行监控规则的部署工作,导致部署监控规则的效率比较低的问题。通过计算目标元数据的第一字段信息与每个监控规则的第二字段信息的相似度,选取最高相似度值对应的预设监控规则,来实现对目标元数据部署监控规则的工作,进而达到了提高部署监控规则的效率的效果。
[0056]
图2是根据本技术实施例提供的可选的监控规则的处理方法的流程图,第一步获
取待配置监控规则的目标元数据的第一字段信息;第二步计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度值,得到目标相似度值;第三步确定目标元数据的目标监控规则;第四步部署目标监控规则并更新监控规则库。
[0057]
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0058]
本技术实施例还提供了一种监控规则的处理装置,需要说明的是,本技术实施例的监控规则的处理装置可以用于执行本技术实施例所提供的用于监控规则的处理方法。以下对本技术实施例提供的监控规则的处理装置进行介绍。
[0059]
图3是根据本技术实施例的监控规则的处理装置的示意图。如图3所示,该装置包括:获取单元301,计算单元302,选择单元303和第一确定单元304。
[0060]
获取单元301,用于获取待配置监控规则的目标元数据的第一字段信息。
[0061]
计算单元302,用于计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值。
[0062]
选择单元303,用于将相似值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则。
[0063]
第一确定单元304,用于依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则。
[0064]
本技术实施例提供的监控规则的处理装置,通过获取单元301获取待配置监控规则的目标元数据的第一字段信息;计算单元302计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值;选择单元303将相似值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则;第一确定单元304依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则,解决了相关技术中只能通过人工的方式对目标数据信息进行监控规则的部署工作,导致部署监控规则的效率比较低的问题。通过计算目标元数据的第一字段信息与每个监控规则的第二字段信息的相似度,选取最高相似度值对应的预设监控规则,来实现对目标元数据部署监控规则的工作,进而达到了提高部署监控规则的效率的效果。
[0065]
可选地,在本技术实施例提供的监控规则的处理装置中,计算单元302包括:第一计算子单元,用于计算第一字段信息中的第一字段名称和第二字段信息中的第二字段名称的相似度,得到相似度值一;第二计算子单元,用于计算第一字段信息中的第一字段中文描述信息和第二字段信息中的第二字段中文描述信息的相似度,得到相似度值二;第三计算子单元,用于计算第一字段信息中的第一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值三;第四计算子单元,用于将相似度值一,相似度值二和相似度值三输入线性回归模型中进行计算处理,输出初始相似度值。
[0066]
可选地,在本技术实施例提供的监控规则的处理装置中,第一计算子单元包括:第一分割模块,用于将第一字段名称按照预设规则分割为多个第一元素;第二分割模块,用于将第二字段名称按照预设规则分割为多个第二元素,其中,第一元素的数量和第二元素的数量相同;第一计算模块,用于计算每个第一元素与每个第二元素之间的相似度,得到每个第一元素对应的相似度值集合;选择模块,用于将最大相似度值作为每个第一元素的相似
度值;第二计算模块,用于计算所有第一元素的相似度值的平均值,并将平均值作为相似度值一。
[0067]
可选地,在本技术实施例提供的监控规则的处理装置中,第三计算子单元包括:第三计算模块,用于基于字段类型的隐式转换规则,计算第一字段类型和第二字段类型的相似度,得到相似度值三。
[0068]
可选地,在本技术实施例提供的监控规则的处理装置中,第一确定单元304包括:获取子单元,用于获取预设监控规则的类型,其中,预设监控规则的类型为以下之一:比例类监控规则和阈值类监控规则;判断子单元,用于若预设监控规则的类型为比例类监控规则,判断目标相似度值是否大于预设数值一;确定子单元,用于若目标相似度值大于预设数值一,则将预设监控规则确定为目标元数据的目标监控规则。
[0069]
可选地,在本技术实施例提供的监控规则的处理装置中,该装置还包括:判断单元,用于若预设监控规则的类型为阈值类监控规则,判断目标相似度值是否大于预设数值二,其中,预设数值二大于预设数值一;第二确定单元,用于若目标相似度值大于预设数值二,则将预设监控规则确定为目标元数据的目标监控规则。
[0070]
可选地,在本技术实施例提供的监控规则的处理装置中,该装置还包括:部署单元,用于在依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则之后,依据第一字段信息中的第一数据库名称,第一数据表名称和第一字段名称,对目标元数据部署目标监控规则;更新单元,用于在对目标元数据部署目标监控规则之后,将目标元数据与目标监控规则的对应关系存储至监控规则库中,以更新监控规则库。
[0071]
监控规则的处理装置包括处理器和存储器,上述获取单元301,计算单元302,选择单元303和第一确定单元304等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
[0072]
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现监控规则的确定工作。
[0073]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
[0074]
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行监控规则的处理方法。
[0075]
如图4所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取待配置监控规则的目标元数据的第一字段信息;计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值;将相似值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则;依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则。
[0076]
可选地,计算第一字段信息与每个监控规则的第二字段信息的相似度,得到多个初始相似度值,包括:计算第一字段信息中的第一字段名称和第二字段信息中的第二字段名称的相似度,得到相似度值一;计算第一字段信息中的第一字段中文描述信息和第二字段信息中的第二字段中文描述信息的相似度,得到相似度值二;计算第一字段信息中的第
一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值三;将相似度值一,相似度值二和相似度值三输入线性回归模型中进行计算处理,输出初始相似度值。
[0077]
可选地,计算第一字段信息中的第一字段名称和第二字段信息中的第二字段名称的相似度,得到相似度值一,包括:将第一字段名称按照预设规则分割为多个第一元素;将第二字段名称按照预设规则分割为多个第二元素,其中,第一元素的数量和第二元素的数量相同;计算每个第一元素与每个第二元素之间的相似度,得到每个第一元素对应的相似度值集合;将最大相似度值作为每个第一元素的相似度值;计算所有第一元素的相似度值的平均值,并将平均值作为相似度值一。
[0078]
可选地,计算第一字段信息中的第一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值三,包括:基于字段类型的隐式转换规则,计算第一字段类型和第二字段类型的相似度,得到相似度值三。
[0079]
可选地,依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则,包括:获取预设监控规则的类型,其中,预设监控规则的类型为以下之一:比例类监控规则和阈值类监控规则;若预设监控规则的类型为比例类监控规则,判断目标相似度值是否大于预设数值一;若目标相似度值大于预设数值一,则将预设监控规则确定为目标元数据的目标监控规则。
[0080]
可选地,该方法还包括:若预设监控规则的类型为阈值类监控规则,判断目标相似度值是否大于预设数值二,其中,预设数值二大于预设数值一;若目标相似度值大于预设数值二,则将预设监控规则确定为目标元数据的目标监控规则。
[0081]
可选地,在依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则之后,该方法还包括:依据第一字段信息中的第一数据库名称,第一数据表名称和第一字段名称,对目标元数据部署目标监控规则;在对目标元数据部署目标监控规则之后,将目标元数据与目标监控规则的对应关系存储至监控规则库中,以更新监控规则库。本文中的设备可以是服务器、pc、pad、手机等。
[0082]
本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取待配置监控规则的目标元数据的第一字段信息;计算第一字段信息与监控规则库中的每个监控规则的第二字段信息的相似度,得到多个初始相似度值;将相似值最高的初始相似度值作为目标相似度值,并将目标相似度值对应的监控规则作为预设监控规则;依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则。
[0083]
可选地,计算第一字段信息与每个监控规则的第二字段信息的相似度,得到多个初始相似度值,包括:计算第一字段信息中的第一字段名称和第二字段信息中的第二字段名称的相似度,得到相似度值一;计算第一字段信息中的第一字段中文描述信息和第二字段信息中的第二字段中文描述信息的相似度,得到相似度值二;计算第一字段信息中的第一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值三;将相似度值一,相似度值二和相似度值三输入线性回归模型中进行计算处理,输出初始相似度值。
[0084]
可选地,计算第一字段信息中的第一字段名称和第二字段信息中的第二字段名称的相似度,得到相似度值一,包括:将第一字段名称按照预设规则分割为多个第一元素;将第二字段名称按照预设规则分割为多个第二元素,其中,第一元素的数量和第二元素的数
量相同;计算每个第一元素与每个第二元素之间的相似度,得到每个第一元素对应的相似度值集合;将最大相似度值作为每个第一元素的相似度值;计算所有第一元素的相似度值的平均值,并将平均值作为相似度值一。
[0085]
可选地,计算第一字段信息中的第一字段类型和第二字段信息的第二字段类型的相似度,得到相似度值三,包括:基于字段类型的隐式转换规则,计算第一字段类型和第二字段类型的相似度,得到相似度值三。
[0086]
可选地,依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则,包括:获取预设监控规则的类型,其中,预设监控规则的类型为以下之一:比例类监控规则和阈值类监控规则;若预设监控规则的类型为比例类监控规则,判断目标相似度值是否大于预设数值一;若目标相似度值大于预设数值一,则将预设监控规则确定为目标元数据的目标监控规则。
[0087]
可选地,该方法还包括:若预设监控规则的类型为阈值类监控规则,判断目标相似度值是否大于预设数值二,其中,预设数值二大于预设数值一;若目标相似度值大于预设数值二,则将预设监控规则确定为目标元数据的目标监控规则。
[0088]
可选地,在依据目标相似度值和预设监控规则,确定目标元数据的目标监控规则之后,该方法还包括:依据第一字段信息中的第一数据库名称,第一数据表名称和第一字段名称,对目标元数据部署目标监控规则;在对目标元数据部署目标监控规则之后,将目标元数据与目标监控规则的对应关系存储至监控规则库中,以更新监控规则库。
[0089]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0090]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0091]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0092]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0093]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0094]
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
[0095]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0096]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0097]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0098]
以上仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1