评估模型方法和装置与流程

文档序号：11134004阅读：329来源：国知局

本发明涉及计算机技术领域，特别地涉及一种评估模型方法和装置。

背景技术：

在各类数据应用系统或数据仓库中往往存在成千上万个模型，即数据表，其中不同模型的因子或指标都是不同的，例如，不同模型的重要程度通常是不同的。对于因子或指标不一的模型我们通常需要加以区分对待。例如，对重要性较高的模型加以特殊关注，例如例如增加数据监控等，对重要性较低的模型则不太多关注。如何来评估模型的重要性是管理模型工作的一个关键环节。现有技术中，技术人员在模型刚建立时依照个人经验来在合理范围设置不同模型的因子或指标，进而评估模型是否重要，然后给模型添加上“重要模型”、“一般模型”、“非重要模型”等标签。现有技术的操作形式主观，且没有考虑到之后的模型的实际使用情况，评估结果通常不准确。

技术实现要素：

鉴于此，有必要针对传统的主管评估模型不准确的问题，提供一种评估模型方法和装置，可以客观、准确地对模型进行评估。

为达到发明目的，提供一种评估模型方法，所述方法包括：获取模型的多个评估指标和与所述多个评估指标相关联的因子，其中，所述多个评估指标包括模型的使用频率和所述模型的依赖性指数，所述多个评估指标相关联的因子包括模型优势因子和模型重要性因子；根据所述模型的所述使用频率和所述依赖性指数计算所述模型的重要性指数，以及根据所述模型的所述模型优势因子和所述模型重要性因子计算所述模型的稳定性指数，其中，所述重要性指数与所述使用频率正相关，所述重要性指数与所述依赖性指数正相关，所述稳定性指数与所述优势因子正相关，所述稳定性指数与所述重要性因子正相关；根据所述模型的所述重要性指数和所述稳定性指数对所述模型执行分级。

在其中一个实施例中，所述重要性指数的计算公式为：I_i＝R_i+V_i×W，其中I_i表示第i个模型的重要性指数，R_i表示第i个模型的使用频率，V_i表示第i个模型的依赖性指数，W表示权重系数，W为正数，其中，所述权重系数的计算公式为：n表示模型的总数量。

在其中一个实施例中，所述稳定性指数的计算公式为：M_i＝N_i+P_i×U，其中M_i表示第i个模型的稳定性指数，N_i表示第i个模型的优势因子，P_i表示第i个模型的重要性因子，U表示权重系数，其中U为正数。

在其中一个实施例中，所述获取模型的多个评估指标包括：获取所述模型对应的依赖树状结构；遍历所述依赖树状结构获取所述模型的各级子级模型数量；计算所述模型的所有子级模型数量总和，作为所述模型的依赖性指数。

在其中一个实施例中，还包括：根据所述模型的所述重要性指数建立拟合函数，并对所述拟合函数进行存储；以及根据所述模型的所述稳定性指数建立特征函数，并对所述特征函数进行存储。

基于同一发明构思的一种评估模型装置，所述装置包括：获取模块，用于获取模型的多个评估指标和与所述多个评估指标相关联的因子，其中，所述多个评估指标包括模型的使用频率和所述模型的依赖性指数，所述多个评估指标相关联的因子包括模型优势因子和模型重要性因子；计算模块，用于根据所述模型的所述使用频率和所述依赖性指数计算所述模型的重要性指数，以及根据所述模型的所述模型优势因子和所述模型重要性因子计算所述模型的稳定性指数，其中，所述重要性指数与所述使用频率正相关，所述重要性指数与所述依赖性指数正相关，所述稳定性指数与所述优势因子正相关，所述稳定性指数与所述重要性因子正相关；分级模块，用于根据所述模型的所述重要性指数和所述稳定性指数对所述模型执行分级。

在其中一个实施例中，所述获取模块包括：第一获取模块，用于获取所述模型对应的依赖树状结构；遍历模块，用于遍历所述依赖树状结构获取所述模型的各级子级模型数量；第一计算模块，用于计算所述模型的所有子级模型数量总和，作为所述模型的依赖性指数。

在其中一个实施例中，还包括：第一建立与存储模块，用于根据所述模型的所述重要性指数建立拟合函数，并对所述拟合函数进行存储；以及第二建立与存储模块，用于根据所述模型的所述稳定性指数建立特征函数，并对所述特征函数进行存储。

本发明的有益效果：上述评估模型方法和装置，获取模型的多个评估指标和与多个评估指标相关联的因子，其中，多个评估指标包括模型的使用频率和模型的依赖性指数，多个评估指标相关联的因子包括模型优势因子和模型重要性因子；根据模型的使用频率和依赖性指数计算模型的重要性指数，以及根据模型的模型优势因子和模型重要性因子计算模型的稳定性指数，其中，重要性指数与使用频率正相关，重要性指数与依赖性指数正相关，稳定性指数与优势因子正相关，稳定性指数与重要性因子正相关；根据模型的重要性指数和稳定性指数对模型执行分级。上述方法综合考虑了模型的多个指标与因子，能够客观地、准确地判断模型的重要程度的高低以及稳定性的强弱。

附图说明

图1是本发明一个实施例中的评估模型方法的流程示意图；以及

图2是本发明一个实施例中的评估模型装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚明白，以下结合附图及实施例对本发明评估模型方法和装置进行进一步详细说明。应该理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。

在一个实施例中，如图1所示，提供了一种评估模型方法，该方法包括以下步骤：

步骤102，获取模型的多个评估指标和与多个评估指标相关联的因子。其中，多个评估指标包括模型的使用频率和模型的依赖性指数，多个评估指标相关联的因子包括模型优势因子和模型重要性因子。

其中，模型的使用频率反映了模型在单位时间内被使用次数的多寡。通常可以通过数据库的访问日志得到模型的使用次数。具体方法是：解析结构化查询语言SQL(Structured Query Language)语句的执行日志，提取出语句中的模型名称，若某一个模型在SQL语句中被调用一次，则使用次数加一，统计某个模型的30天日均使用次数或者其他预设时间长度内的平均使用次数作为该模型的使用频率；模型的依赖性指数反映了某个模型本身与其他模型之间关联程度的强弱。若一个模型与较多数目其他模型相关联，则该模型的依赖性指数较大，反之较小。模型的依赖性指数有时候也称为依赖数量(Relation nums)。确定模型的依赖性指数的方法可以有多种，本领域技术人员可以灵活选择，此处不进行赘述。

本实施例中，获取模型的多个评估指标包括：获取模型对应的依赖树状结构；遍历依赖树状结构获取模型的各级子级模型数量；计算模型的所有子级模型数量总和，作为模型的依赖性指数。由此，使得评估模型方法具有逻辑合理、适用性强等优点。

步骤104，根据模型的使用频率和依赖性指数计算模型的重要性指数，以及根据模型的模型优势因子和模型重要性因子计算模型的稳定性指数。其中，重要性指数与使用频率正相关，重要性指数与依赖性指数正相关，稳定性指数与优势因子正相关，稳定性指数与重要性因子正相关。

本实施例中，重要性指数的计算公式为：I_i＝R_i+V_i×W，其中I_i表示第i个模型的重要性指数，R_i表示第i个模型的使用频率，V_i表示第i个模型的依赖性指数，W表示权重系数，W为正数，其中，权重系数的计算公式为：n表示模型的总数量。需要说明的是W的数值可以根据经验灵活设置，通常设置其数值大于1。由此，使得评估模型方法具有简便易行等优点。

进一步地，该实施方式中，权重系数W实际上是以数据库中所有模型的平均使用频率除以所有模型的平均依赖性指数得到的数值结果，该W反应了数据库中所有模型的平均情况。由此，使得评估模型方法具有简便易行等优点。进一步的，稳定性指数的计算公式为：M_i＝N_i+P_i×U，其中M_i表示第i个模型的稳定性指数，N_i表示第i个模型的优势因子，P_i表示第i个模型的重要性因子，U表示权重系数，其中U为正数。

步骤106，根据模型的重要性指数和稳定性指数对模型执行分级。

在一个实施例中，还包括：根据模型的重要性指数建立拟合函数，并对拟合函数进行存储；以及根据模型的稳定性指数建立特征函数，并对特征函数进行存储。

本发明提供的评估模型方法，获取模型的多个评估指标和与多个评估指标相关联的因子，其中，多个评估指标包括模型的使用频率和模型的依赖性指数，多个评估指标相关联的因子包括模型优势因子和模型重要性因子；根据模型的使用频率和依赖性指数计算模型的重要性指数，以及根据模型的模型优势因子和模型重要性因子计算模型的稳定性指数，其中，重要性指数与使用频率正相关，重要性指数与依赖性指数正相关，稳定性指数与优势因子正相关，稳定性指数与重要性因子正相关；根据模型的重要性指数和稳定性指数对模型执行分级。上述方法综合考虑了模型的多个指标与因子，能够客观地、准确地判断模型的重要程度的高低以及稳定性的强弱。

为了更加方便与清楚的理解本发明提出的一种评估模型方法，进行以下示例。本发明的保护范围不限于以下示例。例如，数据库中模型A对应的依赖树状结构，遍历该依赖树状结构，发现模型A具有B和C这两个第一子级依赖模型，具有D、E、F、G这四个第二子级依赖模型，还有H、I、J、K、L、M、N、O这八个第三子级依赖模型，因此模型A总共有2+4+8＝14个子级依赖模型，记模型A的依赖性指数为“14”。需要说明的是，还可以预先设置阈值，若某模型的重要性指数与稳定性指数均大于预设的阈值，则该模型属于重要稳定模型，反之为非重要非稳定模型。也可以设置“重要性指数与稳定性指数排在前20％的模型为重要稳定模型，重要性指数与稳定性指数排在后20％的模型为次要次稳定模型，其他模型为普通模型”等规则，来实现对模型分级。

基于同一发明构思，还提供一种评估模型装置，由于此装置解决问题的原理与前述一种评估模型方法相似，因此，该装置的实施可以按照前述方法的具体步骤实现，重复之处不再赘述。

如图2所示，为一个实施例中的一种评估模型装置的结构示意图。该评估模型装置10包括：获取模块200、计算模块400和分级模块600。

其中，获取模块200用于获取模型的多个评估指标和与多个评估指标相关联的因子，其中，多个评估指标包括模型的使用频率和模型的依赖性指数，多个评估指标相关联的因子包括模型优势因子和模型重要性因子；计算模块400用于根据模型的使用频率和依赖性指数计算模型的重要性指数，以及根据模型的模型优势因子和模型重要性因子计算模型的稳定性指数，其中，重要性指数与使用频率正相关，重要性指数与依赖性指数正相关，稳定性指数与优势因子正相关，稳定性指数与重要性因子正相关；分级模块600用于根据模型的重要性指数和稳定性指数对模型执行分级。

本实施例中，获取模块200包括：第一获取模块210(图中未示出)用于获取模型对应的依赖树状结构；遍历模块220(图中未示出)用于遍历依赖树状结构获取模型的各级子级模型数量；第一计算模块230(图中未示出)用于计算模型的所有子级模型数量总和，作为模型的依赖性指数。

进一步的，重要性指数的计算公式为：I_i＝R_i+V_i×W，其中I_i表示第i个模型的重要性指数，R_i表示第i个模型的使用频率，V_i表示第i个模型的依赖性指数，W表示权重系数，W为正数，其中，所述权重系数的计算公式为：n表示模型的总数量。

更进一步地，稳定性指数的计算公式为：M_i＝N_i+P_i×U，其中M_i表示第i个模型的稳定性指数，N_i表示第i个模型的优势因子，P_i表示第i个模型的重要性因子，U表示权重系数，其中U为正数。

在一个实施例中，该评估模型装置10还包括：第一建立与存储模块710(图中未示出)用于根据模型的重要性指数建立拟合函数，并对拟合函数进行存储；以及第二建立与存储模块720(图中未示出)用于根据模型的稳定性指数建立特征函数，并对特征函数进行存储。

本发明提供的评估模型装置，通过获取模块200获取模型的多个评估指标和与多个评估指标相关联的因子，其中，多个评估指标包括模型的使用频率和模型的依赖性指数，多个评估指标相关联的因子包括模型优势因子和模型重要性因子；再通过计算模块400根据模型的使用频率和依赖性指数计算模型的重要性指数，以及根据模型的模型优势因子和模型重要性因子计算模型的稳定性指数，其中，重要性指数与使用频率正相关，重要性指数与依赖性指数正相关，稳定性指数与优势因子正相关，稳定性指数与重要性因子正相关；最后通过分级模块600根据模型的重要性指数和稳定性指数对模型执行分级。上述装置综合考虑了模型的多个指标与因子，能够客观地、准确地判断模型的重要程度的高低以及稳定性的强弱。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的程序可存储于一计算机可读取存储介质中，该程序在执行时，可包括如上述各方法的实施例的流程。其中，所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory，ROM)或随机存储记忆体(Random Access Memory，RAM)等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：曾美枝;
技术所有人：曾美枝;
我是此专利的发明人

上一篇：一种基于数据融合的电网拓扑分析方法与制造工艺
上一篇：一种基于互联网在线教育资源平台系统的制造方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。