基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统的制作方法

文档序号:6620995阅读:366来源:国知局
基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统的制作方法
【专利摘要】本发明公开了一种基于加权朴素贝叶斯分类器的软件服务质量的监控方法及监控系统,方法通过构造的加权朴素贝叶斯分类器判断软件的QoS属于满足标准类、不满足标准类还是无法判断,训练时设定影响因子组合,影响因子即非软件本身对QoS的影响,计算影响因子组合权值以及先验知识,监控时由分类器得到监控结果,分析、存储并返回评价给数据服务端。系统包括:控制器,采集不同的服务质量声明,向观察器发布不同服务质量所需的数据标准指令,传递需与数据集匹配的QoS标准给训练器,控制采集周期以及频率;数据库汇总分析器的监控结果;服务能力评价模块向数据服务设备返回软件的监控结果和评价结果;还包括观察器、训练器、优化样本集和分析器。
【专利说明】基于加权朴素贝叶斯分类器的软件服务质量监控方法及系 统

【技术领域】
[0001] 本发明涉及一种基于加权朴素贝叶斯分类器的软件服务质量监控方法及系统,尤 其涉及对运行时QoS需求指标动态加权的监控,属于信息【技术领域】。

【背景技术】
[0002] Web服务技术适应于任何类型的Web环境,包括互联网、Intranet以及Extranet, 实现了企业与企业、企业与消费者之间的通信。从Web服务的关键技术来看,Web服务仍具 有很大的研究空间和挑战,其中用户需求中最重要的问题之一就是服务质量(Quality of Service)问题,QoS的好坏是Web服务在商业应用中能否取得成功的关键。在面向服务 (Service-Oriented Architecture)应用十分广泛的今天,软件系统能够动态将一些松奉禹 合并且具有统一接口定义方式的组件(也就是Service)组合构建起来的,然而在复杂多变 的Web环境中,对于第三方服务的依赖会带来许多不确定问题,无法满足QoS需求。因此需 要采用运行时监控技术对其进行监控以保证软件执行的正确性。
[0003] QoS的关键指标如可用性、吞吐量、时延、时延变化(包括抖动和漂移)和丢失等通 常用概率来表示不确定性,当前最科学的表示方法是采用模糊语言,来表示系统的可靠运 行需要监控诊断的特征量估计值,例如"患者通过网络急救中心呼叫得到应答的时间小于 30秒的概率为80%"等。当前的概率监控方法采用假设检验来进行统计,也有基于贝叶斯 因子的监控方法,前者只使用单一概率值评估,实际可执行性差,后者的监控结果出错率有 待降低,更重要的是,现有的方法都忽略了环境对监控结果的影响,不同的环境会影响我们 的概率监控结果,这些环境包括用户的位置,网络,服务器的CPU,RAM,1/0等,例如用户在 不同地区使用同一服务时可能体验不同的QoS。因此,现有的概率监控技术已经无法满足概 率监控的需要。


【发明内容】

[0004] 发明目的:针对现有技术中存在的问题与不足,提供一种新的监控方法以及监控 系统,结合监控环境对监控结果的影响,判断系统运行时行为是否满足系统的QoS属性,使 动态QoS监控系统更加敏感,监控结果更加精确,为自适应,用户选择服务提供决策依据, 从而保证软件系统的安全可靠。
[0005] 技术方案:一种基于加权朴素贝叶斯推断的软件服务质量监控方法,包括如下步 骤:
[0006] 1)根据QoS标准Θ,设定满足QoS标准的类别C(l和不满足QoS标准的类别 Cl ;
[0007] 2)训练已搜集到的样本集,获得不同影响因子组合权值《,以及先验知识Pli ;
[0008] 3)读取运行时的带监控的观测变量组合作为单次样本;cf对单次监控样本进行 预处理,样本预处理为对样本进行缺失值填充以及离散化;
[0009] 4)根据样本影响因子R调用权值表得到R的权值;
[0010] 5)统计二项分布成功率的贝叶斯估计值并判别本次样本使样本集的成功率分布 于(?还是Ci ;
[0011] 6)更新样本先验概率p (Ci);
[0012] 7)调用朴素贝叶斯分类器 c(X)= argmaXqdl^PQilcJPCc,·)}),X=.;xf,xf, xf,...,x&},Xk e {〇, 1}得出结果,其中Ci,i e (〇, l);调用加权朴素贝叶斯公式如下:
[0013] argmaxc,ef;{H//?P(X|Ci)P(C I), ΠΥ/?Ρ(Χ|^)Ρ(^)};
[0014] 由加权朴素贝叶斯分类器以及Harold Jeffrey的Τ解释得到 c(X)= argmax6..ef;{H/iRP(X|C i)P(Ci), Tff^p (X | Cj) P (Cj) },其中 P(xfc|Q)= P,afe(l
[0015] 对于所述Harold Jeffrey对T解释:支持类CQ和支持类Q的比值T,T的取值以 及样本集对分类的影响表1 :
[0016] 表1T值的意义
[0017]

【权利要求】
1. 一种基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其特征在于,所述 方法包括以下步骤: 1) 根据QoS标准Θ,设定满足QoS标准的类别Q和不满足QoS标准的类别Ci ; 2) 训练样本,获得不同影响因子组合权值^以及先验知识Pli ; 3) 读取运行时的观测变量组合作为样本if,对样本进行补全和离散化预处理; 4) 根据样本影响因子R调用权值表得到样本xk的权值 5) 统计二项分布成功率的贝叶斯估计值并判别本次样本使样本集的成功率分布Cp i e (〇, 1); 6) 更新样本先验概率ρ((;); 7) 调用加权朴素贝叶斯分类器得出结果,调用加权朴素贝叶斯公式如下: argmax^dW/^PiXlC^PiCt), TWtRP^C^P^Ci)}·, 8) 定期连续读取变量组合作为样本,对样本进行预处理并存入样本集XHxf xf,xf,...,x&},xke {〇,l},m表示样本总数,重复步骤3)?8)。
2. 如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方法,其 特征在于,对于所述步骤2)和步骤5):引入二项分布的自然共轭先验分布,即贝塔分布,根 据二项分布可靠性分析得到二项分布可靠性为β=^,a、b分别为伯努利参数,这里设定 其分别为1,其中dm = Σ?1 Xi,m为样本总数;β > Θ,代表本次样本的加入使样本集的二项 分布成功率满足QoS标准Θ,即成功率落在Q区域,反之为q,代表本次样本的加入使样本 集的成功率不满足QoS标准,Θ表示监控的要求。
3. 如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方 法,其特征在于,对于所述步骤2):根据tf*idf算法可知,影响因子对分类的权值与影 响因子!~在(;中出现的概率成正比,和影响因子在全部样本中出现的概率成反比,故 M^UNdllRHn^A^yiogCN/nd,&表示影响因子为R且使整个样本集的成功率落在区 域Q的单个样本个数,Nu表示样本落在区域Q的样本总个数,N表示样本总个数,ηκ表示 影响因子为R的样本的总个数。
4. 如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控方 法,其特征在于,对于所述步骤2):我们用Pli表示P (xk = 11 Q),样本Xi的先验概率为 Ρ(?.Κ) = #(1. - 其中Pli为经过在不同环境下进行训练的P(Xk = 1,(;)/Ρ((;) 的平均值。
5. 如权利要求1所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控 方法,其特征在于,对于所述步骤7):由加权朴素贝叶斯分类器以及Harold Jeffrey 的 T 解释得到 c(X)= argmaxCie(;{M//?P(X|C;)P(Q,TW/^XICJPCQ},其中 P(x,Ji:Xf (1 - Pto.)1'
6. -种基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其特征在于,包 括: a) 控制器:用于采集运行时软件的不同服务质量声明,产生不同服务质量所需的数据 集标准,指示观察器搜集所需的对应数据集,指导分析器匹配QoS标准和数据集,并控制采 集周期和频率,数据库汇总分析器结果数据,并将数据交给服务能力评价模块进行分析,最 终得到可以用自然语言向数据服务设备反馈的软件监控结果和评价结果; b) 观察器:用于从数据服务设备端收集所需的服务数据以及影响因子定位,对数据进 行补全和离散化; c) 训练器:将不同的影响因子组合作为监控的外部影响,在该影响下得到的样本集进 行分析,得到影响因子组合权值wT以及先验知识P ki ; d) 分析器:根据样本信息调用先验信息以及影响因子权值表,根据朴素贝叶斯分类模 块得到监控结果,存入监控结果数据库。
7. 如权利要求6所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其 特征在于,所述控制器包括: QoS信息采集模块,用于采集运行时软件的服务声明标准,作为监控标准,产生不同搜 集任务指示数据收集端收集对应数据集;QoS信息采集模块获取服务质量规约,作为机器 可读的监控标准,指导数据收集端进行采集并产生QoS适配标准; 计时器,控制监控任务下观察器采用周期性以及一定频率采集监控对象数据; QoS适配生成模块,根据QoS标准生成需匹配的服务标准给对应的训练器; 评估软件QoS属性模块,综合评估软件服务能力,向数据服务设备返回自然语言描述 的软件服务质量评价; 监控结果数据库,汇总不同QoS的监控结果,传递给评估软件QoS属性模块。
8. 如权利要求6所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其 特征在于,所述观察器,包括: 数据收集器:用于从数据服务设备端采集训练数据和监控数据,训练数据的影响因子 已知,监控数据的影响因子需要影响因子定位模块确定; 数据预处理模块:将影响因子进行缺失补全,对训练数据离散化期望得到更准确的结 果; 影响因子定位模块:定位每一次监控的影响因子。
9. 如权利要求6所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控系统,其 特征在于,所述训练器,包括: 影响因子训练声明模块:提供影响因子组合; 训练信息采集模块:向影响因子参数设置端发送参数设置值,指导数据采集端收集不 同的QoS标准的数据集; 伯努利后验信息统计模块:统计每个样本加入样本集后对样本集成功率改变后的值, 并比较其与QoS标准的关系; 影响因子权值计算模块:根据tf*idf算法得到影响因子组合对分类的权值; 先验知识获取模块:根据伯努利后验信息统计模块得到的结果计算先验知识Pki ; 影响因子权值数据库:存储量化的影响因子权值,供分析器对朴素贝叶斯分类器进行 加权; 训练器中影响因子,包括: 用户影响因子:用户的位置,使用软件的设备,CPU的型号等; 环境影响因子:主要考虑网络负载以及带宽; 服务器端影响因子:在云环境下,指虚拟机的内存大小和计算单元个数等。
10.如权利要求6所述的基于加权朴素贝叶斯分类器的软件服务质量动态监控系统, 其特征在于,所述分析器,包括: QoS信息匹配模块:根据控制器提供的QoS适配标准以及经过预处理分类的数据进行 匹配,存入样本信息库中,并用来计算监控结果; 样本数据库:存放经过预处理的样本; 权值获取模块:根据样本的影响因子组合查找影响因子权值表获取权值; 朴素贝叶斯分类模块:根据样本影响因子R调用影响因子权值表得到样本满足QoS 属性则Xi = 1,调用加权朴素贝叶斯分类器进行监控,将结果存入监控结果数据库中。
【文档编号】G06F21/52GK104102875SQ201410351264
【公开日】2014年10月15日 申请日期:2014年7月22日 优先权日:2014年7月22日
【发明者】张鹏程, 庄媛, 冯钧, 朱跃龙, 万定生, 刘宗磊, 周宇鹏, 肖艳 申请人:河海大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1