一种工单的分析方法和装置与流程

文档序号:16251590发布日期:2018-12-12 00:04阅读:321来源:国知局
一种工单的分析方法和装置与流程

本发明涉及电力数据技术领域,具体涉及一种工单的分析方法和装置。

背景技术

近年来,中国国家电网公司的电力业务迅速扩张,业扩、配网运维是推动供电企业发展、巩固优质服务、提升业务质量和企业效益的重要手段,因此,业扩、配网运维效率的监察工作有着举足轻重的作用。

监察工作之一是来分析工单所处的状态是正常还是异常。其中,工单是由一个和多个作业环节组成的连续或并行的工作计划,是下达任务、领受任务的依据,业扩、配网运维的各个环节均是按照工单来具体实现的,每一个作业环节均对应有各自的耗时数据。

现有技术中,是由人为凭借经验来评估其中的耗时数据是否超时,若认定为异常,则确定该工单为异常工单,可见,现有方式仅有人为进行分析工单所得到的结果客观性较差,主观随意性大,受人为因素影响严重,导致对工单分析的结果准确性低,进而给监察工作带来不便。



技术实现要素:

有鉴于此,本发明实施例提供一种工单的分析方法和装置,以提高分析工单所处状态的准确性,进而给监察工作提供更有效的依据。

为实现上述目的,本发明实施例提供如下技术方案:

一种工单的分析方法,包括:

获取待分析的多个目标工单;

确定每一个所述目标工单中每一个所述作业环节所对应的影响因素数据;所述影响因素数据用于表征影响该作业环节对应的耗时数据变动的参数;

调用单因素协方差分析算法以及多因素方差分析算法对所述影响因素数据进行分析,得到多个所述目标工单的显著因素数据;所述显著因素数据用于表征所述影响因素数据中影响目标工单的耗时数据变动最大的参数;

确定所述显著因素数据在多个所述目标工单中所述显著因素数据所对应作业环节的耗时数据;

调用多重比较校验算法对所述多个所述耗时数据进行分析,得到极端数据;所述极端数据用于表征使得作业环节的耗时数据最大的数据;

将符合所述极端数据的目标工单确定为异常状态的目标工单;否则,为正常状态的目标工单。

优选的,还包括:

提取所述正常状态的目标工单中每一个作业环节对应的耗时数据;

判断多个所述耗时数据是否符合正态分布;

若符合,则确定所述正常状态的目标工单的最优时限算法为鲁棒异常点检测法;

否则,则确定所述正常状态的目标工单的最优时限算法为箱形图法;

根据确定的最优时限算法对所述正常状态的目标工单进行分析,得到每一个作业环节对应的最优时限分析结果。

优选的,还包括:

判断所述正常状态的目标工单中的作业环节是否超过了该作业环节对应的极端数据;

若是,则确定所述正常状态的目标工单为长耗时工单;

否则,则确定所述正常状态的目标工单为正常耗时工单。

优选的,还包括:

若所述正常状态的目标工单为长耗时工单,则输出长耗时工单的报警信息,以提示用户该目标工单处于长耗时状态。

优选的,还包括:

若所述正常状态的目标工单为正常耗时工单,则确定该正常耗时工单的下一个作业环节所对应的耗时数据是否符合该作业环节对应的极端数据;

若符合,则输出预警信息,以提示该目标工单处于非正常耗时状态。

对应一种工单的分析方法,本发明同时还公开了一种工单的分析装置,包括:

获取单元,用于获取待分析的多个目标工单;

第一确定单元,用于确定每一个所述目标工单中每一个所述作业环节所对应的影响因素数据;所述影响因素数据用于表征影响该作业环节对应的耗时数据变动的参数;

第一分析单元,用于调用单因素协方差分析算法以及多因素方差分析算法对所述影响因素数据进行分析,得到多个所述目标工单的显著因素数据;所述显著因素数据用于表征所述影响因素数据中影响目标工单的耗时数据变动最大的参数;

第二确定单元,用于确定所述显著因素数据在多个所述目标工单中所述显著因素数据所对应作业环节的耗时数据;

第二分析单元,用于调用多重比较校验算法对所述多个所述耗时数据进行分析,得到极端数据;所述极端数据用于表征使得作业环节的耗时数据最大的数据;

判断单元,用于将符合所述极端数据的目标工单确定为异常状态的目标工单;否则,为正常状态的目标工单。

优选的,还包括:

提取单元,用于提取所述正常状态的目标工单中每一个作业环节对应的耗时数据;

最优时限分析结果判断单元,用于判断多个所述耗时数据是否符合正态分布;

若符合,则确定所述正常状态的目标工单的最优时限算法为鲁棒异常点检测法;

否则,则确定所述正常状态的目标工单的最优时限算法为箱形图法;

根据确定的最优时限算法对所述正常状态的目标工单进行分析,得到每一个作业环节对应的最优时限分析结果。

优选的,还包括:

耗时工单判断单元,用于判断所述正常状态的目标工单中的作业环节是否超过了该作业环节对应的极端数据;

若是,则确定所述正常状态的目标工单为长耗时工单;

否则,则确定所述正常状态的目标工单为正常耗时工单。

优选的,还包括:

报警单元,用于若所述正常状态的目标工单为长耗时工单,则输出长耗时工单的报警信息,以提示用户该目标工单处于长耗时状态。

优选的,还包括:

预警单元,用于若所述正常状态的目标工单为正常耗时工单,则确定该正常耗时工单的下一个作业环节所对应的耗时数据是否符合该作业环节对应的极端数据;

若符合,则输出预警信息,以提示该目标工单处于非正常耗时状态。

本发明技术方案中,公开了一种工单的分析方法和装置,所述方法获取待分析的多个目标工单;确定每一个所述目标工单中每一个所述作业环节所对应的影响因素数据;所述影响因素数据用于表征影响该作业环节对应的耗时数据变动的参数;调用单因素协方差分析算法以及多因素方差分析算法对所述影响因素数据进行分析,得到多个所述目标工单的显著因素数据;所述显著因素数据用于表征所述显著因素数据中影响目标工单的耗时数据变动最大的参数;确定所述影响因素数据在多个所述目标工单中所述显著因素数据所对应作业环节的耗时数据;调用多重比较校验算法对所述多个所述耗时数据进行分析,得到极端数据;所述极端数据用于表征使得作业环节的耗时数据最大的数据;将符合所述极端数据的目标工单确定为异常状态的目标工单;否则,为正常状态的目标工单。由于本发明实施例中提供的分析方法所分析的结果是依据单因素协方差分析算法和方差分析算法相结合的方式来分析各种因素对目标工单作业环节耗时数据的影响,具有客观性和准确性,进而给监察工作提供更有效的依据。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图;

图1为本发明实施例公开的一种工单的分析方法的流程示意图;

图2为本发明实施例公开的又一种工单的分析方法的流程示意图;

图3为本发明公开的一种工单的分析装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例中,公开了一种工单的分析方法和装置,其核心思路在于,利用单因素协方差分析算法和方差分析算法、多重比较法、鲁棒异常点检测法和箱图法系统科学的分析出目标工单所处的状态,为工单执行做报警和预警处理做出技术引导。下面对本发明的技术方案进行详细介绍。

参见图1,图1是本发明实施例公开的一种工单的分析方法的流程示意图。

本发明公开的一种工单的分析方法,包括:

s101、获取待分析的多个目标工单;

本发明实施例中,获取多个待分析的目标工单。其中,工单定义为由一个和多个作业环节组成的连续或并行的工作计划。是下达任务、领受任务的依据。每一个工单都具有一个或多个作业环节,每一个作业环节都对应有耗时数据。上述作业环节和耗时数据均可以从数据库或文档中获取,上述数据的保存形式不进行具体限定。

s102、确定每一个所述目标工单中每一个所述作业环节所对应的影响因素数据;所述影响因素数据用于表征影响该作业环节对应的耗时数据变动的参数;

获取了多个目标工单之后,会确定其对应的影响因素数据,其中,影响因素数据是指某种影响工单执行效率的因素指标数据或者其它可能会影响工单执行效率的因素指标数据以及各个指标数据下的执行时间。其中,每一个作业环节可以对应多个影响因素数据。

实际使用中,影响因素数据可以包括:上级部门下达任务时间、下级部门领受任务时间、部门和外部客户沟通时效、工种的类型、执行工单时各个阶段的物资需求时间等。

s103、调用单因素协方差分析算法以及多因素方差分析算法对所述影响因素数据进行分析,得到多个所述目标工单的显著因素数据;所述显著因素数据用于表征所述影响因素数据中影响目标工单的耗时数据变动最大的参数;

本发明实施例中,调用单因素协方差分析算法以及多因素方差分析算法对所述影响因素数据进行分析,得到多个所述目标工单的显著因素数据。利用单因素协方差分析算法和多因素方差分析算法相结合的计算方式,可以对不同类型工单的各个作业环节的耗时数据的影响因素进行分析,从而求得显著因素数据。其中,算法可以包括有算法模型,将数据输入到算法模型中,可以得到相应的结果,其中,算法模型可以看作一个黑盒子,对于里面所执行的具体过程,本发明并不进行赘述。对于算法的详细原理在后续进行介绍。其中,得出的显著因素数据可以包括一个或多个。

实际使用中,在诸如上述因素中,找出哪种因素在计算目标工单的执行时效中所占的影响作用最大,即为显著因素数据。例如,上述影响因素数据中所得到的显著因素数据为部门和外部客户沟通时效。

s104、确定所述显著因素数据在多个所述目标工单中所述显著因素数据所对应作业环节的耗时数据;

求得了显著因素数据后,需要确定该显著因素数据在多个目标工单中各自对应的作业环节的耗时数据。或者说,此步骤为,确定显著因素数据在多个目标工单中的不同水平。其中,水平为各个工单中该显著因素数据所对应的参数对应的具体数据。

实际使用中,确定了显著因素数据为部门和外部客户沟通时效后,在不同目标工单中确定显著因素数据为部门和外部客户沟通时效所对应水平为其所对应的作业环节的耗时数据。例如,工单1中部门和外部门客户沟通时间为a1,工单2中为a2等。

s105、调用多重比较校验算法对所述多个所述耗时数据进行分析,得到极端数据;所述极端数据用于表征使得作业环节的耗时数据最大的数据;

此步骤中,会调用多重比较校验算法进行分析,得到极端数据。为后续步骤中确定工单的有效性做准备。对于多重比较校验算法在后续进行详细介绍。当然,此算法也可以预先建立有对应的数学模型,有输入和输出,将多个耗时数据输入到该数学模型中,就可以输出相应的结果。

还用上面的例子进行解释,则求得极端数据为a1。

s106、将符合所述极端数据的目标工单确定为异常状态的目标工单;否则,为正常状态的目标工单。

此步骤中,会依据上述极端数据来确定目标工单的有效性。若确定为异常状态的目标工单,则此目标工单为无效工单,其它为有效工单。

实际使用中,延续上面的例子可知,确定工单1为异常状态的工单,即无效工单。

通过上述技术方案可以看出,由于本发明实施例中提供的分析方法所分析的结果是依据单因素协方差分析算法和方差分析算法相结合的方式来分析各种因素对目标工单作业环节耗时数据的影响,且是确定出的极端数据确定的出工单执行效率即作业环节耗时数据的影响程度,从而来区分出工单的有效性,具有客观性和准确性,给监察工作提供更有效的依据。

上述技术方案中介绍了对工单有效性的分析方法,进一步的,还需要界定不同类型工单不同作业环节的最优时限,下面对此过程进行详细介绍。

参见图2,图2是本发明实施例中公开的一种工单的分析方法的另一种流程示意图。

在上述实施例的基础上,分析方法还包括:

s107、提取所述正常状态的目标工单中每一个作业环节对应的耗时数据;

基于正常状态的工单,需要确定每一个作业环节对应的最优时限算法,来实现采用科学,严谨的算法计算出业扩各个环节的合理耗时,使得业务各个环节的耗时划分更好的符合各类业扩工单的实际情况。

本发明实施例中,需要提取确定为正常状态的目标工单中每一个作业环节所对应的耗时数据。

s108、判断多个所述耗时数据是否符合正态分布;

若符合,则确定所述正常状态的目标工单的最优时限算法为鲁棒异常点检测法;

否则,则确定所述正常状态的目标工单的最优时限算法为箱形图法;

本发明实施例中,所采用的算法是判断耗时数据是否符合正态分布。利用此种方式可以确定出目标工单作业环节的最优时限算法。采用是否符合正太分布的优势在于,是否符合正态分布,是算法的前提要求。也就是说,采用鲁棒异常点检测算法的前提要求是耗时数据要满足正态分布;采用箱形图算法的前提要求是耗时数据不用满足正态分布。

若符合正态分布,则利用鲁棒异常点检测法确定作业环节的最优时限分析结果,否则,利用箱形图法来确定作业环节的最优时限分析结果。

s109、根据确定的最优时限算法对所述正常状态的目标工单进行分析,得到每一个作业环节对应的最优时限分析结果。

根据上一步骤中所确定的算法,来分析出目标工单每一个作业环节对应的最优时限分析结果。

本发明实施例中,可以从正常状态的工单中,界定不同类型工单不同作业环节的最优时限分析结果。

在得出最优时限分析结果后,分析方法还包括:

判断所述正常状态的目标工单中的作业环节是否超过了该作业环节对应的极端数据;

若是,则确定所述正常状态的目标工单为长耗时工单;

否则,则确定所述正常状态的目标工单为正常耗时工单。

本发明实施例中,会确定出正常耗时工单以及长耗时工单。其中,如果正常状态的目标工单中,作业环节超过了上述实施例中所得出的该作业环节对应的极端数据,则确定该正常状态的目标工单为长耗时工单,否则,为正常耗时工单。

本发明实施例中,可以通过分析各因素对目标工单耗时数据的影响程度来区分出长耗时工单以及正常耗时工单。

本发明实施例中公开的分析方法,还包括:

若所述正常状态的目标工单为长耗时工单,则输出长耗时工单的报警信息,以提示用户该目标工单处于长耗时状态。

若所述正常状态的目标工单为正常耗时工单,则确定该正常耗时工单的下一个作业环节所对应的耗时数据是否符合该作业环节对应的极端数据;

若符合,则输出预警信息,以提示该目标工单处于非正常耗时状态。

本发明实施例中,还会进行报警和预警。

实际使用中,假定工单执行时,部门和外部客户沟通最优时效是3天,在工单执行过程中,3天后,仍沟通无果,则工单进行报警。

假定物资需求时间的最大时间限额为2周。

假定工单执行时,部门和外部客户沟通最优时效是3天,在工单执行过程中,3天后,达到共同目的。但是这时物资需求时间已经到达2周,则对这种工单进行预警。

并且,根据超时情况,可以分级预警。

上述实施例中,介绍了多种算法,其中,算法可以各自对应有预先建立的数学模型,在使用时,按照各自数学模型的输入标准输入相应的参数,就会得出对应的结果,至于运算过程,本发明并不进行过多赘述。下面对本发明中提到的各个算法的原理进行详细介绍。

(1)方差分析算法。

1、无交互作用的双因素方差分析。

a)建立数学模型。

首先假设所有试验数据都来自同一正态总体。

对试验a、b两个因素进行考察,二者试验地位平等。a因素有a个不同水平a1,a2,a3,…,aa;b因素有b个不同水平b1,b2,b3,…,bb。a、b之间无交互作用,对水平的每种组合(aibj)进行一次独立试验,共得ab个试验结果xij(i=1,2,…,a;j=1,2,…,b),试验结果所得数据如表1。

表1方差分析样本数据

其中

设xij是服从正态分布xij~n(μij,σ2)的总体中抽取的样本,假定a,b不存在交互作用。

假定

xij=μij+εij(2)

εij~n(0,σ2)(i=1,2,...,a;j=1,2,...,b),其中μij表示aibj条件下的理论期望值,εij表示随机误差,且相互独立。由(1)得

令αi=μi·-μ,βj=μ·j-μ,称αi为因素ai的第i个水平的效应,βi为因素bj的第j个水平的效应,分别表示因素a、b的各个水平的影响的程度。显然有关系式

将μij进行分解,

μij=μ+αi+βj+(μ-μi-μj+μ);

令δij=μij+μi-μj+μ称为ai和bj的交互效应。而对二因素无重复试验方差分析,假设任意ai和bj之间不存在交互效应,即全部δij=0。这样μij分解式可写为μij=μ+αi+βj。

综上所述,可得二因素无重复试验方差的数学模型

其中μ,σ2,α,β(i=1,2,...,a;j=1,2,...,b),均为未知参数。

b)显著性检验。

对于二因素无交互方差数学模型(1.5)的检验主要是检验两个因素a与b的影响是否显著。

要判断因素a的影响是否显著等价于检验假设

h01:α1=α2=…=αa=0;

要判断因素b的影响是否显著等价于检验假设

h02:β1=β2=…=βb=0;

检验上述假设的基本原理是将总离差平方和分解为各因素导致的离差平方和及随机误差导致的离差平方和。具体方法如下;

设定

由(6)有

其中ssa称为因素a的效应平方和,表示因素a的水平变化引起的影响;ssb称为因素b的效应平方和,表示因素b的水平变化引起的影响;ssb称为误差平方和,表示试验的随机误差影响。总离差分解后的公式为

上式表明总离差的平方和分解为二因素的影响(组间)和随机误差影响(组内)的离差平方和。

在(8)成立时,利用关于正态分布平方和分解的cochran定理。可证明h01与h02分别成立时的ssa,ssb,sse及mss的分布规律。

cochran定理:x1,x2,…,xn为n个相互独立的服从标准正态分布的随机变量,qi(i=1,2,...,k)是某些x1,x2,…,xn线性组合的平方和,其自由度分ssa别为di(i=1,2,…,k)。

如果q1+q2+…+qk~x2(n)且d1+d2+…+dk=n,则qi~x2(i=1,2,…,k),并且q1,q2,…,qk相互独立。

在(8)成立的条件下,利用cochran分解定理,可证明在仅有h01成立时,有

且它们相互独立,从而有统计量;

所以对给定的显著性水平α,查f分布表,可得临界值f[a-1,(a-1)(b-1)],当fa>fa时,拒绝h01,因素a影响显著;反之,则接受h01,因素a影响不显著。

同理,可得在仅有h02成立时因素b影响是否显著的检验方法。

综上所述,可得到二因素无交互影响试验方差分析数学模型显著性假设检验的统计分析结果如表2。

表2无交互影响二因素方差分析统计决断

表2中的各项指标利用表1中的样本数据计算,可使用下面的简捷式

其中,

2、有交互作用的双因素方差分析。

在有交互作用的双因素试验中,因素a、b的不同水平的搭配必须作重复检验。我们可以把交互作用当做一个新因素来处理,即通过把每种搭配aibj看作一个总体xij来进行试验数据的处理。

基本假设①xij相互独立,②xij~n(μij,σ2),

线性统计模型;

可以通过检验下列假设是否成立来判断因素a,b及a×b对试验的结果是否有显著影响。

h01:α1=α2=…=αa=0;

h02:β1=β2=…=βb=0;

h03:(αβ)ij=0(i=1,2,…,b);

仿照单因素方差分析的方法,考察总离差平方和;

ssa为因素a的离差平方和,反映因素a对试验指标的影响。ssb称为因素b的离差平方和,反映因素b对试验指标的影响。ssa×b称为交互作用的离差平方和,反映交互作用a×b对试验指标的影响。sse为误差平方和,反映试验误差对试验指标的影响规律。

若“各因素、各水平及其交互作用的影响无统计意义”的假设成立,则xij~n(μij,σ2);

可推得:

得到表3的有交互作用的双因素试验资料表和表4的有重复的双因素试验方差分析表。

表3有交互作用的双因素试验资料表

表4有重复的双因素试验方差分析表

(2)单因素协方差分析算法。

协方差分析又称带有协变量的方差分析,是将回归分析与方差分析结合起来使用的一种分析方法。其目的是把与因变量y值呈线性关系的自变量x值化成相等后,用于检验多个修正均数间有无差异的方法。在实际方差分析问题中,有些随机因素是很难人为控制的,但它们又会对结果产生显著影响,如果忽略这些因素的影响,则有可能得到不正确的结论。

关于协方差分析的检验方法,大都是采用对因变量y进行较正,剔除协变量x的影响后再对y做方差分析。该发明将从回归分析的角度,通过引入虚拟变量的方式建立了单因素协方差分析的回归模型。

设在一项试验中考察的指标或因变量用y表示,影响指标的一个可控因素为a,它取k个水平,除此还有p个不可控但可观测的变量x1,x2,...,xp可能对指标也有影响,x1,x2,...,xp称为协变量,为了从回归分析的角度检验各租不同水平下因变量y的均值是否有显著差异,现引入虚拟变量

显然有d1+d2+...+dk=1,故单因素协方差模型的可表示为:

y=β0+β1x1+...+βpxp+γ1d1+γ2d2+...+γk-1dk-1+ε,ε~nn(0,σ2in)(13)

若已知在ar水平下独立重复观察nr次(n1+n2+...+nk=n),记水平下第j个协变量指标的第i次观测值;水平下因变量y的第i次观测值;

则模型(13)的样本表达为:

i=(1,1,...,1)'d=(i,d1,d2,...,dk-1)β=(β1,β2,...,βp)';

则模型(14)的矩阵表达为:

y=xβ+dγ+ε,ε~nn(0,σ2in)(15)

从未检验各组不同水平下因变量y的均值是否有显著差异,等价于对此回归模型做局部检验:

h0:γ=0即h0:γ1=γ2=...=γk-1=0。

(2)多重比较算法。

多重比较算法是方差分析算法的一部分,用于多组数据平均数的两两比较分析。主要方法有:lsd(leastsignificantdifference)法,该方法要求组间的标本数必须相同,适用于被指定组间的比较检定;tukey法,这个方法也被称作tukey(a)法,适用于将进行比较的组间完全对等关系的情况,具有相同的标本数是进行检定的前提;

bonferroni法,这个方这是lsd法的改良法,适用于全体组间比较检定;scheffe法,该方法适用于需要进行全体组间比较检定。scheffe技在需要进行比较的个数多于平均值个数时,比bonfedoni法更容易得到明确的判断。另外,在万检定的结果不存在有意差时,也可以判断某组间是否存在有意差等特点;dunnet法,这个方法最适用于有关联的组之间的比较检定;tukey(b)法、duncun法、student-newman-keuls法,这三种方法是指通常的multiplerangetest,多应用于非数量化变数间的检定。

(4)正态分析法和箱图法。

a)正态分布。

基于正态分布或近似正态分布的数据使用正态分步法判断异常值,数值分布在(μ-σ,μ+σ)、(μ-2σ,μ+2σ)、(μ-3σ,μ+3σ)中的置信度为分别为0.6826、0.9544、0.9974。可认为,y的取值几乎全部集中在(μ-3σ,μ+3σ)区间内,超出这个范围的可能性仅占不到0.3%,因此将(μ-3σ,μ+3σ)对应的时间区域作为合理时间区域。

b)箱形图法。

箱形图法对数据没有限制,不需要事先假定数据服从特定的分布形式。在下边缘与异常值之间和上边缘与异常值之间为温和异常值,在异常值之外就属于极端异常值,下边缘与上边缘之间为正常值,且四分位数具有一定的抗耐性,因此将上四分位数和下四分位数所对应的时间作为合理时间区域。

(5)鲁棒异常点检测法。

高斯混合模型(gaussianmixturemodel,gmm)可以看作是由多个高斯分布以不同的权重组合而成。一个gmm表示如下:上述的gmm由m个高斯成分组成,表示第j个高斯成分的权重,均值和协方差。d维特征向量的似然概率为,

这里,是第j个高斯成分的概率,可以用下式表示,

基于gmm对任意数据的模拟能力,本方法利用gmm对统计线损进行拟合,然后利用3σ准则对异常点进行检测。

3σ准则是建立在正态分布的等精度重复测量基础上,而造成奇异数据的干扰或噪声难以满足正态分布。如果一组测量数据中某个测量值的残余误差的绝对值大于3σ,则该测量值为坏值,应剔除。将等于±3σ的误差作为极限误差,对于正态分布的随机误差,落在±3σ以外的概率只有0.27%,它在有限次测量中发生的可能性很小,即可以剔除。

异常点检测算法如下:

为避免异常数据对检测的影响,首先对统计线损率进行中心化和标准化处理,方法如下:

其中,xi,yi分别为中心化和标准化前后的统计线损率。xm为中心化和标准化前统计线损率{xi}的中值,sm为{xi}中值偏差绝对值的中值,计算方法为:sm=1.4826median{|xi-xm|},常数1.4826是为了使sm成为正态分布数据标准差的无偏估计。

使用em算法将中心化和标准化后的统计线损率{yi}拟合成gmm,得到包含m个高斯成分的高斯混合模型λ={wj,μj,sj},j=1,…m。

计算其中μj,sj分别为高斯混合模型中第j个高斯成分的均值和方差。若使得|di|≥3,则xi为异常点;任意高斯成分下,|di|均小于3,则xi为正常点。

对应于上述工单的分析方法,本发明实施例中还公开了一种工单的分析装置。

参见图3,图3是本发明公开的一种工单的分析装置的结构示意图。

所述分析装置包括:

获取单元301,用于获取待分析的多个目标工单;

第一确定单元302,用于确定每一个所述目标工单中每一个所述作业环节所对应的影响因素数据;所述影响因素数据用于表征影响该作业环节对应的耗时数据变动的参数;

第一分析单元303,用于调用单因素协方差分析算法以及多因素方差分析算法对所述影响因素数据进行分析,得到多个所述目标工单的显著因素数据;所述显著因素数据用于表征所述影响因素数据中影响目标工单的耗时数据变动最大的参数;

第二确定单元304,用于确定所述显著因素数据在多个所述目标工单中所述显著因素数据所对应作业环节的耗时数据;

第二分析单元305,用于调用多重比较校验算法对所述多个所述耗时数据进行分析,得到极端数据;所述极端数据用于表征使得作业环节的耗时数据最大的数据;

判断单元306,用于将符合所述极端数据的目标工单确定为异常状态的目标工单;否则,为正常状态的目标工单。

优选的,还包括:

提取单元,用于提取所述正常状态的目标工单中每一个作业环节对应的耗时数据;

最优时限分析结果判断单元,用于判断多个所述耗时数据是否符合正态分布;

若符合,则确定所述正常状态的目标工单的最优时限算法为鲁棒异常点检测法;

否则,则确定所述正常状态的目标工单的最优时限算法为箱形图法;

根据确定的最优时限算法对所述正常状态的目标工单进行分析,得到每一个作业环节对应的最优时限分析结果。

优选的,还包括:

耗时工单判断单元,用于判断所述正常状态的目标工单中的作业环节是否超过了该作业环节对应的极端数据;

若是,则确定所述正常状态的目标工单为长耗时工单;

否则,则确定所述正常状态的目标工单为正常耗时工单。

优选的,还包括:

报警单元,用于若所述正常状态的目标工单为长耗时工单,则输出长耗时工单的报警信息,以提示用户该目标工单处于长耗时状态。

优选的,还包括:

预警单元,用于若所述正常状态的目标工单为正常耗时工单,则确定该正常耗时工单的下一个作业环节所对应的耗时数据是否符合该作业环节对应的极端数据;

若符合,则输出预警信息,以提示该目标工单处于非正常耗时状态。

需要说明的是,本实施例的一种工单的分析装置可以采用上述方法实施例中的一种工单的分析方法实现各模块的功能,实现上述方法实施例中的全部技术方案,其各个模块的功能可以根据上述方法实施例中的方法具体实现,其具体实现过程可参照上述实施例中的相关描述,此处不再赘述。

本发明基于单因素协方差分析算法和方差分析算法相结合的方式进行因素分析,方差分析对各种类型的数据都可以做处理,特别是对于离散型的数据显得特别有效;多因素方差分析可以在一次分析中同时考虑多个因素的显著性,而且方差分析可以考察多个因素的交互作用;单因素协方差分析可以在考虑主要因素显著性的同时考虑其他因素的影响。利用方差分析算法和单因素协方差分析算法可以分析多种因素对工单环节耗时的影响,在此基础上,又加入多重比较法研究因素的不同耗时数据的显著影响,来确定各环节耗时影响因素的极端数据,进而找到极端数据所对应的异常情况工单和正常情况工单,在正常情况工单中,采用鲁棒异常点检测法和箱形图法相结合的方式来计算工单执行效率的最优时限。该发明可以为以后的工单执行做报警和预警处理的技术引导。

为了描述的方便,描述以上系统时以功能分为各种模块分别描述。当然,在实施本申请时可以把各模块的功能在同一个或多个软件和/或硬件中实现。

本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。

还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1