一种软件成本置信区间预测方法及系统的制作方法

文档序号:6552787阅读:448来源:国知局
专利名称:一种软件成本置信区间预测方法及系统的制作方法
技术领域
本发明涉及一种基于软件成本测定,预测出软件成本置信区间的方法和系统,属于计算机软件开发技术领域。
背景技术
软件项目成本的测定对于任何一个公司,组织进行投资决策,资源协调具有非常重要的意义。软件项目可行性分析,成本计划和进度计划以及风险管理等,均建立在各个阶段的成本测定上。因此软件项目的成本测定是软件项目管理研究的重要问题。目前软件成本测定研究工作主要基于软件成本测定的鼻祖Boehm提出了 CoCoMol 和CoCoMoII模型effort = SIZEb *(Y\EM,)
i
5
b+^^ 17effort = a * SIZE * EM1)
i求解该模型主要使用回归算法获得a和b的值。在此基础上发展出了一系列cocomo家族的测定方法C0INC0M0,DBA C0C0M0, C0QUALM0 iDAVE, C0PLIM0、C0PSEM0、C0RADM0、C0PR0M0、C0C0TS,C0SYSM0, C0S0SIM0等。于此同时还有使用cocomo数据,将各类已经成熟的机器学习模型移植过来,如神经网络,SVR, CART,casebase,专家判定法等方法进行软件成本测定。研究人员和项目管理者最关心的则是,如何选择最适合自己数据的模型?这涉及到一个目前有个研究最热的问题模型精确度的比较。评测模型的精度指标通常是基于 MREmagnitude relative erro,相对误差绝对值),如 MMRE (MRE 的样本,均值),PRED (N) (averagepercentage of estimates that were within N percent of the actual values,估算结果在实际结果N个百分点内的平均百分比).和std_MRE (MRE的方差)。计算公式如下
predicted . - actual t
权利要求
1.一种软件成本置信区间预测方法,包括步骤1)数据预处理模块从项目管理数据库获取已知软件项目过程数据和成本信息,按照每一行为一项软件过程数据,经过数据预处理,通过配置项指定各个过程数据和成本信息在第几列,形成数据矩阵X ;成本信息形成列向量Y ;2)数据抽样模块从矩阵X、Y中抽取数据,按照成本测定模型的配置参数,输入核心模型模块中的一测定模型,由测定模型训练出模型参数,并输入待测的软件过程数据,计算出成本测定值Y’ ;3)区间计算模块调用区间预测算法模块,根据测定值Y’和已知成本值Y计算软件成本的置信区间,获得预测区间。
2.如权利要求1所述的预测方法,其特征在于,所述步骤1)数据矩阵X每一行包括各个驱动因子和软件规模,其中软件规模的值是经过log运算处理后的值。
3.如权利要求1所述的预测方法,其特征在于,所述步骤1)成本信息经过log运算处理后形成列向量Y。
4.如权利要求1所述的预测方法,其特征在于,所述步骤幻核心模型模块包括多个成本测定模型,按照以下方法进行模型比较,选定成本测定模型4-1)切分数据矩阵X和Y,抽取N对作为训练集合,抽取N对作为测试集合;4-2)每一对训练集合,使用加正则项的最小二乘,并计算beta估算值的协方差矩阵, 获得成本测定模型参数如下β a2mcdv0).994-3)使用N个测试集合和获得的N对参数#,斤2和05H勿,计算获得N个MMRE,PRED, var(MRE),4-4)使用比较算法,选取最优一组参数,作为模型参数保存。
5.如权利要求1所述的预测方法,其特征在于,所述步骤3)区间预测算法包括基于回归模型的区间预测方法和基于直方图的区间预测方法。
6.如权利要求1所述的预测方法,其特征在于,所述基于回归模型的区间预测方法为计算已有软件成本值Y和测定值Y’之间差值的方差;按照所得的差值的方差计算软件成本的置信区间,获得预测的区间。
7.如权利要求1所述的预测方法,其特征在于,所述基于直方图的区间预测方法为计算已有软件成本值Y和测定值Y’之间的相对误差或者相对误差绝对值;在相对误差的直方图上,指定置信度C,截取对称的中间C部分,在相对误差绝对值直方图上截取前C部分,保留边界值p_up和p_down,获得预测的区间。
8.一种软件成本置信区间预测系统,其特征在于,包括数据预处理模块,用于从项目管理数据库获取已知软件项目过程数据和成本信息,按照每一行为一项软件过程数据,经过数据预处理,通过配置项指定各个过程数据和成本信息在第几列,形成数据矩阵X ;成本信息形成列向量Y ;数据抽样模块用于从X、Y矩阵中抽取数据,输入核心模型模块进行训练;核心模型模块包括不同模型和训练算法,将输入的X、Y矩阵数据训练出选用模型的参数,并计算出成本的测定值;区间计算模块利用成本测定值和已有成本值,根据置信区间算法计算最终的预测区间。
9.如权利要求8所述的系统,其特征在于,还包括模型比较模块,用于比较核心模型模块中包括模型的精确度。
10.如权利要求8所述的系统,其特征在于,还包括命中率计算模块用于计算成本实际值落入预测区间的命中率;图形化显示模块,用于将预测区间以图形化显示。
全文摘要
本发明提供了一种软件成本置信区间预测方法和系统,包括从项目管理数据库获取已知软件项目过程数据和成本信息,按照每一行为一项软件过程数据,经过数据预处理,通过配置项指定各个过程数据和成本信息在第几列,形成数据矩阵X;成本信息形成列向量Y;从X、Y矩阵中抽取数据,输入核心模型模块进行训练;根据输入的X、Y矩阵数据训练出选用模型的参数,并计算出成本的测定值;利用成本测定值和已有成本值,根据置信区间计算方法,得到最终的预测区间。本发明的区间预测方法实验命中率高,实际应用对工作量测定有着极其重要和可信任的指导作用;本发明的系统对研究人员添加新的模型,添加新的区间算法,添加新的模型评测方法极为方便。
文档编号G06F9/44GK102156641SQ20111009987
公开日2011年8月17日 申请日期2011年4月20日 优先权日2011年4月20日
发明者杨叶, 杨达, 解浪 申请人:中国科学院软件研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1