一种项目评审软件缺陷预测方法及系统与流程

文档序号:36805634发布日期:2024-01-23 12:34阅读:15来源:国知局
一种项目评审软件缺陷预测方法及系统与流程

本发明属于软件缺陷检测的,具体地涉及一种项目评审软件缺陷预测方法及系统。


背景技术:

1、近年来随着我国经济增速的放缓,各行各业都在迈向更高水平的发展,而在这个转型升级的过程中,“互联网+”模式的推动功不可没,在电网行业中,智能化、信息化对于优化供电质量、提升电网运行效率扮演着不可或缺的角色,然而,随着信息化项目的快速涌现,电力综合项目评审却面临着瓶颈,因此,如何提高信息对接、处理速度、减少信息传达偏差的影响正在成为学界和业内专家们关注的热门话题;

2、由于人力资源有限、评审类型繁多等种种因素令评审工作变得异常困难,因此现在部分企业开始通过一些项目评审软件对一些信息化电力项目进行评审,但项目评审软件在使用时可能存在一些缺陷,影响项目的评审与运行使用,在现有的软件缺陷预测的研究中,无法提取特征的有效信息且预测模型考虑特征不够充分,导致预测性能较差,预测精度较低。


技术实现思路

1、为了解决上述技术问题,本发明提供了一种项目评审软件缺陷预测方法及系统,用于解决现有技术中的技术问题。

2、一方面,该发明提供以下技术方案,一种项目评审软件缺陷预测方法,包括:

3、获取项目评审软件的源代码,提取所述源代码的语法树,并基于所述语法树提取所述项目评审软件的第一特征;

4、获取所述项目评审软件在预设时间段内的历史运行数据,对所述历史运行数据进行不平衡采样处理,以得到初始数据特征;

5、计算所述初始数据特征的期望验证值,并基于所述期望验证值对所述初始数据特征进行数据筛选,以得到第二特征;

6、对所述第一特征与所述第二特征进行归一化处理,以分别得到第一处理特征与第二处理特征;

7、获取训练数据集并将所述训练数据集输入预设预测模型中进行训练,以得到最终预测模型,将所述第一处理特征与所述第二处理特征进行特征融合,以得到融合特征,将所述融合特征输入所述最终预测模型中进行预测,以输出缺陷预测结果。

8、相比现有技术,本技术的有益效果为:本技术首先获取项目评审软件的源代码,提取所述源代码的语法树,并基于所述语法树提取所述项目评审软件的第一特征;之后获取所述项目评审软件在预设时间段内的历史运行数据,对所述历史运行数据进行不平衡采样处理,以得到初始数据特征;而后计算所述初始数据特征的期望验证值,并基于所述期望验证值对所述初始数据特征进行数据筛选,以得到第二特征;再之后对所述第一特征与所述第二特征进行归一化处理,以分别得到第一处理特征与第二处理特征;最后获取训练数据集并将所述训练数据集输入预设预测模型中进行训练,以得到最终预测模型,将所述第一处理特征与所述第二处理特征进行特征融合,以得到融合特征,将所述融合特征输入所述最终预测模型中进行预测,以输出缺陷预测结果,本发明充分提取了项目评审软件的源代码与运行数据的特征,并充分利用两特征的有效信息对项目评审软件的缺陷进行预测,提升了预测模型的预测精度,同时本发明对第二特征进行筛选,可剔除掉一些冗余、无关的特征,避免出现过拟合的问题,进一步提升了模型的预测精度。

9、较佳的,所述获取项目评审软件的源代码,提取所述源代码的语法树,并基于所述语法树提取所述项目评审软件的第一特征的步骤包括:

10、获取项目评审软件的源代码,对所述源代码进行读取,以得到读取文件;

11、将所述读取文件转换为字符串文件并使用解析器对所述字符串文件进行解析,以得到若干节点,基于所述节点确定所述源代码的语法树,每个所述节点分别表示所述源代码的子代码文件;

12、基于节点类型对若干所述节点进行筛选,以得到筛选节点,基于所述筛选节点对所述语法树进行优化替换,以得到优化语法树;

13、基于预设遍历规则对所述优化语法树进行遍历,以得到遍历语法信息;

14、将所述遍历语法信息进行数值向量转化,以得到所述项目评审软件的第一特征。

15、较佳的,所述基于预设遍历规则对所述优化语法树进行遍历,以得到遍历语法信息的步骤包括:

16、基于所述子代码文件的类型确定所述优化语法树的根节点,将除所述根节点之外的所有节点作为子节点;

17、创建访问字符串数组,以所述根节点为入口对所述优化语法树进行访问;

18、当所述访问字符串数组访问到任意子节点时,将开始标签作为前缀并将该子节点的名称进行拼接并将拼接得到的字符串添加到所述访问字符串数组中;

19、当所述访问字符串数组访问到该子节点下的所有子节点之后,将所述访问字符串数组退回至该子节点,并将终止标签作为前缀并将该子节点的名称进行拼接并将拼接得到的字符串添加到所述访问字符串数组中;

20、当访问完所述根节点下的所有子节点之后,完成遍历过程,并输出遍历语法信息。

21、较佳的,所述将所述遍历语法信息进行数值向量转化,以得到所述项目评审软件的第一特征的步骤包括:

22、从所述遍历语法信息中生成词汇表,对所述词汇表中的所有词进行独热编码,以得到编码序列;

23、在所述编码序列中选取一个词编码作为特征词,在所述特征词前后分别选取若干个词编码作为训练词;

24、将所述训练词输入预设输出模型中进行训练并通过反向传播对所述预设输出模型进行更新,以得到更新输出模型,将所述特征词输入所述更新输出模型中,将所述更新输出模型输出的权重矩阵作为所述项目评审软件的第一特征。

25、较佳的,所述获取所述项目评审软件在预设时间段内的历史运行数据,对所述历史运行数据进行不平衡采样处理,以得到初始数据特征的步骤包括:

26、获取所述项目评审软件在预设时间段内的历史运行数据,基于所述历史运行输出的变量类型将所述历史运行数据分为第一类型数据与第二类型数据;

27、将所述第一类型数据存入第一数组中,将所述第二类型数据存入第二数组中,并在所述第一素组中其中一个第一类型数据作为基准数据,计算所述基准数据与其余第一类型数据之间的欧式距离;

28、基于欧式距离选取与所述基准数据最近的a个第一类型数据,根据依赖度将a个第一类型数据进行排序并将排序后的a个第一类型数据存入排序数组中;

29、按预设选取规则选取所述排列数组中的数据,以得到若干挑选数据,按基于所述挑选数据并按照预设公式将所述排列数组中的数据进行合成,将合成后的数据加入所述第一数组中,直至所述第一数组中的数据数量与所述第二数组中的数据数量相同,其中预设公式为:

30、;

31、式中,为第个合成后的数据,为挑选数据,为0-1之间的随机数,为排序数组;

32、将数据数量相同的第一数组与第二数组存入特征选择集中,计算所述特征选择集中所有数据之间的特征值,将特征值最大的前n个特征数据作为初始数据特征。

33、较佳的,所述计算所述初始数据特征的期望验证值,并基于所述期望验证值对所述初始数据特征进行数据筛选,以得到第二特征的步骤具体为:

34、按照预设计算公式计算所述初始数据特征的期望验证值,剔除期望验证值小于期望阈值的初始数据特征,并将保留的初始数据特征作为第二特征,其中,所述预设计算公式为:

35、;

36、式中,为期望验证值,为初始数据特征的概率,表示初始数据特征出现的类的概率,表示正类或负类,为正类和负类中所有类的总数,表示属于类的数据概率。

37、较佳的,所述获取训练数据集并将所述训练数据集输入预设预测模型中进行训练,以得到最终预测模型的步骤包括:

38、获取训练数据集,为所述训练数据集中的每个样本赋予相同的样本权值;

39、采用回归算法并根据所述样本权值分别对弱学习器进行回归训练并基于所述样本权值确定所述弱学习器的学习误差;

40、基于所述学习误差确定所述弱学习器的权重系数,并基于所述权重系数更新所述训练数据集中每个样本的样本权值,以得到更新训练集,基于所述更新训练集的权重系数对所述弱学习器进行更新训练;

41、迭代更新所述样本权值直至所述样本权值满足权值阈值,通过线性组合的方式将更新训练后的弱学习器组合成最终预测模型。

42、第二方面,该发明提供以下技术方案,一种项目评审软件缺陷预测系统,所述系统包括:

43、第一特征提取模块,获取项目评审软件的源代码,提取所述源代码的语法树,并基于所述语法树提取所述项目评审软件的第一特征;

44、第二特征提取模块,用于获取所述项目评审软件在预设时间段内的历史运行数据,对所述历史运行数据进行不平衡采样处理,以得到初始数据特征;

45、筛选模块,用于计算所述初始数据特征的期望验证值,并基于所述期望验证值对所述初始数据特征进行数据筛选,以得到第二特征;

46、处理模块,用于对所述第一特征与所述第二特征进行归一化处理,以分别得到第一处理特征与第二处理特征;

47、预测模块,用于获取训练数据集并将所述训练数据集输入预设预测模型中进行训练,以得到最终预测模型,将所述第一处理特征与所述第二处理特征进行特征融合,以得到融合特征,将所述融合特征输入所述最终预测模型中进行预测,以输出缺陷预测结果。

48、第三方面,该发明提供以下技术方案,一种计算机,包括存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述的项目评审软件缺陷预测方法。

49、第四方面,该发明提供以下技术方案,一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述的项目评审软件缺陷预测方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1