一种三维曲面表示的软件错误定位方法

文档序号：6536708阅读：192来源：国知局

一种三维曲面表示的软件错误定位方法
【专利摘要】本发明涉及一种三维曲面表示的软件错误定位方法，属于软件测试领域，步骤包括：提取训练程序集中各版本的错误语句的运行特征，选择某种可疑度函数，计算错误语句的可疑度，并进行聚类，获取该聚类的中心，每个聚类中心的特征就代表了一种错误模式；将这些聚类中心拟合成三维曲面，该三维曲面函数就是经过校正和优化后的可疑度函数；运行测试集中的程序，根据测试集中程序的每条语句的运行特征，计算每条语句的可疑度，根据可疑值从大到小对语句进行排序，根据此顺序对程序语句逐条排查，对程序语句逐条排查，定位程序中的错误。本发明根据这些错误模式来校正和优化可疑度函数，使可疑函数更加符合实际的情况，提高了错误定位的准确度。
【专利说明】一种三维曲面表示的软件错误定位方法
【技术领域】
[0001]本发明属于软件测试【技术领域】，主要涉及软件调试范畴的“统计错误定位方法”。本发明采用三维曲面表示对错误定位的可疑度函数的性质进行可视化并假以分析，利用软件开发工作中的真实错误模式对可疑度函数进行校正和优化。
【背景技术】
[0002]软件在日常生活中的应用越来越广泛。随着软件功能和架构的复杂化，想要在软件产品中彻底避免软件错误的出现，仍然是很困难的。软件错误，即导致软件实际运行的结果和预期的运行结果不相符的那些因素，这些错误的存在，导致软件相应的功能丧失。软件测试是用于发现和修改软件错误的常用手段，是一项十分重要但又代价很大的工程，它通常包括三个步骤:错误的定位、错误的修复和对修改后的代码的再测试。其中，错误的定位是最为重要也是最为费时和费力的过程。
[0003]语句级别的“统计错误定位方法”通过收集每条语句在程序执行失败或成功时的运行信息来分析和评估该语句存在错误的可疑程度。举例来说，若某条语句总是在失败的程序执行中被运行，而从未在成功的程序执行中被运行过，那么，它很可能是和软件错误相关的。在此类“统计错误定位方法”中，通常采用可疑度函数来评估语句存在错误的可能性。
[0004]在进行错误定位时，首先需要多次执行程序，统计程序执行失败的次数m和语句Si的运行次数failed(Si)，以及程序执行成功的次数i和语句Si的运行次数passed(Si)；然后根据可疑度函数来评估每条语句存在错误的可能性，按照可疑值从大到小对语句进行排序；最后根据这个排序来逐个查找程序中的错误。对于目前的大部分可疑度函数(如
Tarantula、Jaccard、Ochia1、SBI)而言，一条语句Si的可疑度Rt (Si)只与两个变量有关-
该语句在失败的程序执行中运行的次数failed(Si)和该语句在成功的程序执行中运行的次数 passed (Si)。
[0005]然而，单纯地利用failed(Si)和passed(Si)来评估语句可疑度的方法与实际情况相差甚远。在实际编程时，错误并不是随机地、毫无规律地出现，而是呈现出某种模式:某些程序结构可能会频繁地出现错误，而另外一些程序结构可能很少出现错误。例如，对C语言的研究表明，有22.8%的错误出现在函数入口处或赋值语句上，相反，只有7.8%的错误出现在函数出口处或返回语句上，最终结果使软件错误定位准确度不高。

【发明内容】

[0006]本发明技术解决问题:克服现有技术的不足，提供一种三维曲面表示的软件错误定位方法，采用三维曲面对错误定位技术的可疑度函数进行可视化分析，利用错误模式对三维曲面进行校正和优化，使得可疑度函数更符合实际情况，从而提高错误定位技术的准确度。本发明技术解决方案:一种三维曲面表示的软件错误定位方法，实现步骤如下:
[0007](I)提取训练集中各程序的错误语句的运行特征，选择某种可疑度函数，计算错误语句的可疑度，然后对这些错误语句进行聚类；所述错误语句的运行特征包括该错误语句在失败的程序执行中运行的次数和在成功的程序执行中运行的次数；
[0008](2)根据每个聚类中错误语句的运行特征和相应的可疑度值，对每个聚类进行中心化，获取该聚类的中心，以获取每个聚类的某种特性，每个聚类中心的特征就代表了一种错误模式；
[0009](3)将所述聚类中心拟合成三维曲面，该三维曲面函数就是经过校正和优化后的可疑度函数；
[0010](4)运行测试集中的程序，根据所述程序的执行信息，利用所述经过校正和优化后的可疑度函数计算程序中各语句的可疑度，按照可疑度值的大小对各语句进行排序，得到可疑度排位表，根据可疑度排位表，对程序语句逐条排查，定位程序中的错误；所述执行信息包括程序执行成功与否，以及程序每条语句分别在成功的程序执行中的运行次数和在失败的程序执行中的运行次数。
[0011]所述步骤(I)选择可疑度函数采用Tarantula, Jaccard, Ochiai或SBI函数计算所述错误语句的可疑度。
[0012]所述步骤(I)中的聚类方法采用KNN算法或K-means算法。
[0013]所述步骤(2)根据错误语句在失败的程序中运行的次数，在成功的程序中运行的次数以及该错误语句的可疑度值，分别求取它们的均值来对聚类进行中心化。
[0014]所述步骤(3)采用样条插值方法或将这些聚类中心拟合成三维曲面。
[0015]本发明与现有技术相比的优点在于:本发明不仅利用语句的运行特征来评估程序各条语句的可疑度，还考虑了实际编程中程序出错的各种错误模式，根据这些错误模式来校正和优化可疑度函数，以至于可疑函数更加符合实际的情况，从而提高了错误定位的准确度。
【专利附图】

【附图说明】
[0016]图1为本发明方法的实现流程图；
[0017]图2为几种可疑度函数的三维曲面，其中(a)为Tarantula可疑度函数，(b)为Jaccard可疑度函数，(C)为Ochiai可疑度函数，(d)为SBI可疑度函数；
[0018]图3为几种方法的实验效果对比。
【具体实施方式】
[0019]如图1所示，本发明具体实现步骤如下:
[0020]1.训练
[0021](I)运行程序代码，记录程序的执行信息m和m'，以及训练集中各条错误语句的运行信息 failed(Si) passed(Si)；
[0022](2)采用某种可疑函数Tx，计算每条错误语句的可疑度
[0023](3)采用某种聚类方法(如KNN)对二维点集Kfailed(Si), passed(Si))}进行聚类(每个聚类代表一种错误模式);
[0024](4)每个聚类用一个中心点表示，如第k个聚类Ck的中心点为:
【权利要求】
1.一种三维曲面表示的软件错误定位方法，其特征在于实现步骤如下: (1)提取训练集中各程序的错误语句的运行特征，选择某种可疑度函数，计算错误语句的可疑度，然后对这些错误语句进行聚类；所述错误语句的运行特征包括该错误语句在失败的程序执行中运行的次数和在成功的程序执行中运行的次数； (2)根据每个聚类中错误语句的运行特征和相应的可疑度值，对每个聚类进行中心化，获取该聚类的中心，以获取每个聚类的某种特性，每个聚类中心的特征就代表了一种错误模式； (3)将所述聚类中心拟合成三维曲面，该三维曲面函数就是经过校正和优化后的可疑度函数； (4)运行测试集中的程序，根据所述程序的执行信息，利用所述经过校正和优化后的可疑度函数计算程序中各语句的可疑度，按照可疑度值的大小对各语句进行排序，得到可疑度排位表，根据可疑度排位表，对程序语句逐条排查，定位程序中的错误；所述执行信息包括程序执行成功与否，以及程序每条语句分别在成功的程序执行中的运行次数和在失败的程序执行中的运行次数。
2.根据权利要求1所述的三维曲面表示的软件错误定位方法，其特征在于:所述步骤(I)选择可疑度函数采用Tarantula, Jaccard, Ochiai或SBI函数计算所述错误语句的可疑度。
3.根据权利要求1所述的三维曲面表示的软件错误定位方法，其特征在于:所述步骤(1)中的聚类方法采用KNN算法或K-means算法。
4.根据权利要求1所述的三维曲面表示的软件错误定位方法，其特征在于:所述步骤(2)根据错误语句在失败的程序中运行的次数，在成功的程序中运行的次数以及该错误语句的可疑度值，分别求取它们的均值来对聚类进行中心化。
5.根据权利要求1所述的三维曲面表示的软件错误定位方法，其特征在于:所述步骤(3)采用样条插值方法或将这些聚类中心拟合成三维曲面。
【文档编号】G06F11/36GK103744789SQ201410033461
【公开日】2014年4月23日申请日期:2014年1月23日优先权日:2014年1月23日
【发明者】张震宇, 石琼, 李恒申请人:中国科学院软件研究所

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张震宇;石琼;李恒
技术所有人：中国科学院软件研究所
我是此专利的发明人

上一篇：一种基于连续碰撞位映射的多标签防碰撞方法
上一篇：Raid1和raid4混合结构网络存储系统及方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。