工作量评估及模型训练方法、电子设备及存储介质与流程

文档序号:16781253发布日期:2019-02-01 19:09阅读:186来源:国知局
工作量评估及模型训练方法、电子设备及存储介质与流程

本发明涉及软件测试技术领域,具体涉及一种测试项目工作量评估及模型训练方法、电子设备及存储介质。



背景技术:

对软件测试量的客观、准确、简便评估是一个世界性难题,随着软件信息技术的发展,软件产业的影响越来越大,软件开发的投入也越来越大,软件测试所花费的人力成本也越来越多。但在实际的软件测试过程中,普遍存在着项目超期、费用超支和低质量等诸多问题,究其原因在于测试项目早期对项目的估算不够有效和准确。

目前虽然有一些测试项目工作量评估方案,例如,功能点分析法,能够在测试项目早期对项目的工作量进行评估,但存在着考量因素有限,导致评估结果不够准确的问题发生。另外,现有的测试项目工作量评估方案没有对测试项目的排期进行预估,仅预估了测试项目的工作量,但无法根据测试项目的工作量清楚且确切的推知测试项目的排期。



技术实现要素:

鉴于以上内容,有必要提出一种测试项目工作量评估及模型训练方法、电子设备及存储介质,能够确预估测试项目的工作量(排期及参与测试的测试人数),客观性强。

本发明的第一方面提供一种工作量评估模型训练方法,所述方法包括:

获取测试项目数据集,所述测试项目数据集包括多个测试项目,每个测试项目包括多个测试数据;

提取所述多个测试数据中的每一个测试数据的特征向量;

根据所提取出的测试数据的特征向量,计算测试项目的难易系数;

将所述特征向量、难易系数及测试项目的项目版本的排期输入至预设损失函数中;

当计算得到的损失函数值小于或等于预先设置的阈值时,则工作量评估模型训练结束。

根据本发明的一个优选实施例,在获取测试项目数据集之后,所述方法还包括:

对所述测试数据中的每一测试数据按照预设规则进行编写,包括:

将每一版本的测试项目中的需求文档按照第一预设规则进行编写;

将每一版本的测试项目中的测试任务按照第二预设规则进行编写;

将每一版本的测试项目中的项目版本的排期按照第三预设规则进行编写。

根据本发明的一个优选实施例,所述将每一版本的测试项目中的需求文档按照第一预设规则进行编写包括:

根据所述需求文档对应的软件开发项目的功能组件将测试项目划分为多个第一测试点,将每一个第一测试点按照顺序标记上第一编号;

根据对应的功能组件中的子功能组件将每一个第一测试点进行细分为多个第二测试点,将每一个第二测试点按照顺序标记上第二编号。

根据本发明的一个优选实施例,所述将每一版本的测试项目中的测试任务按照第二预设规则进行编写包括:

根据预设执行类型将测试任务分为多个测试步骤进行编写,所述预设执行类型包括:测试环境的搭建、测试类型的选取或测试得到的问题。

根据本发明的一个优选实施例,所述将每一版本的测试项目中的项目版本的排期按照第三预设规则进行编写包括:

按照预设时间格式编写每一个第二测试点对应的每一个测试任务对应的第一排期;

按照所述预设时间格式编写每一个第一测试点对应的第二测试点的第二排期;

按照所述预设时间格式编写每一版本的测试项目中的项目版本的第三排期。

根据本发明的一个优选实施例,所述提取所述多个测试数据中的每一个测试数据的特征向量包括:

提取所述需求文档中的每一个测试点及对应测试点的排期,得到第一特征向量;

提取所述测试任务中的每一个测试任务及对应测试任务的排期,得到第二特征向量;

将所述参与测试的测试人数作为第三特征向量;

将所述第一特征向量、所述第二特征向量及所述第三特征向量进行连接,得到测试项目的特征向量。

根据本发明的一个优选实施例,根据所提取出的测试数据的特征向量,计算测试项目的难易系数是指根据所提取出的第三特征向量计算测试项目的难易系数,包括:

获取所有测试项目对应的参与测试的测试人数,并提取所述参与测试的测试人数中的最大数;

根据多个预设比例数对所述最大数进行计算,得到多个计算数值;

将参与测试的测试人数小于第一计算数值对应的测试项目的难易系数确定为第一系数,将参与测试的测试人数大于或等于所述第一计算数值且小于第二计算数值对应的测试项目的难易系数确定为第二系数,将参与测试的测试人数大于或等于所述第二计算数值且小于第三计算数值对应的测试项目的难易系数确定为第三系数。

本发明的第二方面提供一种工作量评估方法,所述方法包括:

获取当前待评估的测试项目的多个测试数据;

提取测试数据的特征向量;

将所述特征向量输入至预先训练好的工作量评估模型中,输出当前待评估的测试项目的预计排期及需要参与测试的测试人数,其中,所述工作量评估模型采用所述的工作量评估模型方法训练得到。

本发明的第三方面提供一种电子设备,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现所述的工作量评估模型训练方法或者实现所述的工作量评估方法。

本发明的第四方面一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述的工作量评估模型训练方法或者实现所述的工作量评估方法。

综上所述,本发明方法的工作量评估模型训练方法,是将神经网络首次运用到软件测试领域中的首列,训练出的工作量评估模型具有显著的特征提取能力,工作量评估准确率较高。且能够准确预估测试项目的工作量(排期及参与测试的测试人数),客观性强。利用所训练好的工作量评估模型计算当前待评估的测试项目的工作量(包括排期及需要参与测试的测试人数),相比较传统的人工计算测试项目的工作量,本发明考虑问题全面、有数据作为支撑、更加客观和具有说服力,能够在软件测试项目早期客观准确合理的评估软件测试项目的工作量,以便对软件测试项目起到实质性指导意义。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1是本发明实施例一提供的工作量评估模型训练方法的流程图。

图2是本发明实施例二提供的工作量评估方法的流程图。

图3是本发明实施例三提供的工作量评估模型训练装置的功能模块图。

图4是本发明实施例四提供的工作量评估装置的功能模块图。

图5是本发明实施例五提供的电子设备的示意图。

如下具体实施方式将结合上述附图进一步说明本发明。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。

本发明实施例的工作量评估模型训练方法及/或工作量评估方法应用在一个或者多个电子设备中。所述工作量评估模型训练方法及/或工作量评估方法也可以应用于由电子设备和通过网络与所述电子设备进行连接的服务器所构成的硬件环境中。网络包括但不限于:广域网、城域网或局域网。本发明实施例的工作量评估模型训练方法可以由服务器来执行,也可以由电子设备来执行;还可以是由服务器和电子设备共同执行。本发明实施例的工作量评估方法可以由服务器来执行,也可以由电子设备来执行;还可以是由服务器和电子设备共同执行。

所述对于需要进行工作量评估模型训练方法及/或工作量评估方法的电子设备,可以直接在电子设备上集成本发明的方法所提供的工作量评估模型训练及/或工作量评估功能,或者安装用于实现本发明的方法的客户端。再如,本发明所提供的方法还可以以软件开发工具包(softwaredevelopmentkit,sdk)的形式运行在服务器等设备上,以sdk的形式提供工作量评估模型训练及/或工作量评估功能的接口,电子设备或其他设备通过提供的接口即可实现训练工作量评估模型及/或对工作量进行评估的功能。

实施例一

图1是本发明实施例一提供的工作量评估模型训练方法的流程图。根据不同的需求,该流程图中的执行顺序可以改变,某些步骤可以省略。

s11、获取测试项目数据集,所述测试项目数据集包括多个测试项目,每个测试项目包括多个测试数据。

本实施例中,可以通过企业历史软件测试项目获取所述测试项目数据集,历史软件测试项目是指以往发生且已经完成的软件测试项目。企业历史软件测试项目中记录了软件开发项目及对应软件开发项目的软件测试项目,一个软件开发项目可能有不同的开发版本,每一个版本的软件开发项目可能对应多个不同版本的软件测试项目,因而,可以从企业历史软件测试项目中获取大量的软件测试项目组成测试项目数据集。

本实施例中,所述多个测试数据可以包括:需求文档、测试任务、对应的项目版本的排期、参与测试的测试人数。

优选地,在获取测试项目数据集之后,所述方法还可以包括:

对所述测试数据中的每一测试数据按照预设规则进行编写。

在一些实施例中,所述对所述测试数据中的每一测试数据按照预设规则进行编写可以包括:将每一版本的测试项目中的需求文档按照第一预设规则进行编写。

所述将每一版本的测试项目中的需求文档按照第一预设规则进行编写可以包括:根据所述需求文档对应的软件开发项目的功能组件将测试项目划分为多个第一测试点,将每一个第一测试点按照顺序标记上第一编号;根据对应的功能组件中的子功能组件将每一个第一测试点进行细分为多个第二测试点,将每一个第二测试点按照顺序标记上第二编号。一个测试点代表一个测试场景,需要包括起因、经过和结果。

需要说明的是,所述第二测试点是指不可以再细分的最小单元。将需求文档细分为多个第二测试点便于后续训练测试项目工作量评估模型,提高模型训练的精度。

在一些实施例中,所述对所述测试数据中的每一测试数据按照预设规则进行编写可以包括:将每一版本的测试项目中的测试任务按照第二预设规则进行编写。

所述将每一版本的测试项目中的测试任务按照第二预设规则进行编写可以包括:根据预设执行类型将测试任务分为多个测试步骤进行编写。

所述预设执行类型可以包括:测试环境的搭建、测试类型的选取(story测试,或者系统内部集成测试(systemintegrationtesting,sit测试),或者用户验收测试(useracceptancetesting,uat))、测试得到的问题(bug)等。

在一些实施例中,所述对所述测试数据中的每一测试数据按照预设规则进行编写可以包括:将每一版本的测试项目中的项目版本的排期按照第三预设规则进行编写。

所述将每一版本的测试项目中的项目版本的排期按照第三预设规则进行编写可以包括:按照预设时间格式编写每一个第二测试点对应的每一个测试任务对应的第一排期;按照所述预设时间格式编写每一个第一测试点对应的第二测试点的第二排期;按照所述预设时间格式编写每一版本的测试项目中的项目版本的第三排期。其中,每一个第一测试点的第二排期是该第一测试点下的所有第二测试点的第一排期的总和;每一版本的测试项目中的项目版本的第三排期是所有第一测试点的第二排期的总和。

所述预设时间格式为预先设置的时间格式,例如,可以以天为单位进行统计,或者以周为单位进行统计。

s12、提取所述多个测试数据中的每一个测试数据的特征向量。

本实施例中,提取所述多个测试数据中的每一个测试数据的特征向量可以包括:

提取所述需求文档中的每一个测试点及对应测试点的排期,得到第一特征向量;

提取所述测试任务中的每一个测试任务及对应测试任务的排期,得到第二特征向量;

将所述参与测试的测试人数作为第三特征向量;

将所述第一特征向量、所述第二特征向量及所述第三特征向量进行连接,得到测试项目的特征向量。

例如,一项测试项目的需求文档中有m个测试点s,每个测试点s对应的排期为t,则提取所述需求文档中的每一个测试点s及对应测试点s的排期t,得到第一特征向量为(s1,t1,s2,t2,…,sm,tm)。

又如,该项测试项目的测试任务中有n个测试任务a,每个测试任务a对应的排期为t,则提取所述测试任务中的每一个测试任务a及对应测试任务a的排期t,得到第二特征向量为(a1,t1,a2,t2,…,an,tn)。

再如,该项测试项目的参与测试的测试人数为r,则第三特征向量为r。

将所述第一特征向量、所述第二特征向量及所述第三特征向量进行连接,得到该项测试项目的特征向量为(s1,t1,s2,t2,…,sm,tm,a1,t1,a2,t2,…,an,tn,r)。

s13、根据所提取出的测试数据的特征向量,计算测试项目的难易系数。

本实施例中,所述难易系数是指测试项目的难易程度。可以预先设置多个难易系数:第一预设系数、第二预设系数及第三预设系数。还可以预先设置难易系数区间:第一系数区间、第二系数区间及第三系数区间。其中,所述第一系数区间对应所述第一系数,代表着测试项目难度较大,例如,可以为[0.1,0.3);所述第二系数区间对应所述第二系数,代表着测试项目难度适中,例如,可以为[0.3,0.6);所述第三系数区间对应所述第三系数,代表着测试项目难度较小,例如,可以为[0.6,1.0]。

本实施例中,根据所提取出的测试数据的特征向量,计算测试项目的难易系数是指根据所提取出的第三特征向量计算测试项目的难易系数,具体可以包括:

1)获取所有测试项目对应的参与测试的测试人数,并提取所述参与测试的测试人数中的最大数。

2)根据多个预设比例数对所述最大数进行计算,得到多个计算数值。

3)将参与测试的测试人数小于第一计算数值对应的测试项目的难易系数确定为第一系数;将参与测试的测试人数大于或等于所述第一计算数值且小于第二计算数值对应的测试项目的难易系数确定为第二系数;将参与测试的测试人数大于或等于所述第二计算数值且小于第三计算数值对应的测试项目的难易系数确定为第三系数。

举例说明,如何根据所提取出的第三特征向量计算测试项目的难易系数。

假如,获取的测试项目1对应的参与测试的测试人数为7,测试项目2对应的参与测试的测试人数为10,测试项目3对应的参与测试的测试人数为15,测试项目4对应的参与测试的测试人数为5,则提取的参与测试的测试人数中的最大数为15。

所述多个预设比例分别为:第一预设比例(例如,0.3)、第二预设比例(例如,0.6)及第三预设比例(例如,1),根据第一预设比例进行计算得到第一计算数值(例如,4.5),根据第二预设比例进行计算得到第二计算数值(例如,9),根据第三预设比例进行计算得到第三计算数值(例如,15)。

将参与测试的测试人数小于4.5对应的测试项目的难易系数确定为第一系数;将参与测试的测试人数大于或等于4.5且小于9对应的测试项目的难易系数确定为第二系数;将参与测试的测试人数大于或等于9且小于15对应的测试项目的难易系数确定为第三系数。

因此,可以计算出测试项目1的难易系数为第二预设系数,测试项目2的难易系数为第三预设系数,测试项目3的难易系数为第三预设系数,测试项目4的难易系数为第二预设系数。

在其他实施例中,还可以根据所提取出的第一特征向量及/或第二特征向量计算测试项目的难易系数。根据第一特征向量及/或第二特征向量计算测试项目的难易系数,如同根据所提取出的第三特征向量计算测试项目的难易系数过程相同,本发明在此不再详细赘述。在其他实施例中,还可以根据所提取出的第一特征向量、第二特征向量及第三特征向量计算测试项目的难易系数。

s14、将所述特征向量、难易系数及测试项目的项目版本的排期输入至预设损失函数中。

本实施例中,所述预设损失函数l为下式所示:

其中,m表示mini-batch的大小。ls表示的是交叉熵损失函数(softmaxloss)的结果,代表的是第yi个人的实际输出,lc表示的是中心损失函数(centerloss)的结果,cyi表示第yi个人的特征中心,xi表示全连接层之前的特征。预先设置的损失函数l越小,代表模型的性能越好。

s15、当计算得到的损失函数值小于或等于预先设置的阈值时,则工作量评估模型训练结束;当计算得到的损失函数值大于或等于预先设置的阈值时,则增加参与训练的测试项目数据集的数量,并基于增加后的测试项目数据集重新执行上述步骤s12-s15。

所述预先设置的阈值,例如,98.5%。

优选地,为了验证训练好的工作量评估模型的性能,所述方法还可以包括:将所获取的测试项目数据集分为第一数据集和第二数据集。

本较佳实施例中,训练工作量评估模型时可以采用交叉验证(crossvalidation)的思想,将所获取的测试项目数据集按照合适的比例划分成第一数据集和第二数据集,合适的划分比例如7:3。所述第一数据集用以训练工作量评估模型,所述第二数据集用以测试所训练出的工作量评估模型的性能,若测试的准确率越高,则表明所训练出的工作量评估模型的性能越好;若测试的准确率较低,则表明所训练出的工作量评估模型的性能较差。

进一步地,若划分出的第一数据集和第二数据集的总数量依旧较大,即将所有的第一数据集用来参与工作量评估模型的训练,将导致寻找工作量评估模型对应的最优参数向量代价较大。因而,在将所获取的测试项目数据集分为第一数据集之后,所述方法还可以包括:在所述第一数据集中随机选择第一预设数量的数据集参与工作量评估模型的训练。

本较佳实施例中,所述第一预设数量可以是一个预先设置的固定值,例如,200,即在所述第一数据集中随机挑选出200个测试项目参与工作量评估模型的训练。所述第一预设数量还可以是一个预先设置的比例值,例如,3/5,即,即在所述第一数据集中随机挑选3/5比例的测试项目参与工作量评估模型的训练。

本发明方法的工作量评估模型训练方法训练的工作量评估模型,是将神经网络首次运用到软件测试领域中的首列,训练出的工作量评估模型具有显著的特征提取能力,工作量评估准确率较高。且能够准确预估测试项目的工作量(排期及参与测试的测试人数),客观性强。

实施例二

图2是本发明实施例二提供的工作量评估方法的流程图。根据不同的需求,该流程图中的执行顺序可以改变,某些步骤可以省略。

s21、获取当前待评估的测试项目的多个测试数据。

本实施例中,所述当前待评估的测试项目的多个测试数据可以包括:需求文档、测试任务。

优选地,对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写。

在一些实施例中,所述对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写可以包括:将当前待评估的测试项目中的需求文档按照第一预设规则进行编写。

所述将当前待评估的测试项目中的需求文档按照第一预设规则进行编写可以包括:根据当前待评估的测试项目对应的软件开发项目的功能组件将当前待评估的测试项目划分为多个第一测试点,将每一个第一测试点按照顺序标记上第一编号;根据对应的功能组件中的子功能组件将每一个第一测试点进行细分为多个第二测试点,将每一个第二测试点按照顺序标记上第二编号。一个测试点代表一个测试场景,需要包括起因、经过和结果。

需要说明的是,所述第二测试点是指不可以再细分的最小单元。

在一些实施例中,所述对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写可以包括:将当前待评估的测试项目中的测试任务按照第二预设规则进行编写。

所述将当前待评估的测试项目中的测试任务按照第二预设规则进行编写可以包括:根据预设执行类型将测试任务分为多个测试步骤进行编写。

所述预设执行类型可以包括:测试环境的搭建、测试类型的选取(story测试,或者系统内部集成测试(systemintegrationtesting,sit测试),或者用户验收测试(useracceptancetesting,uat))、测试得到的问题(bug)等。

在一些实施例中,所述对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写可以包括:将当前待评估的测试项目中的项目版本的排期按照第三预设规则进行编写。

所述将当前待评估的测试项目中的项目版本的排期按照第三预设规则进行编写可以包括:按照预设时间格式编写每一个第二测试点对应的每一个测试任务对应的第一排期;按照所述预设时间格式编写每一个第一测试点对应的第二测试点的第二排期;按照所述预设时间格式编写每一版本的测试项目中的项目版本的第三排期。其中,每一个第一测试点的第二排期是该第一测试点下的所有第二测试点的第一排期的总和;每一版本的测试项目中的项目版本的第三排期是所有第一测试点的第二排期的总和。

所述预设时间格式为预先设置的时间格式,例如,可以以天为单位进行统计,或者以周为单位进行统计。

s22、提取测试数据的特征向量。

本实施例中,提取测试数据的特征向量可以包括:

1)提取所述需求文档中的每一个测试点及对应测试点的排期,得到第一特征向量;

例如需求文档中有m个测试点s,每个测试点s对应的排期为t,则需求文档的第一特征向量为(s1,t1,s2,t2,…,sm,tm)。

2)提取所述测试任务中的每一个测试任务及对应测试任务的排期,得到第二特征向量;

例如测试任务中有n个测试任务a,每个测试任务a对应的排期为t,则需求文档的第一特征向量为(a1,t1,a2,t2,…,an,tn)。

将所述第一特征向量、所述第二特征向量进行连接后可以得到所述测试数据的特征向量。

s23、将所述特征向量输入至预先训练好的工作量评估模型中,输出当前待评估的测试项目的预计排期及需要参与测试的测试人数。

综上所述,本发明实施例中所述的工作量评估方法,通过训练工作量评估模型,利用所训练好的工作量评估模型计算当前待评估的测试项目的工作量(包括排期及需要参与测试的测试人数),相比较传统的人工计算测试项目的工作量,本发明考虑问题全面、有数据作为支撑、更加客观和具有说服力,能够在软件测试项目早期客观准确合理的评估软件测试项目的工作量,以便对软件测试项目起到实质性指导意义。提高企业软件测试项目管理效率及降低软件测试项目管理成本。能够自动统计工作量、分析工作效率和预测工作完成周期,有助于对下个工作任务的安排,可以应对需求来安排工作计划,每天工作量的大小,人员的分配和计划工作周期,特别是当紧急任务或工作来临时的应急措施,有效的提高生产力。

以上所述,仅是本发明的具体实施方式,但本发明的保护范围并不局限于此,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出改进,但这些均属于本发明的保护范围。

下面结合第3至5图,分别对实现上述工作量评估模型训练方法及/或工作量评估方法的电子设备的功能模块及硬件结构进行介绍。

实施例三

图3为本发明工作量评估模型训练装置较佳实施例中的功能模块图。

在一些实施例中,所述工作量评估模型训练装置30运行于电子设备中。所述工作量评估模型训练装置30可以包括多个由程序代码段所组成的功能模块。所述工作量评估模型训练装置30中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行(详见图1及其相关描述)对工作量评估模型的训练。

本实施例中,所述工作量评估模型训练装置30根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块301、编写模块302、提取模块303、计算模块304、输入模块305及训练模块306。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在一些实施例中,关于各模块的功能将在后续的实施例中详述。

获取模块301,用于获取测试项目数据集,所述测试项目数据集包括多个测试项目,每个测试项目包括多个测试数据。

本实施例中,可以通过企业历史软件测试项目获取所述测试项目数据集,历史软件测试项目是指以往发生且已经完成的软件测试项目。企业历史软件测试项目中记录了软件开发项目及对应软件开发项目的软件测试项目,一个软件开发项目可能有不同的开发版本,每一个版本的软件开发项目可能对应多个不同版本的软件测试项目,因而,可以从企业历史软件测试项目中获取大量的软件测试项目组成测试项目数据集。

本实施例中,所述多个测试数据可以包括:需求文档、测试任务、对应的项目版本的排期、参与测试的测试人数。

优选地,在获取测试项目数据集之后,所述工作量评估装置30还可以包括:编写模块302,用于对所述测试数据中的每一测试数据按照预设规则进行编写。

在一些实施例中,所述对所述测试数据中的每一测试数据按照预设规则进行编写可以包括:将每一版本的测试项目中的需求文档按照第一预设规则进行编写。

所述将每一版本的测试项目中的需求文档按照第一预设规则进行编写可以包括:根据所述需求文档对应的软件开发项目的功能组件将测试项目划分为多个第一测试点,将每一个第一测试点按照顺序标记上第一编号;根据对应的功能组件中的子功能组件将每一个第一测试点进行细分为多个第二测试点,将每一个第二测试点按照顺序标记上第二编号。一个测试点代表一个测试场景,需要包括起因、经过和结果。

需要说明的是,所述第二测试点是指不可以再细分的最小单元。将需求文档细分为多个第二测试点便于后续训练测试项目工作量评估模型,提高模型训练的精度。

在一些实施例中,所述编写模块302,还可以用于将每一版本的测试项目中的测试任务按照第二预设规则进行编写。

所述将每一版本的测试项目中的测试任务按照第二预设规则进行编写可以包括:根据预设执行类型将测试任务分为多个测试步骤进行编写。

所述预设执行类型可以包括:测试环境的搭建、测试类型的选取(story测试,或者系统内部集成测试(systemintegrationtesting,sit测试),或者用户验收测试(useracceptancetesting,uat))、测试得到的问题(bug)等。

在一些实施例中,所述所述编写模块302,还可以用于将每一版本的测试项目中的项目版本的排期按照第三预设规则进行编写。

所述将每一版本的测试项目中的项目版本的排期按照第三预设规则进行编写可以包括:按照预设时间格式编写每一个第二测试点对应的每一个测试任务对应的第一排期;按照所述预设时间格式编写每一个第一测试点对应的第二测试点的第二排期;按照所述预设时间格式编写每一版本的测试项目中的项目版本的第三排期。其中,每一个第一测试点的第二排期是该第一测试点下的所有第二测试点的第一排期的总和;每一版本的测试项目中的项目版本的第三排期是所有第一测试点的第二排期的总和。

所述预设时间格式为预先设置的时间格式,例如,可以以天为单位进行统计,或者以周为单位进行统计。

提取模块303,用于提取所述多个测试数据中的每一个测试数据的特征向量。

本实施例中,所述提取模块303提取所述多个测试数据中的每一个测试数据的特征向量可以包括:

提取所述需求文档中的每一个测试点及对应测试点的排期,得到第一特征向量;

提取所述测试任务中的每一个测试任务及对应测试任务的排期,得到第二特征向量;

将所述参与测试的测试人数作为第三特征向量;

将所述第一特征向量、所述第二特征向量及所述第三特征向量进行连接,得到测试项目的特征向量。

例如,一项测试项目的需求文档中有m个测试点s,每个测试点s对应的排期为t,则提取所述需求文档中的每一个测试点s及对应测试点s的排期t,得到第一特征向量为(s1,t1,s2,t2,…,sm,tm)。

又如,该项测试项目的测试任务中有n个测试任务a,每个测试任务a对应的排期为t,则提取所述测试任务中的每一个测试任务a及对应测试任务a的排期t,得到第二特征向量为(a1,t1,a2,t2,…,an,tn)。

再如,该项测试项目的参与测试的测试人数为r,则第三特征向量为r。

将所述第一特征向量、所述第二特征向量及所述第三特征向量进行连接,得到该项测试项目的特征向量为(s1,t1,s2,t2,…,sm,tm,a1,t1,a2,t2,…,an,tn,r)。

计算模块304,用于根据所提取出的测试数据的特征向量,计算测试项目的难易系数。

本实施例中,所述难易系数是指测试项目的难易程度。可以预先设置多个难易系数:第一预设系数、第二预设系数及第三预设系数。还可以预先设置难易系数区间:第一系数区间、第二系数区间及第三系数区间。其中,所述第一系数区间对应所述第一系数,代表着测试项目难度较大,例如,可以为[0.1,0.3);所述第二系数区间对应所述第二系数,代表着测试项目难度适中,例如,可以为[0.3,0.6);所述第三系数区间对应所述第三系数,代表着测试项目难度较小,例如,可以为[0.6,1.0]。

本实施例中,所述计算模块304根据所提取出的测试数据的特征向量,计算测试项目的难易系数是指根据所提取出的第三特征向量计算测试项目的难易系数,具体可以包括:

1)获取所有测试项目对应的参与测试的测试人数,并提取所述参与测试的测试人数中的最大数。

2)根据多个预设比例数对所述最大数进行计算,得到多个计算数值。

3)将参与测试的测试人数小于第一计算数值对应的测试项目的难易系数确定为第一系数;将参与测试的测试人数大于或等于所述第一计算数值且小于第二计算数值对应的测试项目的难易系数确定为第二系数;将参与测试的测试人数大于或等于所述第二计算数值且小于第三计算数值对应的测试项目的难易系数确定为第三系数。

举例说明,如何根据所提取出的第三特征向量计算测试项目的难易系数。

假如,获取的测试项目1对应的参与测试的测试人数为7,测试项目2对应的参与测试的测试人数为10,测试项目3对应的参与测试的测试人数为15,测试项目4对应的参与测试的测试人数为5,则提取的参与测试的测试人数中的最大数为15。

所述多个预设比例分别为:第一预设比例(例如,0.3)、第二预设比例(例如,0.6)及第三预设比例(例如,1),根据第一预设比例进行计算得到第一计算数值(例如,4.5),根据第二预设比例进行计算得到第二计算数值(例如,9),根据第三预设比例进行计算得到第三计算数值(例如,15)。

将参与测试的测试人数小于4.5对应的测试项目的难易系数确定为第一系数;将参与测试的测试人数大于或等于4.5且小于9对应的测试项目的难易系数确定为第二系数;将参与测试的测试人数大于或等于9且小于15对应的测试项目的难易系数确定为第三系数。

因此,可以计算出测试项目1的难易系数为第二预设系数,测试项目2的难易系数为第三预设系数,测试项目3的难易系数为第三预设系数,测试项目4的难易系数为第二预设系数。

在其他实施例中,还可以根据所提取出的第一特征向量及/或第二特征向量计算测试项目的难易系数。根据第一特征向量及/或第二特征向量计算测试项目的难易系数,如同根据所提取出的第三特征向量计算测试项目的难易系数过程相同,本发明在此不再详细赘述。在其他实施例中,还可以根据所提取出的第一特征向量、第二特征向量及第三特征向量计算测试项目的难易系数。

输入模块305,用于将所述特征向量、难易系数及测试项目的项目版本的排期输入至预设损失函数中。

本实施例中,所述预设损失函数l为下式所示:

其中,m表示mini-batch的大小。ls表示的是交叉熵损失函数(softmaxloss)的结果,代表的是第yi个人的实际输出,lc表示的是中心损失函数(centerloss)的结果,cyi表示第yi个人的特征中心,xi表示全连接层之前的特征。预先设置的损失函数l越小,代表模型的性能越好。

训练模块306,用于当计算得到的损失函数值小于或等于预先设置的阈值时,则工作量评估模型训练结束;当计算得到的损失函数值大于或等于预先设置的阈值时,则增加参与训练的测试项目数据集的数量,并基于增加后的测试项目数据集重新执行上述模块302-306。

所述预先设置的阈值,例如,98.5%。

优选地,为了验证训练好的工作量评估模型的性能,所述获取模块301还可以用于:

将所获取的测试项目数据集分为第一数据集和第二数据集。

本较佳实施例中,训练工作量评估模型时可以采用交叉验证(crossvalidation)的思想,将所获取的测试项目数据集按照合适的比例划分成第一数据集和第二数据集,合适的划分比例如7:3。所述第一数据集用以训练工作量评估模型,所述第二数据集用以测试所训练出的工作量评估模型的性能,若测试的准确率越高,则表明所训练出的工作量评估模型的性能越好;若测试的准确率较低,则表明所训练出的工作量评估模型的性能较差。

进一步地,若划分出的第一数据集和第二数据集的总数量依旧较大,即将所有的第一数据集用来参与工作量评估模型的训练,将导致寻找工作量评估模型对应的最优参数向量代价较大。因而,在将所获取的测试项目数据集分为第一数据集之后,所述获取模块301还可以用于在所述第一数据集中随机选择第一预设数量的数据集参与工作量评估模型的训练。

本较佳实施例中,所述第一预设数量可以是一个预先设置的固定值,例如,200,即在所述第一数据集中随机挑选出200个测试项目参与工作量评估模型的训练。所述第一预设数量还可以是一个预先设置的比例值,例如,3/5,即,即在所述第一数据集中随机挑选3/5比例的测试项目参与工作量评估模型的训练。

本发明工作量评估模型训练装置训练的工作量评估模型,是将神经网络首次运用到软件测试领域中的首列,训练出的工作量评估模型具有显著的特征提取能力,工作量评估准确率较高。且能够准确预估测试项目的工作量(排期及参与测试的测试人数),客观性强。

实施例四

图4为本发明工作量评估装置较佳实施例中的功能模块图。

在一些实施例中,所述工作量评估装置40运行于电子设备中。所述工作量评估装置40可以包括多个由程序代码段所组成的功能模块。所述工作量评估装置40中的各个程序段的程序代码可以存储于存储器中,并由至少一个处理器所执行,以执行(详见图2及其相关描述)对测试项目的工作量进行评估。

本实施例中,所述工作量评估装置40根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:数据获取模块401、数据编写模块402、特征提取模块403及工作量评估模块404。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在一些实施例中,关于各模块的功能将在后续的实施例中详述。

数据获取模块401,用于获取当前待评估的测试项目的多个测试数据。

本实施例中,所述当前待评估的测试项目的多个测试数据可以包括:需求文档、测试任务。

数据编写模块402,用于对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写。

在一些实施例中,所述数据编写模块402对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写可以包括:将当前待评估的测试项目中的需求文档按照第一预设规则进行编写。

所述将当前待评估的的测试项目中的需求文档按照第一预设规则进行编写可以包括:根据对应的软件开发项目的功能组件将当前待评估的测试项目划分为多个第一测试点,将每一个第一测试点按照顺序标记上第一编号;根据对应的功能组件中的子功能组件将每一个第一测试点进行细分为多个第二测试点,将每一个第二测试点按照顺序标记上第二编号。一个测试点代表一个测试场景,需要包括起因、经过和结果。

需要说明的是,所述第二测试点是指不可以再细分的最小单元。

在一些实施例中,所述数据编写模块402对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写可以包括:将当前待评估的测试项目中的测试任务按照第二预设规则进行编写。

所述将当前待评估的测试项目中的测试任务按照第二预设规则进行编写可以包括:根据预设执行类型将测试任务分为多个测试步骤进行编写。

所述预设执行类型可以包括:测试环境的搭建、测试类型的选取(story测试,或者系统内部集成测试(systemintegrationtesting,sit测试),或者用户验收测试(useracceptancetesting,uat))、测试得到的问题(bug)等。

在一些实施例中,所述数据编写模块402对当前待评估的测试项目的多个测试数据中的每一测试数据按照预设规则进行编写可以包括:将当前待评估的测试项目中的项目版本的排期按照第三预设规则进行编写。

所述将当前待评估的测试项目中的项目版本的排期按照第三预设规则进行编写可以包括:按照预设时间格式编写每一个第二测试点对应的每一个测试任务对应的第一排期;按照所述预设时间格式编写每一个第一测试点对应的第二测试点的第二排期;按照所述预设时间格式编写每一版本的测试项目中的项目版本的第三排期。其中,每一个第一测试点的第二排期是该第一测试点下的所有第二测试点的第一排期的总和;每一版本的测试项目中的项目版本的第三排期是所有第一测试点的第二排期的总和。

所述预设时间格式为预先设置的时间格式,例如,可以以天为单位进行统计,或者以周为单位进行统计。

特征提取模块403,用于提取测试数据的特征向量。

本实施例中,所述特征提取模块403提取测试数据的特征向量包括:

1)提取所述需求文档中的每一个测试点及对应测试点的排期,得到第一特征向量。

例如需求文档中有m个测试点s,每个测试点s对应的排期为t,则需求文档的第一特征向量为(s1,t1,s2,t2,…,sm,tm)。

2)提取所述测试任务中的每一个测试任务及对应测试任务的排期,得到第二特征向量。

例如测试任务中有n个测试任务a,每个测试任务a对应的排期为t,则需求文档的第一特征向量为(a1,t1,a2,t2,…,an,tn)。

将所述第一特征向量、所述第二特征向量进行连接后可以得到所述测试数据的特征向量。

工作量评估模块404,用于将所述特征向量输入至预先训练好的工作量评估模型中,输出当前待评估的测试项目的预计排期及需要参与测试的测试人数。

综上所述,本发明实施例中所述的工作量评估装置,通过训练工作量评估模型,利用所训练好的工作量评估模型计算当前待评估的测试项目的工作量(包括排期及需要参与测试的测试人数),相比较传统的人工计算测试项目的工作量,本发明考虑问题全面、有数据作为支撑、更加客观和具有说服力,能够在软件测试项目早期客观准确合理的评估软件测试项目的工作量,以便对软件测试项目起到实质性指导意义。提高企业软件测试项目管理效率及降低软件测试项目管理成本。能够自动统计工作量、分析工作效率和预测工作完成周期,有助于对下个工作任务的安排,可以应对需求来安排工作计划,每天工作量的大小,人员的分配和计划工作周期,特别是当紧急任务或工作来临时的应急措施,有效的提高生产力。

上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,双屏设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。

实施例五

图5为本发明实施例五提供的电子设备的示意图。

所述电子设备5包括:存储器51、至少一个处理器52、存储在所述存储器51中并可在所述至少一个处理器52上运行的计算机程序53及至少一条通讯总线54。

所述至少一个处理器52执行所述计算机程序53时实现上述工作量评估模型训练方法及/或工作量评估方法实施例中的步骤。

示例性的,所述计算机程序53可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器51中,并由所述至少一个处理器52执行。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序53在所述电子设备5中的执行过程。

所述电子设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图5仅仅是电子设备5的示例,并不构成对电子设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备5还可以包括输入输出设备、网络接入设备、总线等。

所述至少一个处理器52可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。该处理器52可以是微处理器或者该处理器52也可以是任何常规的处理器等,所述处理器52是所述电子设备5的控制中心,利用各种接口和线路连接整个电子设备5的各个部分。

所述存储器51可用于存储所述计算机程序53和/或模块/单元,所述处理器52通过运行或执行存储在所述存储器51内的计算机程序和/或模块/单元,以及调用存储在存储器51内的数据,实现所述电子设备5的各种功能。所述存储器51可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备5的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器51可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述电子设备5集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

在本发明所提供的几个实施例中,应该理解到,所揭露的电子设备和方法,可以通过其它的方式实现。例如,以上所描述的电子设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1