一种基于关联规则分析的软件质量管理方法及系统与流程

文档序号:18101915发布日期:2019-07-06 11:24阅读:601来源:国知局
一种基于关联规则分析的软件质量管理方法及系统与流程

本发明涉及人工智能技术领域,具体地说是一种基于关联规则分析的软件质量管理方法及系统。



背景技术:

随着第四次工业革命时代的到来,信息技术急速发展,大量帮助社会提高数据化和自动化的软件被物联网企业和软件公司开发出来。因此,软件质量管理也随之成为了一个重要课题。

通常软件公司会建立自己的数据库,对客户反馈回来的软件问题进行记录归类和总结。但是,由于数据量较大且运算复杂,单靠人力进行分析很难挖掘出深层的数据规律和价值点,很难挖掘出或准确的确定与软件问题间的相关性和与影响软件质量的相关因素。



技术实现要素:

本发明的技术任务是针对以上不足之处,提供一种基于关联规则分析的软件质量管理方法及系统,利用关联分析的方法快速发现软件的主要问题,从而可以有针对性的维护和修复软件问题,更高质量、高效率的完成工作。

本发明解决其技术问题所采用的技术方案是:

一种基于关联规则分析的软件质量管理方法,该方法基于关联规则分析,

选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,即高频项目组,高频项目组基于最小支持度得出;

然后计算所选高频项目组的置信度是否满足最小置信度;

最后将同时满足最小支持度和最小置信度的项目组产生的规则划为与软件质量问题的关联规则。

关联规则是形如x->y的蕴含式,是关联两个无交集项集的概念。关联规则的强弱可以用支持度和置信度两个指标来度量。根据业务需求设定最小支持度和最小置信度,同时满足所设定的最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。

优选的,所述选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,采用apriori算法,从原数据中根据设定的最小支持度阈值筛选出高频项目组。apriori算法是一种挖掘关联规则的代表性算法,核心思想是基于两阶段频集思想的递推算法,有利于更高质量、更高效率的完成运算。

具体的,所述关联规则分析的关联规则挖掘任务包括频繁项集产生和规则产生两个子任务,

所述频繁项集产生用于发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;

所述规则产生用于从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。

通过频繁项集产生和规则产生任务实现支持度与置信度的结合,通过强关联规则快速发现软件主要问题所在。

该基于关联规则分析的软件质量管理方法,其具体实施步骤如下:

1)、整理被分析的软件质量数据库的管理内容(即数据库中记录的软件问题的条目),对其进行业务方面的了解,对与软件问题关联性强的条目进行初步筛选;同时,对描述性的文本类条目进行自然语言文本处理;

2)、对被选取的分析数据进行关联规则分析:

首先根据业务需求确定最小支持度,

然后利用apriori算法根据预设的最小支持度阈值筛选出高频项目组;

3)、利用步骤2)得到的高频项目组产生关联规则,通过计算高频项目组的置信度是否满足最小置信度,产生反应软件质量问题内在联系的强关联规则。

通过产生的强关联规则我们能快速发现软件主要问题所在,进而有针对性的维护和修复软件存在的问题。

进一步的,根据关联规则分析所需的分析数据要求,所述的自然语言文本处理包括分词处理等。

本发明还公开了一种基于关联规则分析的软件质量管理系统,包括软件质量管理数据库、数据预处理模块、关联规则分析模块和强关联规则产生模块,

软件质量管理数据库用于存储与软件质量问题相关的条目,软件公司建立数据库,对客户反馈回来的软件问题进行记录归类和总结;

数据预处理模块用于对软件质量管理数据库中的条目进行问题的特征初步筛选和自然语言文本处理,使其符合关联规则分析的业务需求以及数据输入要求;

关联规则分析模块用于确定最小支持度,并根据预设的最小支持度阈值筛选出高频项目组;

强关联规则产生模块用于根据所述高频项目组产生反应软件质量问题内在联系的强关联规则。

在关联规则挖掘任务中包括频繁项集产生子任务和规则产生子任务,频繁项集产生目标是发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;规则产生的目标是从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。本系统中,关联规则分析模块完成频繁项集产生,通过预设的最小支持度得到频繁项;强关联规则分析模块完成强规则的产生的,通过预设的最小置信度得到与软件质量问题关联的强规则。

优选的,对于关联规则分析数据的预处理,根据数据输入要求,自然语言文本处理包括分词处理等。

优选的,所述关联规则分析模块采用apriori算法筛选出高频项目组。apriori算法从原始数据中根据设定的最小支持度阈值筛选出高频项目组,及选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组。

进一步的,强关联规则产生模块通过计算高频项目组的置信度是否满足最小置信度来产生所述强关联规则。

同时满足最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。

本发明的一种基于关联规则分析的软件质量管理方法及系统与现有技术相比,具有以下有益效果:

该方法采用apriori算法,将apriori算法应用于软件质量管理和维护库中,通过客户反馈的问题产生关联规则;通过产生的强关联规则快速发现软件主要问题所在,进而可以有针对性的维护和修复软件存在的问题,有助于更高质量、高效率的完成工作。

该系统能够优化软件的质量管理工作的流程与效率,可极大的促进软件公司和互联网企业的发展进步。

附图说明

图1是本发明的基于关联规则分析的软件质量管理方法流程图;

图2是本发明的基于关联规则分析的软件质量管理系统框图。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

一种基于关联规则分析的软件质量管理方法,该方法基于关联规则分析,结合业务知识,选取要研究的关联特征;

采用apriori算法,从原数据中根据设定的最小支持度阈值筛选出高频项目组,选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组,即高频项目组,高频项目组基于最小支持度得出;

然后计算所选高频项目组的置信度是否满足最小置信度;

最后将同时满足最小支持度和最小置信度的项目组产生的规则划为与软件质量问题的关联规则。

关联规则是形如x->y的蕴含式,是关联两个无交集项集的概念。关联规则的强弱可以用支持度和置信度两个指标来度量。根据业务需求设定最小支持度和最小置信度,同时满足所设定的最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。

其中,关联规则分析的关联规则挖掘任务包括频繁项集产生和规则产生两个子任务,

所述频繁项集产生用于发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;

所述规则产生用于从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。

通过频繁项集产生和规则产生任务实现支持度与置信度的结合,通过强关联规则快速发现软件主要问题所在。

该基于关联规则分析的软件质量管理方法,其具体实施步骤如下:

1)、整理被分析的软件质量数据库的管理内容(即数据库中记录的软件问题的条目),对其进行业务方面的了解,对与软件问题关联性强的条目进行初步筛选;同时,对描述性的文本类条目进行分词等自然语言文本预处理;

2)、对被选取的分析数据进行关联规则分析:

首先根据业务需求确定最小支持度,

然后利用apriori算法根据预设的最小支持度阈值筛选出高频项目组;

3)、利用步骤2)得到的高频项目组产生关联规则,通过计算高频项目组的置信度是否满足最小置信度,产生反应软件质量问题内在联系的强关联规则。

通过产生的强关联规则我们能快速发现软件主要问题所在,进而有针对性的维护和修复软件存在的问题。

在关联规则的思想指导下利用apriori算法挖掘出软件质量管理数据库中的频繁项目集。将关联规则分析算法应用于软件质量管理和维护库的规范化上,该方法可以挖掘出软件质量问题的相关因素和软件问题间的相关性。

在本发明的一个实施例中,一种基于关联规则分析的软件质量管理系统,包括软件质量管理数据库、数据预处理模块、关联规则分析模块和强关联规则产生模块。其中,

软件质量管理数据库用于存储与软件质量问题相关的条目,软件公司建立数据库,对客户反馈回来的软件问题进行记录归类和总结;

数据预处理模块用于对软件质量管理数据库中的条目进行问题的特征初步筛选和自然语言文本处理,使其符合关联规则分析的业务需求以及数据输入要求,对于关联规则分析数据的预处理,根据数据输入要求,自然语言文本处理包括分词处理等;

关联规则分析模块用于确定最小支持度,并根据预设的最小支持度阈值筛选出高频项目组;

强关联规则产生模块用于根据所述高频项目组产生反应软件质量问题内在联系的强关联规则。

在关联规则挖掘任务中包括频繁项集产生子任务和规则产生子任务,频繁项集产生目标是发现满足支持最小支持度阈值的所有项集,这些项集称为频繁项;规则产生的目标是从所述频繁项集中提取所有高置信度的规则,这些规则称为强规则。本系统中,关联规则分析模块完成频繁项集产生,通过预设的最小支持度得到频繁项;强关联规则分析模块完成强规则的产生的,通过预设的最小置信度得到与软件质量问题关联的强规则。

关联规则分析模块采用apriori算法筛选出高频项目组。apriori算法从原始数据中根据设定的最小支持度阈值筛选出高频项目组,及选出软件质量管理数据库中在同一条问题下出现频率较高的词汇组。

强关联规则产生模块通过计算高频项目组的置信度是否满足最小置信度来产生所述强关联规则。

同时满足最小支持度和最小置信度的项目组所产生的规则即为我们需求的关联规则。

该系统将apriori算法应用于软件质量管理数据的规则分析中,利用关联分析的方法发掘出与软件问题间的相关性和影响软件质量的相关因素,如版本、操作系统或使用用户等。

通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。

除说明书所述的技术特征外,均为本专业技术人员的已知技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1