一种基于卷积神经网络的信息系统故障诊断方法及装置与流程

文档序号:11143506阅读:348来源:国知局
一种基于卷积神经网络的信息系统故障诊断方法及装置与制造工艺
本发明涉及信息系统运行维护领域,特别涉及一种基于卷积神经网络的信息系统故障诊断方法及装置。
背景技术
:随着云计算、大数据的发展和应用,信息服务无处不在,已经完全融入到人们生产和生活之中,因此要求信息系统能够可靠地提供各类服务。信息系统运行时积累了大量数据,可以很好地反映信息系统的运行状态,为故障时的智能诊断提供了重要的基础。智能故障诊断是一个传统的研究领域,在各行各业都有着一定的研究和实践。在信息系统故障诊断方面,也开展了这方面的研究和探索。目前,现有技术支持向量机、BP神经网络(BP,BackPropagation,反向传播)和决策树等机器学习方法在信息通信故障诊断中已经得到了一定的研究和应用。但这些方法存在预测精度低,且需要人工选取特征从而导致主观性强等问题。技术实现要素:有鉴于此,本发明的目的在于提供一种基于卷积神经网络的信息系统故障诊断方法,以避免因人为因素而产生的误差,提高故障诊断精准度。其具体方案如下:一种基于卷积神经网络的信息系统故障诊断方法,包括:获取运行监控数据;利用所述运行监控数据,创建运行监控数据矩阵;将所述运行监控数据矩阵输入到故障诊断模型,得到诊断结果,其中,所述故障诊断模型为利用历史运行监控数据矩阵和运行状态标签,对卷积神经网络进行训练,得到所述故障诊断模型。优选的,所述利用所述运行监控数据,创建运行监控数据矩阵的过程包括:将所述运行监控数据按照信息的类型进行排列,创建所述运行监控数据矩阵。优选的,所述获取运行监控数据的过程包括:获取所述信息系统的运行数据;将所述运行数据进行归一化处理,得到所述运行监控数据。优选的,所述故障诊断模型的获得过程包括:预先创建所述卷积神经网络;利用反向传播算法、所述历史运行监控数据矩阵和所述运行状态标签对所述卷积神经网络进行训练,得到所述故障诊断模型。优选的,所述卷积神经网络包括:依次连接的输入层、第一特征提取层、第一特征映射层、第二特征提取层、第二特征映射层、卷积层和输出层。优选的,所述第一特征提取层和所述第二特征提取层中的卷积核均为5×5的卷积核,所述卷积层中的卷积核为3×3的卷积核,所述输出层为全连接层。本发明还公开了一种基于卷积神经网络的信息系统故障诊断装置,包括:数据获取模块,用于获取运行监控数据;矩阵创建模块,用于利用所述运行监控数据,得到运行监控数据矩阵;故障诊断模块,用于将所述运行监控数据矩阵输入到故障诊断模型,得到诊断结果,其中,所述故障诊断模型为利用历史运行监控数据矩阵和运行状态标签,对卷积神经网络进行训练,得到所述故障诊断模型,所述运行状态标签为通过用户对信息系统运行故障的状态进行记录得到的。优选的,所述运行监控数据矩阵获取模块具体用于将所述运行监控数据按照信息的类型进行排列,组成所述运行监控数据矩阵。优选的,所述运行监控数据获取模块包括:数据获取单元,用于获取所述信息系统的运行数据;归一化处理单元,用于将所述运行数据进行归一化处理,得到所述运行监控数据。优选的,所述故障诊断模块包括:网络创建单元,用于预先创建所述卷积神经网络;模型训练单元,用于利用反向传播算法、所述历史运行监控数据矩阵和所述运行状态标签对所述卷积神经网络进行训练,得到所述故障诊断模型。本发明中,基于卷积神经网络的信息系统故障诊断方法,包括:获取运行监控数据;利用运行监控数据,创建运行监控数据矩阵;将运行监控数据矩阵输入到故障诊断模型,得到诊断结果,其中,故障诊断模型为利用历史运行监控数据矩阵和运行状态标签,对卷积神经网络进行训练,得到故障诊断模型。可见,本发明中利用卷积神经网络创建故障诊断模型,对运行监控数据进行故障诊断,得出诊断结果,使得用户利用诊断结果可以对信息系统进行维护,使用卷积神经网络提升了对于特征的抽取能力和分类能力,能够更有效的诊断出系统的故障,避免了人为因素的干扰,提升了诊断的准确度,且对故障诊断模型的复用提升诊断效率,为信息系统的安全运行提供了支持。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。图1为本发明实施例提供的一种基于卷积神经网络的信息系统故障诊断方法的流程图;图2为本发明实施例提供的另一种基于卷积神经网络的信息系统故障诊断方法的流程图;图3为本发明实施例提供的一种卷积神经网络应用结构示意图;图4为本发明实施例提供的一种基于卷积神经网络的信息系统故障诊断装置结构示意图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例公开了一种基于卷积神经网络的信息系统故障诊断方法,参见图1所示,该方法包括:步骤S11:获取运行监控数据。具体的,采集信息系统各组成部分的运行状态信息,例如,主机、存储、数据库、中间件、应用软件等信息类型。采集的具体指标包括CPU利用率、内存使用率、磁盘空间使用率、数据库连接数、数据库表空间使用率、数据库运行状态、Java虚拟机使用率、日志报错信息、系统日访问量和在线用户数等指标,得到运行监控数据。步骤S12:利用运行监控数据,创建运行监控数据矩阵。具体的,诊断系统得到运行监控数据后,将运行监控数据按照信息的类型进行排列,创建运行监控数据矩阵。例如,参见表1运行监控数据矩阵组织示意表所示,按照存储、主机、数据库、中间件、应用系统等自上而下排列,当同一类信息类型中有多个设备或软件,则按照设备或软件的编号从左向右依次排列,即,矩阵的行数由信息的类型数量决定,矩阵的列数由包括设备或软件的最多的信息类型决定,最后创建出运行监控数据矩阵。表1存储S11S12S13...主机1M11M12M13...主机2M21M22M23...数据库1D11D12D13...数据库2D21D22D23...中间件1M11M12M13...中间件2M21M22M23...应用系统1A11A120...应用系统2A21A220...其中,由于每个信息类型的设备或软件数量不一样,而矩阵的列数以设备或软件数量最大值为标准,因此,在矩阵中未定义数据项的空白处用数字0补充。步骤S13:将运行监控数据矩阵输入到故障诊断模型,得到诊断结果,其中,故障诊断模型为利用历史运行监控数据矩阵和运行状态标签,对卷积神经网络进行训练,得到故障诊断模型。在实际应用中,由于卷积神经网络其优异的特征抽取能力和分类能力,在图像、语音、文本识别与分类应用中取得了非常好的效果,将人工智能技术向前推进了一大步,得到了科研领域和工业界的普遍关注,且卷积神经网络能够进行深度学习,深度学习算法是借鉴脑神经工作机理,在传统的人工神经网络技术上的延伸和发展,增加人工神经网络的隐层数量,并提出了有效训练方法,解决了神经网络训练的局部收敛问题,从而提升了神经网络的特征抽取能力和分类能力,因此本发明实施例中,故障诊断模型是基于卷积神经网络搭建的。具体的,诊断系统将得到的运行监控数据矩阵输入到预先训练好的故障诊断模型,通过故障诊断模型采用卷积神经网络对运行监控数据进行计算,分析出系统运行正常或故障的原因,得到诊断结果。其中,首次创建故障诊断模型需要预先创建卷积神经网络,卷积神经网络可以包括依次连接的输入层、特征提取层、特征映射层、卷积层和输出层;再利用历史运行监控数据矩阵和运行状态标签,对卷积神经网络进行训练,得到故障诊断模型,当下次再进行故障诊断时,可以复用训练好的故障诊断模型,以得到诊断结果。可见,本发明实施例中利用卷积神经网络创建故障诊断模型,对运行监控数据进行故障诊断,得出诊断结果,使得用户利用诊断结果可以对信息系统进行维护,使用卷积神经网络提升了对于特征的抽取能力和分类能力,能够更有效的诊断出系统的故障,避免了人为因素的干扰,提升了诊断的准确度,且对故障诊断模型的复用提升诊断效率,为信息系统的安全运行提供了支持。本发明实施例公开了一种具体的基于卷积神经网络的信息系统故障诊断方法,相对于上一实施例,本实施例对技术方案作了进一步的说明和优化。参考图2所示,具体的:步骤S21:获取信息系统的运行数据。诊断系统获取信息系统的各组成部分的各项运行数据。步骤S22:将运行数据进行归一化处理,得到运行监控数据。将获取到的运行数据进行归一化处理,使各项数据归一化到[0,1]范围,以便于统一各项数据的单位,便于后续的计算和分析,是结果更加准确。例如,当前cpu占用率为50%,磁盘空间使用量为6G,总空间为10G,数据库连接数为12,允许最大连接数为100,对cpu占用率、磁盘空间使用量和数据库连接数进行归一化,分别得到cpu占用率0.5、磁盘空间使用量0.6和数据库连接数0.12。步骤S23:利用运行监控数据,创建运行监控数据矩阵。步骤S23:将运行监控数据矩阵输入到故障诊断模型,得到诊断结果,其中,故障诊断模型为利用历史运行监控数据矩阵和运行状态标签,对卷积神经网络进行训练,得到故障诊断模型。具体的,使用故障诊断模型前,需要预先搭建故障诊断模型,首先预先创建卷积神经网络的初始模型,可以使用基于LeNet—5网络改进的卷积神经网络,搭建出依次连接的输入层、第一特征提取层、第一特征映射层、第二特征提取层、第二特征映射层、卷积层和输出层。其中,每层由多个二维平面组成,而每个平面由多个独立神经元组成;特征提取层中的每个神经元的输入与前一成的局部区域相连,并提取该局部的特征,因为下一层与上一层的局部点或局部位置上的元素有关,所以体现了不同二维特征之间的位置关系,一旦该局部特征被提取后,该局部特征与其他特征间的位置关系也随之确定下来,例如,在信息系统中,提取cpu的特征会确定出与内存之间的关联关系;神经网络中的每个计算层有多个特征映射组成,每个特征映射为一个平面,平面上所有神经元的权值相等,该平面集便是特征映射层。为使特征映射具有位移不变性,特征映射结构可以采用sigmod函数作为卷积网络的激活函数。具体的,得到卷积神经网络的初始模型后,逐层训练卷积神经网络,利用历史运行监控数据矩阵和运行状态标签,使历史运行监控数据矩阵作为输入层,经过逐级的变换,直到输出,例如,设置初始网络参数包括卷积核、运行几次卷积运算和权值矩阵等参数,将历史运行监控数据矩阵作为输入层,第一特征提取层利用相应的卷积核对输入层进行卷积运算,得到第一特征提取层的特征图;第一特征映射层对第一特征提取层进行采样,生成第一特征映射层的特征图;第二特征提取层利用相应的卷积核对第一特征映射层进行卷积运算,得到第二特征提取层的特征图;第二特征映射层对第二特征提取层进行采样,得到第二特征映射层的特征图;卷积层利用相应的卷积核对第二特征映射层进行卷积运算,得到特征集;输出层再对卷积层中的特征集进行运算,得到输出层的特征集,作为初始结果。其中,运行状态标签为用户对信息系统运行故障的状态进行标注和记录,形成运行监控数据和运行状态标签的对应关系。进一步,得到初始结果后,利用反向传播算法,计算初始结果与理想输出的差,按最小化误差的方法调整权值矩阵,得到优化后的网络参数,例如,参见图4所示,上述训练卷积神经网络的例子中,输入层采用24×24的结构,第一特征提取层C1利用5×5的卷积核对输入层进行卷积计算,得到20×20的特征图;第一特征映射层S2对第一特征提取层C1进行1/2的采样生成10×10的特征图;第二特征提取层C3利用5×5的卷积核对第一特征映射层S2进行卷积计算,得到6×6的特征图;第二特征映射层S4对第二特征提取层C3进行1/2的采样生成3×3的特征图;卷积层C5利用3×3的卷积核对第二特征映射层S4进行卷积运算,得到100个特征;输出层采用全连接,即全连接层,对100个特征进行运算,得到60个对应信息系统故障的分类的特征。可以理解的是,在图像中以ai,j为左上角,ai+4,j+4为右下角元素的矩阵与5×5卷积核的卷积值为:其中,ai,j是二位矩阵中的元素,bn,m是卷积核中的元素,n和m的取值范围为[1,2,3,4,5],i和j为图像中的坐标。需要说明的是,得到优化后的网络参数后,将其输入到卷积神经网络中,得到训练好的故障诊断模型,当再次使用诊断系统时,不再需要重新创建故障诊断模型,可以直接使用先前训练好的故障诊断模型,得到诊断结果。当然,根据实际需要也可以调整故障诊断模型中的各项参数,而不局限于上述例子中的具体参数,在此不做限定。另外,本发明实施例还提供了一种基于卷积神经网络的信息系统故障诊断装置,参见图4所示,该装置包括:数据获取模块11,用于获取运行监控数据;矩阵创建模块12,用于利用运行监控数据,得到运行监控数据矩阵;故障诊断模块13,用于将运行监控数据矩阵输入到故障诊断模型,得到诊断结果,其中,故障诊断模型为利用历史运行监控数据矩阵和运行状态标签,对卷积神经网络进行训练,得到故障诊断模型,运行状态标签为通过用户对信息系统运行故障的状态进行记录得到的。具体的,运行监控数据矩阵获取模块具体用于将运行监控数据按照信息的类型进行排列,组成运行监控数据矩阵。上述运行监控数据获取模块11包括数据获取单元和归一化处理单元;其中,数据获取单元,用于获取信息系统的运行数据;归一化处理单元,用于将运行数据进行归一化处理,得到运行监控数据。上述故障诊断模块13包括网络创建单元和模型训练单元;其中,网络创建单元,用于预先创建卷积神经网络。其中,卷积神经网络包括:依次连接的输入层、第一特征提取层、第一特征映射层、第二特征提取层、第二特征映射层、卷积层和输出层;第一特征提取层和第二特征提取层中的卷积核均为5×5的卷积核,卷积层中的卷积核为3×3的卷积核,输出层为全连接层。模型训练单元,用于利用反向传播算法、历史运行监控数据矩阵和运行状态标签对卷积神经网络进行训练,得到故障诊断模型。可见,本发明实施例中利用卷积神经网络创建故障诊断模型,对运行监控数据进行故障诊断,得出诊断结果,使得用户利用诊断结果可以对信息系统进行维护,使用卷积神经网络提升了对于特征的抽取能力和分类能力,能够更有效的诊断出系统的故障,避免了人为因素的干扰,提升了诊断的准确度,且对故障诊断模型的复用提升诊断效率,为信息系统的安全运行提供了支持。最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。以上对本发明所提供的一种基于卷积神经网络的信息系统故障诊断方法及装置进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1