本发明属于服务器测试技术领域,具体涉及一种存储子系统故障诊断方法、装置、终端及存储介质。
背景技术
raid卡是存储子系统的心脏,一个存储子系统的性能和稳定性与链路的稳定性等因素密切相关。当遇到存储子系统故障时,经常会用协议分析仪抓取raid卡到硬盘之间链路上的trace进行分析,而分析trace需要非常专业的知识,且费时费力,无法做到批量进行。
技术实现要素:
针对现有技术的不足,本发明提供一种存储子系统故障诊断方法、装置、终端及存储介质,以解决上述技术问题。
第一方面,本申请实施例提供一种存储子系统故障诊断方法,所述方法包括:
通过协议分析仪抓取故障机器的trace文件;
创建故障数据库,并向所述故障数据库输入常见故障信息;
根据所述trace文件调取相关协议;
根据所述相关协议分析所述trace文件并得到分析数据;
根据相关协议将所述分析数据与所述常见故障信息进行匹配并根据匹配结果获取故障诊断结果。
结合第一方面,在第一方面的第一种实施方式中,所述根据trace文件调取相关协议包括:
读取trace文件;
将所述trace文件与数据库中的协议进行匹配;
判断是否存在与所有trace匹配的协议:
是,则调取所述匹配协议作为相关协议;
否,则循环对trace文件与协议的匹配操作。
结合第一方面,在第一方面的第二种实施方式中,所述根据相关协议分析所述trace文件并得到分析数据包括:
读取所述trace文件;
判断所述trace文件发生的命令和接受的命令是否符合所述相关协议:
是,则判定所述trace文件正常;
否,则判定所述trace文件正常并将异常数据作为分析数据输出。
结合第一方面,在第一方面的第三种实施方式中,所述方法还包括:
判断故障数据库中是否存在与故障诊断结果一致的故障信息:
是,则完成诊断程序并显示所述故障诊断结果;
否,则将所述故障诊断结果存储至故障数据库。
第二方面,本申请实施例提供一种存储子系统故障诊断装置,所述装置包括:
抓取单元,配置用于通过协议分析仪抓取故障机器的trace文件;
创建单元,配置用于创建故障数据库,并向所述故障数据库输入常见故障信息;
调取单元,配置用于根据所述trace文件调取相关协议;
分析单元,配置用于根据所述相关协议分析所述trace文件并得到分析数据;
诊断单元,配置用于根据相关协议将所述分析数据与所述常见故障信息进行匹配并根据匹配结果获取故障诊断结果。
结合第二方面,在第二方面的第一种实施方式中,所述调取单元包括:
读取模块,配置用于读取trace文件;
匹配模块,配置用于将所述trace文件与数据库中的协议进行匹配;
判断模块,配置用于判断是否存在与所有trace匹配的协议;
调取模块,配置用于调取所述匹配协议作为相关协议;
循环模块,配置用于循环对trace文件与协议的匹配操作。
结合第二方面,在第二方面的第二种实施方式中,所述分析单元包括:
文件读取模块,配置用于读取所述trace文件;
文件判断模块,配置用于判断所述trace文件发生的命令和接受的命令是否符合所述相关协议;
正常判定模块,配置用于判定所述trace文件正常;
数据输出模块,配置用于判定所述trace文件正常并将异常数据作为分析数据输出。
结合第二方面,在第二方面的第三种实施方式中,所述装置还包括:
结果匹配单元,配置用于判断故障数据库中是否存在与故障诊断结果一致的故障信息;
诊断显示单元,配置用于完成诊断程序并显示所述故障诊断结果;
结果存储单元,配置用于将所述故障诊断结果存储至故障数据库。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端终端执行上述的终端终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的存储子系统故障诊断方法、装置、终端及存储介质,通过创建一个存储有大量常见故障信息的故障数据库,抓取故障机器的trace文件后,调取相关协议,结合相关协议对trace文件进行分析并将得到的分析结果与故障信息进行匹配,进而获取故障机器的故障诊断结果。本发明可以快速批量的进行trace的分析,精准定位问题点,并提供根据协议模拟故障现象,与实际故障进行比对,更准确地找到问题的rootcause,更快、更准确的解决存储子系统的问题和故障。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请一个实施例的方法的示意性流程图。
图2是本申请一个实施例的装置的示意性框图。
图3为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本申请中出现的关键术语进行解释。
图1是本申请一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种存储子系统故障诊断装置。
如图1所示,该方法100包括:
步骤110,通过协议分析仪抓取故障机器的trace文件;
步骤120,创建故障数据库,并向所述故障数据库输入常见故障信息;
步骤130,根据所述trace文件调取相关协议;
步骤140,根据所述相关协议分析所述trace文件并得到分析数据;
步骤150,根据相关协议将所述分析数据与所述常见故障信息进行匹配并根据匹配结果获取故障诊断结果。
为了便于对本发明的理解,下面以本发明存储子系统故障诊断方法的原理,结合实施例中对存储子系统故障进行诊断的过程,对本发明提供的存储子系统故障诊断方法做进一步的描述。
可选地,作为本申请一个实施例,所述根据trace文件调取相关协议包括:
读取trace文件;
将所述trace文件与数据库中的协议进行匹配;
判断是否存在与所有trace匹配的协议:
是,则调取所述匹配协议作为相关协议;
否,则循环对trace文件与协议的匹配操作。
可选地,作为本申请一个实施例,所述根据相关协议分析所述trace文件并得到分析数据包括:
读取所述trace文件;
判断所述trace文件发生的命令和接受的命令是否符合所述相关协议:
是,则判定所述trace文件正常;
否,则判定所述trace文件正常并将异常数据作为分析数据输出。
可选地,作为本申请一个实施例,所述方法还包括:
判断故障数据库中是否存在与故障诊断结果一致的故障信息:
是,则完成诊断程序并显示所述故障诊断结果;
否,则将所述故障诊断结果存储至故障数据库。
具体的,所述存储子系统故障诊断方法包括:
s1、通过协议分析仪抓取故障机器的trace文件。
通过协议分析仪抓取故障机器的trace,根据需求和故障现象,确认抓取raid/sas卡到硬盘背板之间的trace或者硬盘背板到盘之间的trace。
s2、用于创建故障数据库,并向所述故障数据库输入常见故障信息。
创建故障数据库,输入一些常见的或曾经诊断出的故障信息,故障信息为trace文件异常数据对应的故障以及故障现象(如掉盘、宕机、reset),建立故障信息与协议之间的映射关系。
根据收集到的故障数据继续增加和丰富。对故障机器进行诊断得到故障诊断结果后,判定故障数据库中是否已经存在一致的故障信息,如果不存在就将得到的故障诊断结果存储至故障数据库。
s3、根据所述trace文件调取相关协议。
读取多条完整的trace,依次比对数据库中的协议,找出完全符合的协议即可用来作为这次分析所要遵循的协议种类。协议可以是sff-8485,sff-8489等。
s4、根据所述相关协议分析所述trace文件并得到分析数据。
读取每条完整的trace,判断这个trace是否完全按照相关协议执行,发生的命令和接受的命令是否符合相关协议标准,若trace文件不符合相关协议,就将异常数据作为分析数据输出。
s5、根据相关协议将所述分析数据与所述常见故障信息进行匹配并根据匹配结果获取故障诊断结果。
确定与分析数据对应的相关协议,查找故障数据库中与相关协议有映射关系的故障信息,将分析数据与查找到的故障信息进行匹配,得到匹配故障信息,进而得到故障机器的故障诊断结果。
另外,在得到匹配故障信息后,也可以通过判断机器实际故障现象与故障信息中的故障现象进行对比,若是两者表现一致,则说明故障诊断结果是正确的。
如图2示,该装置200包括:
抓取单元210,所述抓取单元210用于通过协议分析仪抓取故障机器的trace文件;
创建单元220,所述创建单元220用于创建故障数据库,并向所述故障数据库输入常见故障信息;
调取单元230,所述调取单元230用于根据所述trace文件调取相关协议;
分析单元240,所述分析单元240用于根据所述相关协议分析所述trace文件并得到分析数据;
诊断单元250,所述诊断单元250用于根据相关协议将所述分析数据与所述常见故障信息进行匹配并根据匹配结果获取故障诊断结果。
可选地,作为本申请一个实施例,所述调取单元包括:
读取模块,配置用于读取trace文件;
匹配模块,配置用于将所述trace文件与数据库中的协议进行匹配;
判断模块,配置用于判断是否存在与所有trace匹配的协议;
调取模块,配置用于调取所述匹配协议作为相关协议;
循环模块,配置用于循环对trace文件与协议的匹配操作。
可选地,作为本申请一个实施例,所述分析单元包括:
文件读取模块,配置用于读取所述trace文件;
文件判断模块,配置用于判断所述trace文件发生的命令和接受的命令是否符合所述相关协议;
正常判定模块,配置用于判定所述trace文件正常;
数据输出模块,配置用于判定所述trace文件正常并将异常数据作为分析数据输出。
可选地,作为本申请一个实施例,所述装置还包括:
结果匹配单元,配置用于判断故障数据库中是否存在与故障诊断结果一致的故障信息;
诊断显示单元,配置用于完成诊断程序并显示所述故障诊断结果;
结果存储单元,配置用于将所述故障诊断结果存储至故障数据库。
图3为本发明实施例提供的一种终端装置300的结构示意图,该终端装置300可以用于执行本申请实施例提供的更新散热策略参数的方法。
其中,该终端装置300可以包括:处理器310、存储器320及通信单元330。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本申请的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器320可以用于存储处理器310的执行指令,存储器320可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。当存储器320中的执行指令由处理器310执行时,使得终端300能够执行以下上述方法实施例中的部分或全部步骤。
处理器310为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器320内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(integratedcircuit,简称ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器310可以仅包括中央处理器(centralprocessingunit,简称cpu)。在本申请实施方式中,cpu可以是单运算核心,也可以包括多运算核心。
通信单元330,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本申请还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本申请提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:rom)或随机存储记忆体(英文:randomaccessmemory,简称:ram)等。
因此,本申请通过创建一个存储有大量常见故障信息的故障数据库,抓取故障机器的trace文件后,调取相关协议,结合相关协议对trace文件进行分析并将得到的分析结果与故障信息进行匹配,进而获取故障机器的故障诊断结果。本发明可以快速批量的进行trace的分析,精准定位问题点,并提供根据协议模拟故障现象,与实际故障进行比对,更准确地找到问题的rootcause,更快、更准确的解决存储子系统的问题和故障,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。