本发明涉及机房设备故障诊断,具体涉及一种机房多系统故障诊断处理方法、系统、设备及介质。
背景技术:
1、机房中的设备包括调控设备、服务器、安全设备和供电设备等多种类型。传统的方式保证机房正常运行一般是定期巡检机房及时发现机房内环境和设备运行存在的问题,从而及时排除故障,消除隐患,避免影响整体系统的运行,确保系统始终处于安全稳定的运行状态。
2、随着电力机房的不断发展,目前机房内不同功能的系统也越来越多,系统之间有的相互连接,有的独立运行。每套系统都有与之对应的设备。为了保障机房的运行每个机房一般都安装有动力环境监控系统用于监控机房设备的运行情况。一旦机房中的环境温度和设备出现故障,将会导致整个系统的运行出现问题,例如若机房的温度过高,可能会损坏机房内的电子设备,温度过低则会导致设备运行不够灵敏;若机房的湿度过高时,可能会导致结露,若湿度太低,可能导致静电放电问题,从而损坏元器件。
3、基于动力环境监控系统采集的数据多源化,不同设备的系统故障处理方法不同,运维人员值班在排除故障时,费时费力。当机房出现故障时,容易出现故障报警不及时等问题。
技术实现思路
1、针对现有机房故障运维时存在的问题,本发明提供一种机房多系统故障诊断处理方法、系统、设备及介质。
2、第一方面,本发明技术方案提供一种机房多系统故障诊断处理方法,包括如下步骤:
3、获取每个机房设备监测终端的标识符;
4、采集机房设备的运行数据传输至机房设备监测终端;
5、通过机房设备监测终端对采集的运行数据进行初始故障诊断;
6、将初始诊断结果中故障以及存在风险的运行数据以及对应设备的类型和地址传输至管理端;
7、通过管理端对获取的故障以及存在风险的运行数据按照对应机房设备的类型进行处理,并输出故障诊断结果;并将故障的机房设备连接的机房设备监测终端的标识符中对应的位置1,根据标识符输出故障定位信息;
8、根据所述故障诊断结果利用预设的专家模型库推荐故障解决方案并按照所述方案向故障的机房设备发送故障处理程序。
9、作为本发明技术方案的进一步限定,获取每个机房设备监测终端的标识符的步骤之前包括:
10、每个机房设备监测终端设置一个唯一id,各机房设备监测终端连接有多个采集节点,每个采集节点设置一个唯一的id;每个采集节点设置一个采集模块;
11、每个机房设备监测终端连接的采集节点按照id号进行排列生成节点列表;
12、设置标识符的前n位为机房设备监测终端的id号,后面的位依次按照节点列表每一位代表一个采集节点,默认采集节点的位置0;其中,当诊断有故障时将标识符中对应采集节点的位置1。
13、作为本发明技术方案的进一步限定,通过机房设备监测终端对采集的运行数据进行初始故障诊断的步骤包括:
14、通过机房设备监测终端将采集的运行数据与故障库进行比对确定故障以及存在风险的运行数据。
15、作为本发明技术方案的进一步限定,将初始诊断结果中故障以及存在风险的运行数据以及对应设备的类型和地址传输至管理端的步骤包括:
16、将初始诊断结果中故障以及存在风险的运行数据以及对应设备的类型和地址生成目标数据;
17、确定目标数据所需的存储空间的大小,并将存储空间的大小转换为二进制编码;
18、根据二进制编码的位数确定目标数据中的待插入位置;
19、将二进制编码的每一位插入对应待插入位置;
20、将二进制编码以及对应的待插入位置生成验证信息;
21、将目标数据以及验证信息传输至管理端。
22、作为本发明技术方案的进一步限定,通过管理端对获取的故障以及存在风险的运行数据按照对应机房设备的类型进行处理,并输出故障诊断结果的步骤之前包括:
23、获取目标数据以及验证信息;
24、通过获取的验证信息对获取的目标数据进行一致性检验;
25、检验通过后,执行步骤:通过管理端对获取的故障以及存在风险的运行数据按照对应机房设备的类型进行处理,并输出故障诊断结果;
26、检验不通过,发送数据请求信息给对应的机房设备监测终端;
27、基于所述请求将目标数据以及验证信息传输至管理端。
28、作为本发明技术方案的进一步限定,通过管理端对获取的故障以及存在风险的运行数据按照对应机房设备的类型进行处理,并输出故障诊断结果的步骤中,对故障的运行数据进行处理输出故障诊断结果的步骤包括:
29、通过管理端对获取的故障的运行数据按照对应机房设备的类型进行处理;
30、判断对应的训练好的故障诊断模型是否存在;
31、若是,基于训练好的故障诊断模型输出故障诊断结果;
32、若否,获取该类型机房设备的历史运行数据进行深度学习和知识抽取,构建故障诊断模型并存储至数据库;
33、基于处理后的数据结合构建的故障诊断模型获取机房设备的故障诊断结果。
34、作为本发明技术方案的进一步限定,根据所述故障诊断结果利用预设的专家模型库推荐故障解决方案并按照所述方案向故障的机房设备发送故障处理程序的步骤包括:
35、根据所述故障诊断结果利用预设的专家模型库推荐故障解决方案;
36、按照所述方案判断对应的故障处理程序是否存在;
37、若是,获取对应的故障处理程序并发送到故障的机房设备;
38、判断设定时间内是否接收到故障的设备基于故障处理程序返回的故障解除信息;
39、若接收到,输出故障解除成功提示信息;
40、若未接收到,输出故障解除失败提示信息;
41、若否,获取与所述方案匹配度最高的故障处理程序;
42、基于所述方案对匹配到的故障处理程序进行修订,将修订后的故障处理程序与对应方案建立关联后进行存储;
43、将修订后的故障处理程序发送到故障的机房设备;执行步骤:判断设定时间内是否接收到故障的设备基于故障处理程序返回的故障解除信息。
44、第二方面,本发明技术方案还提供一种机房多系统故障诊断处理系统,包括数据采集模块、机房设备监测终端和管理端;
45、数据采集模块,用于采集机房设备的运行数据传输至机房设备监测终端;
46、机房设备监测终端,用于对采集的运行数据进行初始故障诊断;将初始诊断结果中故障以及存在风险的运行数据以及对应设备的类型和地址传输至管理端;
47、管理端,用于获取每个机房设备监测终端的标识符,对获取的故障以及存在风险的运行数据按照对应机房设备的类型进行处理,并输出故障诊断结果;并将故障的机房设备连接的机房设备监测终端的标识符中对应的位置1,根据标识符输出故障定位信息;根据所述故障诊断结果利用预设的专家模型库推荐故障解决方案并按照所述方案向故障的机房设备发送故障处理程序。
48、作为本发明技术方案的进一步限定,机房设备监测终端,用于将采集的运行数据与故障库进行比对确定故障以及存在风险的运行数据。
49、作为本发明技术方案的进一步限定,机房设备监测终端包括目标数据生成单元、验证信息生成单元和数据发送单元;
50、目标数据生成单元,用于将初始诊断结果中故障以及存在风险的运行数据以及对应设备的类型和地址生成目标数据;
51、验证信息生成单元,用于确定目标数据所需的存储空间的大小,并将存储空间的大小转换为二进制编码;根据二进制编码的位数确定目标数据中的待插入位置;将二进制编码的每一位插入对应待插入位置;将二进制编码以及对应的待插入位置生成验证信息;
52、数据发送单元,用于将目标数据以及验证信息传输至管理端。
53、作为本发明技术方案的进一步限定,管理端包括验证单元、数据请求发送单元和故障诊断单元;
54、验证单元,用于获取目标数据以及验证信息;通过获取的验证信息对获取的目标数据进行一致性检验;
55、故障诊断单元,用于检验通过后,对获取的故障以及存在风险的运行数据按照对应机房设备的类型进行处理,并输出故障诊断结果;
56、数据请求发送单元,用于检验不通过,发送数据请求信息给对应的机房设备监测终端。
57、作为本发明技术方案的进一步限定,故障诊断单元,用于对获取的故障的运行数据按照对应机房设备的类型进行处理;判断对应的训练好的故障诊断模型是否存在;若是,基于训练好的故障诊断模型输出故障诊断结果;若否,获取该类型机房设备的历史运行数据进行深度学习和知识抽取,构建故障诊断模型并存储至数据库;基于处理后的数据结合构建的故障诊断模型获取机房设备的故障诊断结果。
58、作为本发明技术方案的进一步限定,故障诊断单元,还用于对接收到的机房设备电源连接器的声音信号进行处理计算得到电源连接器声音信号的能量谱密度;对得到的能量谱密度通过傅里叶及小波变换进行降噪处理;将处理后的能量谱密度进行特征提取并基于提取的特征结合训练好的故障诊断模型输出故障诊断结果。
59、作为本发明技术方案的进一步限定,管理端还包括故障处理单元,用于根据所述故障诊断结果利用预设的专家模型库推荐故障解决方案;按照所述方案判断对应的故障处理程序是否存在;若是,获取对应的故障处理程序并发送到故障的机房设备;判断设定时间内是否接收到故障的设备基于故障处理程序返回的故障解除信息;若接收到,输出故障解除成功提示信息;若未接收到,输出故障解除失败提示信息;若否,获取与所述方案匹配度最高的故障处理程序;基于所述方案对匹配到的故障处理程序进行修订,将修订后的故障处理程序与对应方案建立关联后进行存储;将修订后的故障处理程序发送到故障的机房设备。
60、第三方面,本发明技术方案还提供一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如第一方面所述的机房多系统故障诊断处理方法。
61、第四方面,本发明技术方案还提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如第一方面所述的机房多系统故障诊断处理方法。
62、从以上技术方案可以看出,本发明具有以下优点:
63、1、通过机房设备监测终端对采集的运行数据进行初始故障诊断,然后通过管理端对获取的故障以及存在风险的运行数据按照对应机房设备的类型进行处理,并输出故障诊断结果,通过自动化诊断方式当机房出现故障时,能第一时间报警,解决出现故障报警不及时的问题,通过两级诊断进一步保证诊断结果的准确性。
64、2、接收数据请求并对接收到的数据请求进行解析,根据解析结果获取目标数据,同时生成目标数据的验证信息一起发送到管理端,管理端对接收到的数据进行一致性验证时,验证信息可以用作对接收到的数据进行验证的工具,不需要将接收到的数据的各部分信息进行注意比对,节省数据验证的时间,提高数据处理的效率。
65、3、每个机房设备监测终端设置一个标识符,通过标识符对应位的值进行故障定位,提高故障定位的准确性。
66、4、根据所述故障诊断结果利用预设的专家模型库推荐故障解决方案并按照所述方案向故障的机房设备发送故障处理程序,进一步提高了故障处理效率。
67、此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
68、由此可见,本发明与现有技术相比,具有突出的实质性特点和显著地进步,其实施的有益效果也是显而易见的。