本申请属于故障识别,尤其涉及一种故障识别方法、装置、设备、介质及产品。
背景技术:
1、现有技术中,在判断存储节点是否故障时,一般是通过相邻的存储节点之间的心跳消息报活机制来检测存储节点是否故障。具体地,是通过至少两个相邻存储节点向目标存储节点发送多次告警信息,若该目标存储节点连续两次回复告警信息超时,则会判定该目标存储节点故障,以便后续将该目标存储节点隔离。但是该方式会在识别故障存储节点的过程耗费较多时间,进而导致识别故障存储节点的效率较低。
技术实现思路
1、本申请实施例提供一种故障识别方法、装置、设备、介质及产品,通过减少识别故障存储节点所需的时间,提高了识别故障存储节点的效率。
2、第一方面,本申请实施例提供一种故障识别方法,应用于监控节点,监控节点存在于分布式存储系统中,分布式存储系统中还包括多个存储节点和管道轮询节点,管道轮询节点位于监控节点与多个存储节点之间,方法包括:
3、读取管道轮询节点内的待读取信息,待读取信息为虚拟文件层在执行io操作时,与虚拟文件层对应的存储节点写入管道轮询节点的故障信息;
4、基于在虚拟文件层在执行io操作时,与虚拟文件层对应的存储节点写入管道轮询节点的故障信息,确定故障存储节点。
5、在第一方面的一种可选的实施方式中,方法还包括:
6、基于故障存储节点,更新监控节点中的预设存储节点表。
7、在第一方面的一种可选的实施方式中,基于故障存储节点,更新监控节点中的预设存储节点表,包括:
8、通过在预设存储节点表中删除故障存储节点,更新监控节点中的预设存储节点表。
9、在第一方面中的一种可选的实施方式中,分布式存储系统还包括订阅接口;在读取管道轮询节点内的待读取信息之前,方法还包括:
10、接收用户设备通过订阅接口发送的io操作请求,io操作请求中包括密钥信息;
11、基于密钥信息,对用户设备进行鉴权验证,并在用户设备鉴权验证通过的情况下,向用户设备发送监控节点中的预设存储节点表,以用于用户设备基于预设存储节点表,利用哈希算法计算第一io路径信息,并向第一io路径信息中所包括至少一个存储节点发送io操作请求,以用于第一io路径信息中所包括的至少一个存储节点执行与io操作请求对应的io操作。
12、在第一方面的一种可选的实施方式中,分布式存储系统还包括订阅接口;在基于故障存储节点,更新监控节点中的预设存储节点表之后,方法还包括:
13、在第一io路径信息中包括与故障存储节点的情况下,通过订阅节点向用户设备发送更新后的预设存储节点表,以用于用户设备基于更新后的预设存储节点表,利用哈希算法计算第二io路径信息,并向第二io路径所包括的至少一个存储节点发送io操作请求,以用于第二io路径信息中所包括的至少一个存储节点基于io操作请求,执行相应的io操作。
14、第二方面,本申请实施例提供了一种故障识别装置,应用于监控节点,监控节点存在于分布式存储系统中,分布式存储系统中还包括多个存储节点和管道轮询节点,管道轮询节点位于监控节点与多个存储节点之间,该装置包括:
15、读取模块,用于读取管道轮询节点内的待读取信息,待读取信息为虚拟文件层在执行io操作时,与虚拟文件层对应的存储节点写入管道轮询节点的故障信息;
16、确定模块,用于基于在虚拟文件层在执行io操作时,与虚拟文件层对应的存储节点写入管道轮询节点的故障信息,确定故障存储节点。
17、在第二方面的一种可选的实时方式中,装置还包括:
18、更新模块,基于故障存储节点,更新监控节点中的预设存储节点表。
19、第三方面,提供一种电子设备,包括:存储器,用于存储计算机程序指令;处理器,用于读取并运行存储器中存储的计算机程序指令,以执行第一方面和第二方面中任一可选的实施方式提供的故障识别方法。
20、第四方面,提供一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面和第二方面中的任一可选的实施方式提供的故障识别方法。
21、第五方面,提供一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行实现第一方面和第二方面的任一可选的实施方式提供的故障识别方法。
22、在本申请实施例中,可以通过在分布式存储系统中的多个存储节点与监控节点之间设置管道轮询节点,进而监控节点可以读取管道轮询节点中的待读取信息,由于待读取信息是虚拟文件层在执行io操作时,与该虚拟文件层对应的存储节点写入上述管道轮询节点的故障信息,进而以致于该监控节点可以基于该故障信息,确定相应的故障存储节点。如此,由于本申请实施例中的待读取信息是虚拟文件层在实际执行io操作时,由与该虚拟文件层对应的存储节点实时写入管道轮询节点的故障信息,不仅可以避免误报故障存储节点的情况,还可以使得监控节点可以实时读取故障信息,进而可以通过减少识别故障存储节点所需的时间,提高了识别故障存储节点的效率。
1.一种故障识别方法,其特征在于,应用于监控节点,所述监控节点存在于分布式存储系统中,所述分布式存储系统中还包括多个存储节点和管道轮询节点,所述管道轮询节点位于所述监控节点与所述多个存储节点之间,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述分布式存储系统还包括订阅接口;在读取管道轮询节点内的待读取信息之前,所述方法还包括:
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述故障存储节点,更新监控节点中的预设存储节点表,包括:
5.根据权利要求3所述的方法,其特征在于,所述分布式存储系统还包括订阅接口;在基于所述故障存储节点,更新监控节点中的预设存储节点表之后,所述方法还包括:
6.一种故障识别装置,其特征在于,应用于监控节点,所述监控节点存在于分布式存储系统中,所述分布式存储系统中还包括多个存储节点和管道轮询节点,所述管道轮询节点位于所述监控节点与所述多个存储节点之间,所述装置包括:
7.根据权利要求6所述的装置,其特征在于,所述装置还包括:
8.一种电子设备,其特征在于,所述设备包括:处理器以及存储有计算机程序指令的存储器;
9.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-5任意一项所述的故障识别方法。
10.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-5任意一项所述的故障识别方法。