链路监测方法、装置、电子设备及存储介质与流程

文档序号:37362107发布日期:2024-03-22 10:15阅读:10来源:国知局
链路监测方法、装置、电子设备及存储介质与流程

本发明涉及服务器,特别是涉及一种链路监测方法、装置、电子设备及存储介质。


背景技术:

1、raid(redundant array of independent disks,独立冗余磁盘阵列)卡是一种把多块独立的硬盘按不同的方式组合起来形成一个硬盘组,从而提供比单个硬盘更高的存储性能和提供数据备份技术,在服务器应用中被广泛的采纳。

2、raid卡与服务器主板之间通过sas链路连接,即以串行scsi协议通信,因此,sas链路稳定性是服务器与raid卡数据读写存储必须要关注的重要指标。目前,sas链路进行稳定性的测试常采用以下方式:将通过数据存储链路向硬盘内部写入数据,通过同一条数据存储链路从硬盘内部读取数据,将写入的数据和读取的数据做比较,输出比对结果至屏幕判断存储链路有无异常,或者通过操作系统检测硬盘存储的数据比特是否发生翻转来检测数据存储链路的稳定性。

3、然而,这种通过对比硬盘存储的数据在传输过程中的正确性判断链路是否稳定的方式只能借助操作系统对传输后的数据进行验证检测,无法实时检测出链路是否稳定传输,更无法准确确定出存储链路的错误类型,进一步影响raid卡与服务器的数据传输。


技术实现思路

1、有鉴于此,本发明旨在提出一种链路监测方法、装置、电子设备及存储介质,解决现有链路检测方式无法准确确定出存储链路的错误类型,影响raid卡与服务器的数据传输的问题,实现实时、准确的链路稳定性监测。

2、依据本发明的第一方面,提供了一种链路监测方法,应用于独立冗余磁盘阵列卡,所述独立冗余磁盘阵列卡通过串行链路与服务器主板互联,所述方法包括:

3、监测所述串行链路传输数据时的数据误码率,记录预设监测周期内的所述数据误码率的变化情况;

4、根据预设监测周期内所述数据误码率的变化情况,确定所述串行链路的故障类型;

5、采用所述故障类型对应预设报警信号进行链路故障报警,其中,所述预设报警信号与所述故障类型一一对应。

6、可选地,所述监测串行链路传输数据时的数据误码率,记录预设监测周期内的所述数据误码率的变化信情况,包括:

7、在所述串行链路连通所述独立冗余磁盘阵列卡和所述服务器主板的情况下监测所述串行链路传输数据是否出现丢包;

8、根据所述串行链路的丢包情况,生成预设监测周期内所述串行链路的数据误码率;

9、记录所述预设监测周期内所述串行链路的数据误码率的变化情况。

10、可选地,所述根据所述串行链路的丢包情况,生成预设监测周期内所述串行链路的数据误码率包括:

11、若所述串行链路在预设单位时长内出现丢包,则记录所述数据误码率为第一误码率,若所述串行链路在预设单位时长内未出现丢包,则记录所述数据误码率为第二误码率;

12、按照时序将所述第一误码率和所述第二误码率存储为预设监测周期内所述串行链路的数据误码率。

13、可选地,所述根据预设监测周期内所述数据误码率的变化情况,确定所述串行链路的故障类型,包括:

14、根据所述数据误码率的变化情况,对所述数据误码率进行计数,确定预设监测周期内所述第一误码率的出现次数;

15、若所述预设监测周期内所述第一误码率的出现次数大于第一阈值,则确定所述串行链路的故障类型为第一故障类型;

16、若所述预设监测周期内连续出现第一误码率的数量大于第二阈值,则确定所述链路串行链路的故障类型为第二故障类型。

17、可选地,所述独立冗余磁盘阵列卡还连接有报警设备,所述采用所述故障类型对应预设报警信号进行链路故障报警,其中,所述预设报警信号与所述故障类型一一对应,包括:

18、若所述串行链路出现故障的类型为第一故障类型,生成所述第一故障类型对应第一报警信号并发送至报警设备,控制所述报警设备根据所述第一报警信号进行闪烁;

19、若所述串行链路出现故障的类型为第二故障类型,生成所述第二故障类型对应第二报警信号并发送至所述报警设备,控制所述报警设备根据所述第二报警信号进行闪烁;

20、分别对所述第一故障类型和所述第二故障类型的闪烁次数进行累计计数,对应生成累计出现次数;

21、若所述第一故障类型的累计出现次数大于第一次数阈值,或所述第二故障类型的累计出现次数大于第二次数阈值,控制所述报警设备常亮进行链路故障报错,以使用户进行故障检修。

22、可选地,所述监测串行链路传输数据时的数据误码率之前,还包括:

23、响应于接收到的数据传输指令,检测所述独立冗余磁盘阵列卡与服务器主板间的所述串行链路是否连通;

24、若所述串行链路连通,发送串行链路的连通信号至报警设备并控制所述串行链路进行数据传输;

25、否则,发送串行链路的连通故障信号至所述报警设备,以使用户根据所述连通故障信号进行故障检修。

26、可选地,所述采用所述故障类型对应预设报警信号进行链路故障报警之后,还包括:

27、生成所述预设监测周期内的串行链路故障报警报告;

28、删除记录的历史监测周期内串行链路的数据误码率的变化情况。

29、依据本发明的第二方面,提供了一种链路监测装置,应用于独立冗余磁盘阵列卡,所述独立冗余磁盘阵列卡通过串行链路与服务器主板互联,所述装置包括:

30、监测链路模块,用于监测串行链路传输数据时的数据误码率,记录预设监测周期内的所述数据误码率的变化情况;

31、确定故障模块,用于根据预设监测周期内所述数据误码率的变化情况,确定所述串行链路的故障类型;

32、故障报警模块,用于采用所述故障类型对应预设报警信号进行链路故障报警,其中,所述预设报警信号与所述故障类型一一对应。

33、依据本发明的又一方面,还提供一种电子设备,包括:

34、处理器;

35、用于存储所述处理器可执行指令的存储器;

36、其中,所述处理器被配置为执行所述指令,以实现如上所述的链路监测方法。

37、依据本发明的又一方面,还提供一种可读存储介质,所述可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如上所述的链路监测方法的步骤。

38、本发明实施例提供的链路监测方法,应用于独立冗余磁盘阵列卡,独立冗余磁盘阵列卡通过串行链路与服务器主板互联,通过独立冗余磁盘阵列卡监测串行链路传输数据时的数据误码率,记录预设监测周期内的数据误码率的变化情况,根据预设监测周期内数据误码率的变化情况,确定串行链路的故障类型,采用故障类型对应预设报警信号进行链路故障报警,其中,预设报警信号与故障类型一一对应。本发明通过监控raid卡到主板之间连通的串行链路在传输数据时的丢包误码率,实时确定出串行链路的传输状态,并采用与串行链路的故障状态一一对应的报警信号直观反映串行链路的具体故障类型,从而准确监测raid卡和主板之间串行链路的稳定性,通过能够直观反映故障类型的预警方式,及时反馈raid卡进行数据恢复,在出现链路中断问题之前预先判断报警,预防出现因链路故障导致业务中断的问题,进一步提高链路稳定性,保证服务器的数据读写和运维。

39、上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1