一种PCIe错误的处理方法及装置、PCIe系统与流程

文档序号:35199594发布日期:2023-08-22 02:25阅读:119来源:国知局
一种PCIe错误的处理方法及装置、PCIe系统与流程

本发明涉及计算机,尤其涉及一种pcie错误的处理方法及装置、pcie系统。


背景技术:

1、pcie(peripheral component interconnect express,是一种高速串行计算机扩展总线标准,简称pcie)是一种利用差分信号对进行点对点高速传输的一种数据传输方式,由于其具有高可靠性、高性能、高带宽和高可扩展性等优点,被广泛应用于各种服务器和计算机的数据传输中。replay timer timeout错误(重传计时器超时错误)是pcie传输中的发生的常见错误,当系统处于正常数据传输的过程中不会产生错误,如果一端发起连续的读写请求,对端如果一直不回复响应来应答,则发送端会发起重传操作,当重传次数达到一定次数后,请求端则会发生replay timer timeout错误。如果该错误不及时解决,大量报错会造成系统宕机,给pcie数据传输造成极大影响。

2、针对pcie链路传输过程中出现的错误和故障,现有的发明主要集中于监测,统计错误后警告、直接暂停相关模块的工作、断开链路、重新初始化相关链路一类的方式解决问题,这些方式在处理错误期间pcie不能正常工作,链路恢复后还会发生这种类型的错误,这些方法没有从根本上解决报错问题,只是将报错现场做了一次恢复,这样会极大地影响pcie的传输速度和传输效率。


技术实现思路

1、本发明提供了一种pcie错误的处理方法及装置、pcie系统,便于在不移除原有目标数据的传输链路、不暂停相关模块工作、不影响原本pcie链路的目标数据传输的情况下,解决pcie链路传输中的重传计时器超时错误的发生。

2、第一方面,本发明提供了一种pcie错误的处理方法,该pcie错误的处理方法包括:监测并收集pcie错误;从pcie错误中筛选出重传计时器超时错误;获取发生重传计时器超时错误的目标数据发送端和目标数据接收端;在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间。

3、在上述的方案中,在监测并收集到pcie错误之后,还从pcie错误中筛选出重传计时器超时错误,并针对出现重传计时器超时错误的目标数据发送端和目标数据接收端,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,实时监测pcie链路中的重传计时器超时错误,并利用上述处理方法进行动态处理。相比于现有的解决方法,本技术能够在不移除原有目标数据的传输链路、不暂停相关模块工作、不影响原本pcie链路的目标数据传输的情况下,解决pcie链路传输中的重传计时器超时错误,避免因重传计时器超时错误频繁发生导致用户无法正常使用,避免因为该错误造成系统宕机问题。由于本技术中,在整个pcie错误监测以及对重传计时器超时错误进行动态处理的过程中,pcie传输链路可以正常地传输数据,能够最大程度降低对pcie链路正常工作的影响。且本技术的pcie错误的处理方法只对监测到的重传计时器超时错误进行处理,更有针对性。

4、在一个具体的实施方式中,该pcie错误的处理方法还包括:在调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间之后,检测重传计时器超时错误是否消除;如果检测结果为重传计时器超时错误未消除,则继续调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,直到重传计时器超时错误消除。通过在调整目标数据发送端回复响应的时间、或/和目标数据发送端重传的容忍时间之后,增加检测步骤,监测重传计时器超时错误是否消除。

5、在一个具体的实施方式中,如果检测结果为重传计时器超时错误消除,则清除在收集pcie错误过程中记录的重传计时器超时错误,使错误信息监测模块继续检测。

6、在一个具体的实施方式中,目标数据接收端向目标数据发送端回复响应的时间调整范围包含有至少两个时间档位;每次调减目标数据接收端向目标数据发送端响应的时间时,至少调减一个时间档位,便于快速的调减目标数据接收端向目标数据发送端回复响应的时间,直到调节到不再检测出该错误为止。

7、在一个具体的实施方式中,触发目标数据发送端重传的容忍时间的调整范围包括第一调整范围和第二调整范围,其中,第二调整范围大于第一调整范围。调增触发目标数据发送端重传的容忍时间包括:先在第一调整范围内,调增触发目标数据发送端重传的容忍时间;在第一调整范围内调增触发目标数据发送端重传的容忍时间之后,仍然不能消除重传计时器超时错误时,在第二调整范围内调增触发目标数据发送端重传的容忍时间。先从调整范围较小的第一调整范围开始调,只有在第一调整范围调整后仍不能消除重传计时器超时错误时,才在第二调整范围内调增触发目标数据发送端重传的容忍时间,简化调整难度。

8、在一个具体的实施方式中,第一调整范围和第二调整范围的每个调整范围内均包含有至少两档容忍时间;每次在第一调整范围或第二调整范围内,调增触发目标数据发送端重传的容忍时间时,至少调增一档容忍时间,便于快速的调增目标数据发送端重传的容忍时间。

9、在一个具体的实施方式中,目标数据发送端和目标数据接收端分别为:根复合体、交换机、桥端或通讯设备端中,通过pcie总线协议接口相连接的上游端口和下游端口;其中,在目标数据发送端为上游端口时,目标数据接收端为下游端口;在目标数据发送端为下游端口时,目标数据接收端为上游端口。使该pcie错误的处理方法能够应用到pcie系统中的各个通过pcie总线协议接口相连接的上游端口和下游端口上。

10、在一个具体的实施方式中,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,包括:获取目标数据发送端与目标数据接收端之间pcie总线协议接口的速度、宽度和最大载荷;根据目标数据发送端与目标数据接收端之间pcie总线协议接口的速度、宽度和最大载荷,确定目标数据发送端与目标数据接收端之间pcie总线协议接口的最大响应延迟时间;根据最大响应延迟时间,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间。便于快速且准确的调整目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,从而在较少的调整次数之后,即可消除重传计时器超时错误。

11、第二方面,本发明还提供了一种pcie错误的处理装置,该pcie错误的处理装置包括:错误信息监控模块、筛选模块、采集模块和动态调整模块。其中,错误信息监控模块用于监测并收集pcie错误。筛选模块用于从pcie错误信息中筛选出重传计时器超时错误。采集模块用于获取发生重传计时器超时错误的目标数据发送端和目标数据接收端。动态调整模块用于在不中止目标数据的传输链路的情况下,调减目标数据接收端在接收到目标数据时,向目标数据发送端回复响应的时间;和/或,调增目标数据发送端在重传目标数据时,触发相邻两次传输之间的容忍时间。

12、在上述的方案中,在监测并收集到pcie错误之后,还从pcie错误中筛选出重传计时器超时错误,并针对出现重传计时器超时错误的目标数据发送端和目标数据接收端,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,实时监测pcie链路中的重传计时器超时错误,并利用上述处理方法进行动态处理。相比于现有的解决方法,本技术能够在不移除原有目标数据的传输链路、不暂停相关模块工作、不影响原本pcie链路的目标数据传输的情况下,解决pcie链路传输中的重传计时器超时错误,避免因重传计时器超时错误频繁发生导致用户无法正常使用,避免因为该错误造成系统宕机问题。由于本技术中,在整个pcie错误监测以及对重传计时器超时错误进行动态处理的过程中,pcie传输链路可以正常地传输数据,能够最大程度降低对pcie链路正常工作的影响。且本技术的pcie错误的处理方法只对监测到的重传计时器超时错误进行处理,更有针对性。

13、在一个具体的实施方式中,该pcie错误的处理装置还包括:检测模块,检测模块用于在调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间之后,检测重传计时器超时错误是否消除;如果检测结果为重传计时器超时错误未消除,则调整模块继续调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,直到重传计时器超时错误消除。通过在调整目标数据发送端回复响应的时间、或/和目标数据发送端重传的容忍时间之后,增加检测步骤,用于检测重传计时器超时错误。

14、在一个具体的实施方式中,该pcie错误的处理装置还包括:清除模块,用于在检测结果为重传计时器超时错误消除时,清除在收集pcie错误过程中记录的重传计时器超时错误,目的是持续检测修正后是否有错误继续产生。

15、在一个具体的实施方式中,目标数据接收端向目标数据发送端回复响应的时间调整范围包含有至少两个时间档位;每次调减目标数据接收端向目标数据发送端回复响应的时间时,至少调减一个时间档位,便于快速的调减目标数据接收端向目标数据发送端回复响应的时间。

16、在一个具体的实施方式中,触发目标数据发送端重传的容忍时间的调整范围包括第一调整范围和第二调整范围,其中,第二调整范围大于第一调整范围。调增触发目标数据发送端重传的容忍时间包括:先在第一调整范围内,调增触发目标数据发送端重传的容忍时间;在第一调整范围内调增触发目标数据发送端重传的容忍时间之后,仍然不能消除重传计时器超时错误时,在第二调整范围内调增触发目标数据发送端重传的容忍时间。先从调整范围较小的第一调整范围开始调,只有在第一调整范围调整后仍不能消除重传计时器超时错误时,才在第二调整范围内调增触发目标数据发送端重传的容忍时间,简化调整难度,便于快速消除重传计时器超时错误。

17、在一个具体的实施方式中,第一调整范围包含有两档容忍时间;每次在第一调整范围或第二调整范围内,调增触发目标数据发送端重传的容忍时间时,至少调增一档容忍时间,便于快速的调增目标数据发送端重传的容忍时间。

18、在一个具体的实施方式中,目标数据发送端和目标数据接收端分别为:根复合体、交换机、桥端或通讯设备端中,通过pcie总线协议接口相连接的上游端口和下游端口;其中,在目标数据发送端为上游端口时,目标数据接收端为下游端口;在目标数据发送端为下游端口时,目标数据接收端为上游端口。使该pcie错误的处理方法能够应用到pcie系统中的各个通过pcie总线协议接口相连接的上游端口和下游端口上。

19、在一个具体的实施方式中,调整模块在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间时,采用如下的调整方法:获取目标数据发送端与目标数据接收端之间pcie总线协议接口的速度、宽度和最大载荷;根据目标数据发送端与目标数据接收端之间pcie总线协议接口的速度、宽度和最大载荷,确定目标数据发送端与目标数据接收端之间pcie总线协议接口的最大响应延迟时间;根据最大响应延迟时间,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间。便于快速且准确的调整目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,从而在较少的调整次数之后,即可消除重传计时器超时错误。

20、第三方面,本发明还提供了一种pcie系统,该pcie系统包括上述任意一种pcie错误的处理装置。在监测并收集到pcie错误之后,还从pcie错误中筛选出重传计时器超时错误,并针对出现重传计时器超时错误的目标数据发送端和目标数据接收端,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,实时监测pcie链路中的重传计时器超时错误,并利用上述处理方法进行动态处理。相比于现有的解决方法,本技术能够在不移除原有目标数据的传输链路、不暂停相关模块工作、不影响原本pcie链路的目标数据传输的情况下,解决pcie链路传输中的重传计时器超时错误,避免因重传计时器超时错误频繁发生导致用户无法正常使用,避免因为该错误造成系统宕机问题。由于本技术中,在整个pcie错误监测以及对重传计时器超时错误进行动态处理的过程中,pcie传输链路可以正常地传输数据,能够最大程度降低对pcie链路正常工作的影响。且本技术的pcie错误的处理方法只对监测到的重传计时器超时错误进行处理,更有针对性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1