一种PCIE设备可靠性的加速检测方法与流程

文档序号:12278324阅读:609来源:国知局

本发明涉及计算机通信技术领域,具体涉及一种PCIE设备可靠性的加速检测方法,来解决当前PCIE设备可靠性检测中的测试覆盖度不足及测试资源投入大的问题,为了保证服务器系统的快速稳定运行,在实际服务器系统PCIE设备可靠性检测运行过程中,实现可靠性的加速检测尤为重要,并成为决定服务器可靠性优势的关键要素之一。



背景技术:

服务器系统中以PCIE协议进行数据交换的设备越来越多,各种数据借助PCIE总线的使用,不断在服务器之间交换。PCIE设备质量可靠性越来越重要,成为服务器系统中关键的传输路径。为了保证当前的服务器系统PCIE设备稳定工作,服务器系统上线使用前,需要经过可靠的设备工作检测,以保证PCIE设备在长期的工作环境中稳定工作。

当前,针对PCIE设备可靠性的检测,均采用开关机重启、系统加压方式,使卡工作在高负载条件下,通过加长测试时间、加大测试样本来使稳定性问题尽可能在服务器出厂呈现出来,当前PCIE设备可靠性的检测方法存在较大的弊端:一是测试方法单一且测试周期长,对于低概率的稳定性问题无法及时复现出来,测试关注焦点仅停留在压力条件下系统的稳定性,对于可能存在稳定性隐患的系统状态切换过程,有效测试力度不足;二是测试资源投入大,需要投入数十台服务器系统进行同步测试。针对当前PCIE设备可靠性检测中的测试覆盖度不足及测试资源投入大的问题,为了保证服务器系统的快速稳定运行,在实际服务器系统PCIE设备可靠性检测运行过程中,实现可靠性的加速检测尤为重要,并成为决定服务器可靠性优势的关键要素之一。



技术实现要素:

本发明要解决的技术问题是:本发明针对服务器PCIE设备可靠性检测过程中遇到的上述问题,结合PCIE链路信号等关键电气因素,提供一种PCIE设备可靠性的加速检测方法。

本发明所采用的技术方案为:

一种PCIE设备可靠性的加速检测方法,所述方法通过建立PCIE可靠性测试控制单元,实现PCIE设备数据的发送与设备状态控制,待测PCIE设备直连安装于该PCIE可靠性测试控制单元上,所述PCIE可靠性测试控制单元的PCIE数据总线直接连接至待测PCIE设备上,同时所述PCIE可靠性测试控制单元直接控制待测PCIE设备的复位reset信号,实现硬复位控制权限,通过采用多组高强度、高频次的集中式快速强化功能单项测试,将PCIE设备的潜在隐患快速抓取出来。

所述方法通过PCIE可靠性测试控制单元,引导PCIE设备完成初始化阶段,监测PCIE链路传输状态,并向PCIE设备发送数据处理包;所述数据处理包为指令响应包,通过要求PCIE设备将指令中的数据进行运算后,反馈给PCIE可靠性测试控制单元,确认待测PCIE设备响应正常。

所述方法通过PCIE可靠性测试控制单元,启动链路速率快速切换模式,通过向待测PCIE设备发送速率切换指令,使PCIE链路在GEN1、GEN2、GEN3之间依次反复切换,总共切换次数为10000次;在向待测PCIE设备发送速率切换指令的同时,对待测PCIE设备的PCIE速率进行读取,若读取当前的待测PCIE设备的PCIE速率与期望值不同,则停止测试,此时待测PCIE设备即呈现出链路速率切换问题。

所述方法通过PCIE可靠性测试控制单元向待测PCIE设备发出复位reset信号,实现硬复位控制,同时PCIE可靠性测试控制单元实时监测待测PCIE设备的复位完成情况,当待测PCIE设备完成复位后,PCIE可靠性测试控制单元再次向待测PCIE设备发出复位reset信号,依次往复,总共测试次数为1000次,若读取当前的待测PCIE设备无法正常复位,则停止测试,此时待测PCIE设备即呈现出复位初始化问题。

所述方法通过PCIE可靠性测试控制单元向PCIE设备发出链路状态切换指令,即将PCIE 链路的power状态在link0、link1(空闲与繁忙)之间切换,同时PCIE可靠性测试控制单元实时监测PCIE 链路的power状态情况,总共切换次数为1000次,若读取当前的PCIE 链路power状态无法正常切换,则停止测试,此时待测PCIE设备即呈现出PCIE 链路power状态问题。

本发明的有益效果为:

本发明方法可以很方便的实现PCIE设备可靠性的加速检测,不仅达到了可靠性要求,而且实现高性能要求,实现服务器系统的可靠性、稳定性。

附图说明

图1为本发明方法实施流程示意图。

具体实施方式

下面根据说明书附图,结合具体实施方式对本发明进一步说明:

1、建立PCIE可靠性测试控制单元,采用基于FPGA芯片实现,带宽设置为X16,待测PCIE设备直连安装于该测试控制单元的PCIE标准槽位上;

2、通过PCIE可靠性测试控制单元,引导待测PCIE设备完成初始化阶段,监测PCIE链路传输状态,并向待测PCIE设备发送数据处理包,确认待测PCIE设备响应正常;

3、通过PCIE可靠性测试控制单元,启动链路速率快速切换模式,通过向待测PCIE设备发送速率切换指令,使PCIE链路在GEN1、GEN2、GEN3之间依次反复切换;

4、通过PCIE可靠性测试控制单元向待测PCIE设备发出复位reset信号,即将reset信号主动设置为低电平,使待测PCIE设备进入复位状态,实现硬复位控制;

5、通过PCIE可靠性测试控制单元向待测PCIE设备发出链路状态切换指令,即将PCIE 链路的power状态在link0、link1(空闲与繁忙)之间切换。

实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1