一种PCIe器件链路训练管理方法、管理装置及服务器与流程

文档序号:33712224发布日期:2023-04-01 00:22阅读:来源:国知局

技术特征:
1.一种pcie器件链路训练管理方法,其特征在于,用于通过pcie均衡技术对服务器主板关键pcie器件进行链路训练管理,所述训练管理方法包括链路训练失败修复步骤,其包括:从针对第k代pcie协议设置的发送端链路均衡参数预设值合集中获取默认预设初始值px、作为第k代初始值,用于对所述pcie器件进行链路训练;其中,所述第k代初始值为针对第k代pcie协议进行均衡调整时发送端链路均衡参数初始值,k不小于2;所述发送端链路均衡参数预设值合集的数据按照数值大小依次排列;在通过所述第k代初始值对所述pcie器件进行链路训练之后,判断所述pcie器件的供应商id、设备id能否被正常读取;若不能被正常读取,则判定pcie链路训练失败;从所述发送端链路均衡参数预设值合集中按照预设取值规则获取预设初始值py、作为新的第k代初始值,用于对所述pcie器件进行链路再训练;在对所述pcie器件进行链路再训练后,按照第一等待时间再次判断所述pcie器件的所述供应商id、所述设备id能否被正常读取;若进行链路再训练后所述供应商id、所述设备id能被正常读取,则判定pcie链路训练成功。2.根据权利要求1所述的pcie器件链路训练管理方法,其特征在于,在按照第一等待时间再次判断所述pcie器件的所述供应商id、所述设备id能否被正常读取之后,所述链路训练失败修复步骤还包括:若进行链路再训练后所述pcie器件的供应商id、设备id不能被正常读取,则判定pcie链路训练失败;按照所述预设取值规则中的预设值增大方向和/或预设值减小方向依次从所述发送端链路均衡参数预设值合集中取值、作为新的第k代初始值,用于分别对所述pcie器件进行链路再训练、直至pcie链路训练成功。3.根据权利要求1或2所述的pcie器件链路训练管理方法,其特征在于,所述训练管理方法还包括链路稳定性检查步骤;所述链路稳定性检查步骤包括链路活跃度管理步骤,其包括:在判定pcie链路训练成功之后,判断链路活跃度标志位是否为1;若所述链路活跃度标志位不为1,则按照预设再训练重试次数依次进行链路再训练;每次链路再训练时,将链路再训练标志位设为1、并按照第二预设时间间隔再次判断所述链路活跃度标志位是否为1。4.根据权利要求3所述的pcie器件链路训练管理方法,其特征在于,所述链路稳定性检查步骤还包括链路状态管理步骤,其包括:当所述链路活跃度标志位为1时,判断链路状态信息中的链路速度是否小于速度预期值;若小于,则判定发生链路降速;其中,所述速度预期值与链路能力寄存器中最大链路速度的最小规格相匹配;当所述链路活跃度标志位为1时,判断链路状态信息中的链路带宽是否小于带宽预期值;若小于,则判定发生链路降道;其中,所述带宽预期值与所述链路能力寄存器中最大链路带宽的最小规格相匹配。
5.根据权利要求4所述的pcie器件链路训练管理方法,其特征在于,所述链路状态管理步骤还包括:当发生链路降速和/或链路降道时,按照预设失能使能重复次数依次进行链路失能使能操作;每次链路失能使能操作时,设置链路控制寄存器中的失能位、并按照预设操作时间间隔设置失能与使能的时间间隔,按照第二等待时间重新读取所述链路状态信息,用于判断链路状态是否正常。6.根据权利要求3所述的pcie器件链路训练管理方法,其特征在于,所述链路活跃度管理步骤还包括:若所述链路活跃度标志位为1,则将所述预设再训练重试次数、链路训练协商结果信息打印到日志、并写入cpld寄存器中;其中,所述链路训练协商结果信息包括链路再训练成功时对应的新的第k代初始值。7.根据权利要求4所述的pcie器件链路训练管理方法,其特征在于,所述链路状态管理步骤还包括:当所述链路状态信息正常时,记录日志、并向cpld寄存器中写入链路训练成功标志。8.根据权利要求1所述的pcie器件链路训练管理方法,其特征在于,在判断所述pcie器件的供应商id、设备id能否被正常读取之后,所述训练管理方法还包括:若所述pcie器件的所述供应商id、所述设备id能被正常读取,则判定pcie链路训练成功、并记录日志。9.根据权利要求3所述的pcie器件链路训练管理方法,其特征在于,在照预设再训练重试次数依次进行链路再训练之后,所述链路活跃度管理步骤还包括:当按照所述预设再训练重试次数依次进行链路再训练后、所述链路活跃度标志位均不为1时,将所述预设再训练重试次数与链路训练失败标志打印到日志、并写入cpld寄存器中。10.根据权利要求5所述的pcie器件链路训练管理方法,其特征在于,在按照预设失能使能重复次数依次进行链路失能使能操作之后,所述链路状态管理步骤还包括:当按照所述预设失能使能重复次数依次进行链路失能使能操作后、每次重试均发生链路降速和/或链路降道时,将所述预设失能使能重复次数与链路训练失败标志打印到日志、并写入cpld寄存器中。11.根据权利要求2所述的pcie器件链路训练管理方法,其特征在于,在按照所述预设取值规则中的预设值增大方向和/或预设值减小方向依次从所述发送端链路均衡参数预设值合集中取值、作为新的第k代初始值之后,所述训练管理方法还包括:在按照所述预设取值规则中的所述预设值增大方向和/或所述预设值减小方向依次遍历所述发送端链路均衡参数预设值合集中数值、作为新的第k代初始值之后,当所有链路再训练均失败时,记录日志、并将链路训练失败标志写入cpld寄存器中。12.根据权利要求2所述的pcie器件链路训练管理方法,其特征在于,在从针对第k代pcie协议设置的发送端链路均衡参数预设值合集中获取默认预设初始值px、作为第k代初始值之前,所述训练管理方法还包括:根据所述服务器主板pcie信号参数特性、以及所述服务器主板大规模样本测试要求获取所述发送端链路均衡参数预设值合集;其中,所述发送端链路均衡参数预设值合集包括
所述默认预设初始值px。13.根据权利要求12所述的pcie器件链路训练管理方法,其特征在于,在从针对第k代pcie协议设置的发送端链路均衡参数预设值合集中获取默认预设初始值px、作为第k代初始值之后,所述训练管理方法还包括:将所述默认预设初始值px作为第k代初始值,对所述服务器cpu的pcie根端口进行pcie链路训练。14.根据权利要求1所述的pcie器件链路训练管理方法,其特征在于,从针对第k代pcie协议设置的发送端链路均衡参数预设值合集中获取默认预设初始值px、作为第k代初始值,用于对所述pcie器件进行链路训练,具体包括:从所述发送端链路均衡参数预设值合集中获取所述默认预设初始值px、作为第k代初始值,用于对所述pcie器件所在链路对应的cpu根端口进行链路训练。15.根据权利要求14所述的pcie器件链路训练管理方法,其特征在于,在通过所述第k代初始值对所述pcie器件进行链路训练之后,判断所述pcie器件的供应商id、设备id能否被正常读取,具体包括:通过基本输入输出系统固件获取并判断所述pcie器件的所述供应商id以及所述设备id能否被正常读取,用于判断pcie总线与所述cpu根端口的pcie链路训练是否成功。16.根据权利要求15所述的pcie器件链路训练管理方法,其特征在于,在从针对第k代pcie协议设置的发送端链路均衡参数预设值合集中获取默认预设初始值px、作为第k代初始值,用于对所述pcie器件进行链路训练之前,所述训练管理方法还包括:通过寄存器设置所述发送端链路均衡参数预设值合集,用于对所述pcie器件所在链路对应的cpu根端口进行链路训练。17.一种pcie器件链路训练管理装置,其特征在于,用于通过pcie均衡技术对服务器主板关键pcie器件进行链路训练管理,所述训练管理装置包括链路训练失败修复单元,其包括:链路训练单元,用于从针对第k代pcie协议设置的发送端链路均衡参数预设值合集中获取默认预设初始值px、作为第k代初始值,用于对所述pcie器件进行链路训练;其中,所述第k代初始值为针对第k代pcie协议进行均衡调整时发送端链路均衡参数初始值,k不小于2;所述发送端链路均衡参数预设值合集的数据按照数值大小依次排列;链路训练判断单元,用于在通过所述第k代初始值对所述pcie器件进行链路训练之后,判断所述pcie器件的供应商id、设备id能否被正常读取;训练失败判定单元,用于所述供应商id、所述设备id不能被正常读取时,判定pcie链路训练失败;链路再训练单元,用于从所述发送端链路均衡参数预设值合集中按照预设取值规则获取预设初始值py、作为新的第k代初始值,用于对所述pcie器件进行链路再训练;链路再训练判断单元,用于在对所述pcie器件进行链路再训练后,按照第一等待时间判断所述pcie器件的供应商id、设备id能否被正常读取;链路再训练成功判定单元,用于进行链路再训练后所述供应商id、所述设备id能被正常读取时,判定pcie链路训练成功。18.一种计算机设备,包括存储器、处理器及计算机程序,所述计算机程序存储在所述
存储器上并可在所述处理器上运行,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-16中任一项所述的pcie器件链路训练管理方法的步骤。19.一种计算机可读存储介质,其存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-16中任一项所述的pcie器件链路训练管理方法的步骤。20.一种服务器,其特征在于,包括设于主板上的关键pcie器件,所述pcie器件通过如权利要求1-16中任一项所述的pcie器件链路训练管理方法来实现链路训练管理。

技术总结
本发明涉及一种PCIe器件链路训练管理方法、管理装置、服务器、设备和存储介质,训练管理方法包括链路训练失败修复步骤,其包括:获取默认预设初始值Px、作为第k代初始值,用于对PCIe器件进行链路训练;判断PCIe器件的供应商ID、设备ID能否被正常读取;若不能被正常读取,则判定PCIe链路训练失败;获取预设初始值Py、作为新的第k代初始值,用于进行链路再训练;在对PCIe器件进行链路再训练后,按照第一等待时间再次判断PCIe器件的供应商ID、设备ID能否被正常读取;若能被正常读取,则判定PCIe链路训练成功。通过上述技术方案,可解决目前服务器主板上关键PCIe器件链路训练失败的问题。主板上关键PCIe器件链路训练失败的问题。主板上关键PCIe器件链路训练失败的问题。


技术研发人员:管彦广
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:2023.01.19
技术公布日:2023/3/31
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1