一种服务器GPU散热测试方法及系统与流程

文档序号:16134380发布日期:2018-12-01 00:44阅读:399来源:国知局

本发明属于服务器设计技术领域,尤其涉及一种服务器gpu散热测试方法及系统。

背景技术

随着信息技术的进步,人们对于服务器的要求越来越高,图形处理器(graphicsprocessingunit,gpu)是一种专门在个人电脑、工作站、游戏机和一些移动设备上图像运算工作的微处理器,其用途是将计算机系统所需要的显示信息进行转换驱动,并向显示器提供行扫描信号,控制显示器的正确显示,是连接显示器和个人电脑主板的重要元件,也是“人机对话”的重要设备之一。gpu作为电脑主机里的一个重要组成部分,承担输出显示图形的任务,对于从事专业图形设计的人来说gpu非常重要。

当gpu被放在散热条件差的状态下,会导致gpu驱动过早损坏,并且服务器其他的组件也会出现大量故障,极大可能会发生宕机、死机的现象。所以在服务器的研发阶段,对于gpu的散热测试要求就显得尤为重要,gpu的散热测试的是一个冗杂耗时的过程,常常会在浪费了时间和人力还是得不到正确的测试数据等问题。甚至有时会因为测试中的一些避免不了的人员流动,引起风流以及环境温度等的变化导致测试结果的不准确,最终导致gpu的散热设计造成偏差。



技术实现要素:

本发明的目的在于提供一种服务器gpu散热测试方法,旨在解决现有技术中gpu散热测试的方法较为繁杂,有时还会由于操作者的一些微小错误,还容易出现结果偏差大等一系列的问题的问题。

本发明是这样实现的,一种服务器gpu散热测试方法,所述方法包括下述步骤:

对gpu测试工位进行工位检测,判断所述gpu测试工位上是否输送至对应的待检测gpu;

当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试;

当测试完成时,自动抓取压力log和温度log,生成gpu散热测试报告。

作为一种改进的方案,所述当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试的步骤具体包括下述步骤:

在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力;

施加压力后,判断施加的压力是否达到预设的部件压力参数阈值;

当施加的压力达到预设的部件压力参数阈值时,判断当前待检测gpu所处的环境温度是否稳定;

当当前待检测gpu所处的环境温度稳定时,判断待检测gpu所处的环境温度是否在预设的温度参数范围内;

当待检测gpu所处的环境温度在预设的温度参数范围内,则判定gpu测试通过;

当待检测gpu所处的环境温度在预设的温度参数范围之外,则判定gpu测试未通过;

当当当前待检测gpu所处的环境温度不稳定时,则返回执行判断当前待检测gpu所处的环境温度是否稳定的步骤;

当施加的压力未达到预设的部件压力参数阈值时,则返回执行所述在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤。

作为一种改进的方案,所述在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤之前还包括下述步骤:

调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整;

判断调整后的所述待检测gpu所处的环境温度是否处于预先设置的gpu测试温度范围内;

当判定调整后的所述待检测gpu所处的环境温度处于gpu测试温度范围内时,执行所述调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤;

当判定调整后的所述待检测gpu所处的环境温度在gpu测试温度范围之外时,则返回执行所述调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整的步骤。

作为一种改进的方案,所述方法还包括下述步骤:

预先设置gpu测试温度范围、部件压力参数阈值以及温度参数范围。

作为一种改进的方案,所述方法还包括下述步骤:

当测试完成后,卸载通过所述加压脚本程序施加的压力。

本发明的另一目的在于提供一种服务器gpu散热测试系统,所述系统包括:

工位检测判断模块,用于对gpu测试工位进行工位检测,判断所述gpu测试工位上是否输送至对应的待检测gpu;

自动散热测试模块,用于当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试;

散热测试报告生成模块,用于当测试完成时,自动抓取压力log和温度log,生成gpu散热测试报告。

作为一种改进的方案,所述自动散热测试模块具体包括:

压力施加模块,用于在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力;

压力判断模块,用于施加压力后,判断施加的压力是否达到预设的部件压力参数阈值;

温度稳定判断模块,用于当施加的压力达到预设的部件压力参数阈值时,判断当前待检测gpu所处的环境温度是否稳定;

第一环境温度判断模块,用于当当前待检测gpu所处的环境温度稳定时,判断待检测gpu所处的环境温度是否在预设的温度参数范围内;

第一判定模块,用于当待检测gpu所处的环境温度在预设的温度参数范围内,则判定gpu测试通过;

第二判定模块,用于当待检测gpu所处的环境温度在预设的温度参数范围之外,则判定gpu测试未通过;

当当当前待检测gpu所处的环境温度不稳定时,则返回执行判断当前待检测gpu所处的环境温度是否稳定的步骤;

当施加的压力未达到预设的部件压力参数阈值时,则返回执行所述压力施加模块在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤。

作为一种改进的方案,所述服务器gpu散热测试系统还包括:

环境温度调整模块,用于调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整;

第二环境温度判断模块,用于判断调整后的所述待检测gpu所处的环境温度是否处于预先设置的gpu测试温度范围内;

当判定调整后的所述待检测gpu所处的环境温度处于gpu测试温度范围内时,执行所述压力施加模块调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤;

当判定调整后的所述待检测gpu所处的环境温度在gpu测试温度范围之外时,则返回执行所述工位检测判断模块调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整的步骤。

作为一种改进的方案,所述系统还包括:

预先设置模块,用于预先设置gpu测试温度范围、部件压力参数阈值以及温度参数范围。

作为一种改进的方案,所述系统还包括:

压力卸载模块,用于当测试完成后,卸载通过所述加压脚本程序施加的压力。

在本发明实施例中,对gpu测试工位进行工位检测,判断所述gpu测试工位上是否输送至对应的待检测gpu;当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试;当测试完成时,自动抓取压力log和温度log,生成gpu散热测试报告,从而实现对gpu散热的自动测试,提供给设计终端较为准确的测试数据,以便在后续研发阶段快、准、好的定位研发和改善方向。

附图说明

图1是本发明提供的服务器gpu散热测试方法的实现流程图;

图2是本发明提供的当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试的实现流程图;

图3是本发明提供的服务器gpu散热测试系统的结构框图;

图4是本发明提供的自动散热测试模块的结构框图。

具体实施方式

下面结合具体的实施例对本发明进一步说明。但这些例举性实施方式的用途和目的仅用来例举本发明,并非对本发明的实际保护范围构成任何形式的任何限定,更非将本发明的保护范围局限于此。

图1示出了本发明提供的服务器gpu散热测试方法的实现流程图,其具体包括下述步骤:

在步骤s101中,对gpu测试工位进行工位检测,判断所述gpu测试工位上是否输送至对应的待检测gpu。

在步骤s102中,当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试。

在步骤s103中,当测试完成时,自动抓取压力log和温度log,生成gpu散热测试报告。

在该步骤中,待测试的gpu温度稳定后,自动抓取生成个gpu数据温度压力log,导出测试数据,拷出数据整理散热测试报告,输送设计终端,测试完成。

在该实施例中,如图2所示,当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试的步骤具体包括下述步骤:

在步骤s201中,在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力。

在该步骤中,预先自动写入gpu加压时间,该加压时间不是固定的,每款gpu对应不同的数值,

在步骤s202中,施加压力后,判断施加的压力是否达到预设的部件压力参数阈值,是则执行步骤s203,否则执行步骤s201。

在步骤s203中,当施加的压力达到预设的部件压力参数阈值时,判断当前待检测gpu所处的环境温度是否稳定,是则执行步骤s204,否则返回继续判断。

在步骤s204中,当当前待检测gpu所处的环境温度稳定时,判断待检测gpu所处的环境温度是否在预设的温度参数范围内,是则执行步骤s205,否则执行步骤s206。

在步骤s205中,当待检测gpu所处的环境温度在预设的温度参数范围内,则判定gpu测试通过。

在步骤s206中,当待检测gpu所处的环境温度在预设的温度参数范围之外,则判定gpu测试未通过。

当当当前待检测gpu所处的环境温度不稳定时,则返回执行判断当前待检测gpu所处的环境温度是否稳定的步骤。

当施加的压力未达到预设的部件压力参数阈值时,则返回执行在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤。

在本发明实施例中,在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤之前还包括下述步骤:

(1)调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整;

(2)判断调整后的所述待检测gpu所处的环境温度是否处于预先设置的gpu测试温度范围内;

(3)当判定调整后的所述待检测gpu所处的环境温度处于gpu测试温度范围内时,执行所述调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤;

(4)当判定调整后的所述待检测gpu所处的环境温度在gpu测试温度范围之外时,则返回执行所述调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整的步骤。

在本发明实施例中,在执行上述步骤之前,还需要执行下述步骤:

预先设置gpu测试温度范围、部件压力参数阈值以及温度参数范围,这些参数的设置以及具体的数值大小可以根据实际的设计需求进行,在此再赘述,但不用限制本发明。

在本发明实施例中,当测试完成后,卸载通过所述加压脚本程序施加的压力。

在本发明实施例中,本来gpu测试过程中串联性的工作都需要人来操作,人处在测试环境的系统中,势必会造成测试的误差,而自动化测试极大的减少了人的参与,可以设定好程序,一个3天的测试,可能只是需要人设定一下程序,半个小时的时间,3天的工作量只是交给程序去工作,极大的减少了人员的配置,提高了设备的使用率,并且输出的数据更准确。

本发明可在gpu散热测试过程中极大的减少人引起风流以及环温等的变化导致测试结果的不准确性,提高了服务器运行的可靠性。减少了人力的需求,提高设备的使用率,极大地提高了工作效率,从而节约了能耗。

图3示出了本发明提供的服务器gpu散热测试系统的结构框图,为了便于说明,图中仅给出了与本发明实施例相关的部分。

服务器gpu散热测试系统包括:

工位检测判断模块21,用于对gpu测试工位进行工位检测,判断所述gpu测试工位上是否输送至对应的待检测gpu;

自动散热测试模块22,用于当有待检测gpu输送至所述gpu测试工位时,调用预先配置的自动化散热测试程序,对所述待检测gpu进行自动散热测试;

散热测试报告生成模块23,用于当测试完成时,自动抓取压力log和温度log,生成gpu散热测试报告。

其中,如图4所示,自动散热测试模块22具体包括:

压力施加模块11,用于在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力;

压力判断模块12,用于施加压力后,判断施加的压力是否达到预设的部件压力参数阈值;

温度稳定判断模块13,用于当施加的压力达到预设的部件压力参数阈值时,判断当前待检测gpu所处的环境温度是否稳定;

第一环境温度判断模块14,用于当当前待检测gpu所处的环境温度稳定时,判断待检测gpu所处的环境温度是否在预设的温度参数范围内;

第一判定模块15,用于当待检测gpu所处的环境温度在预设的温度参数范围内,则判定gpu测试通过;

第二判定模块16,用于当待检测gpu所处的环境温度在预设的温度参数范围之外,则判定gpu测试未通过;

当当当前待检测gpu所处的环境温度不稳定时,则返回执行判断当前待检测gpu所处的环境温度是否稳定的步骤;

当施加的压力未达到预设的部件压力参数阈值时,则返回执行所述压力施加模块11在预先设置的gpu测试温度范围内,调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤。

在本发明实施例中,所述服务器gpu散热测试系统还包括:

环境温度调整模块17,用于调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整;

第二环境温度判断模块18,用于判断调整后的所述待检测gpu所处的环境温度是否处于预先设置的gpu测试温度范围内;

当判定调整后的所述待检测gpu所处的环境温度处于gpu测试温度范围内时,执行所述压力施加模块调用预先设置的加压脚本程序,对所述待检测gpu进行施加压力的步骤;

当判定调整后的所述待检测gpu所处的环境温度在gpu测试温度范围之外时,则返回执行所述工位检测判断模块11调用预先在gpu测试工位上配置的高温箱,对所述待检测gpu所处的环境环境温度进行调整的步骤。

如图3所示,预先设置模块19,用于预先设置gpu测试温度范围、部件压力参数阈值以及温度参数范围。

压力卸载模块20,用于当测试完成后,卸载通过所述加压脚本程序施加的压力。

上述各个模块的功能如上述方法实施例所记载,在此不再赘述。

应当理解,这些实施例的用途仅用于说明本发明而非意欲限制本发明的保护范围。此外,也应理解,在阅读了本发明的技术内容之后,本领域技术人员可以对本发明作各种改动、修改和/或变型,所有的这些等价形式同样落于本申请所附权利要求书所限定的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1