一种优化设计服务器及维护方法与流程

文档序号:15850307发布日期:2018-11-07 09:45阅读:560来源:国知局
一种优化设计服务器及维护方法与流程

本发明涉及人工智能服务器领域,尤其是涉及一种优化设计服务器及维护方法。

背景技术

人工智能在当前世界的在线服务领域发挥着越来越重要的作用,在谷歌、facebook、微软和百度这些公司内部,gpu在“深度学习”领域发挥着巨大的作用。gpu是一个大规模的simd集合,拥有大量的向量运算系统,在进行重复功能的流计算时,可以平行处理大量琐碎信息,只需要定好功能数据不断往里进就可以了。cpu的强大在于面对控制密集型运算时非常优秀,但是对于数据密集型的运算,比如屏幕中每个pixel应该显示什么颜色,相对来说就受限于cpu的运行机制压力会很大。。

随着人工智能的蓬勃发展,gpu被大量广泛使用,对于大规模数据中心,已经开始大量部署池化类的服务器,这类传统服务器在结构上面不支持gpu的热运维,一旦服务器需要检修或者gpu升级换代,需要整体将服务器进行断电进行相关操作,无法像更换硬盘、风扇、电源那样便捷操作,这会导致整个服务停止运作,给整个系统带来极大的挑战,因此急需设计和开发一种可热运维和易升级换代gpu的服务器满足市场需求,满足整个服务。



技术实现要素:

为解决上述问题,本发明提供了一种优化设计服务器,优化设计后的服务器gpu支持热运维,可实现单一部件的检修,该维护方法方便快捷。

基于此,本发明的技术方案为:

一种优化设计服务器,包括传统服务器系统、gpu服务器系统、坦克链、电线和固定扣,所述传统服务器系统和gpu服务器系统按照功能模块分层设置、且分层数量为多层,除顶层外各所述层的第一侧均设有用于抽拉传统服务器系统或gpu服务器系统的坦克链,所述电线穿插于坦克链中,在各所述层的第二侧设有固定扣。

进一步的,所述传统服务器系统包括cpu处理器摸块、存储模块、网络模块、电源和风扇。

进一步的,所述gpu服务器系统内设有多个gpu处理器模块。

进一步的,所述gpu处理器模块数量为6个。

进一步的,所述传统服务器系统和gpu服务器系统均独立设置于不同的层内。

进一步的,所述电线为供电电线和数据业务走线。

另外,本发明还提供了一种优化设计服务器的维护方法,利用上述优化设计的服务器,当所述服务器进行升级换代或运维更换时,

a.进入传统服务器系统并disable掉相对应的gpu服务器系统;

b.解除固定扣将需更换或运维的gpu服务器系统拉出,待成功更换后推回更换之后的gpu服务器系统;

c.安装固定扣,再次进入传统服务器系统重新更新驱动并识别相对应的gpu服务器系统,则该服务器进入正常业务模式。

实施本发明实施例,具有以下有益效果:

1、本发明经优化设计的服务器,将传统服务器系统和gpu服务器系统按照功能模块分层设置,且分层数量为多层,实现整机不间断运行情况下可以自由伸缩拉伸,并除顶层外各所述层的一侧均设有用于抽拉传统服务器系统或gpu服务器系统的坦克链,保证了各个层之间的整理连贯性,避免在抽拉层时,零部件的丢失,并在各所述层的另一侧设有固定扣,加强了优化设计之后服务器的结构牢固性。

2、本发明的gpu服务器系统内设有多个gpu处理器模块,优选于6个gpu处理器,进行人工智能、深度学习、神经网络推演时,可以大大提升工作效率,其能效可以比肩多台传统服务器。

3、将所述传统服务器系统和gpu服务器系统均独立设置于不同的层内,独立设置方便后期维护;另外电线为供电电线和数据业务走线,并通过穿插在坦克链与传统服务器系统或gpu服务器系统连接,实现服务器cpu对gpu资源的访问。

4、利用本发明的服务器进行维护的方法清晰合理,在对该服务器进行运维或迭代升级,实现该服务器的不间断运行,避免了数据丢失。

附图说明

图1为本实施例所述优化设计服务器的整体结构示意图。

图2为本实施例所述利用上述优化设计服务器进行维护方法的流程图。

附图标记说明:

其中,1、传统服务器系统,2、gpu服务器系统,3、坦克链,4,固定扣。

具体实施方式

下面将结合本发明中的附图和实施例,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。

结合图1所示,本发明实施例所述的一种优化设计服务器,包括传统服务器系统1、gpu服务器系统2、坦克链3、所述电线和固定扣4,传统服务器系统1和gpu服务器系统2按照功能模块分层设置、且分层数量为多层,除顶层外各所述层的第一侧均设有用于抽拉传统服务器系统1或gpu服务器系统2的坦克链3,所述电线穿插于坦克链3中,在各所述层的第二侧设有固定扣4。本发明实施例的经优化设计的服务器,将传统服务器系统1和gpu服务器系统2按照功能模块分层设置,且分层数量为多层,具体每一层为传统服务器系统1或gpu服务器系统2均不特定,实现整机不间断运行情况下可以自由伸缩拉伸,并除顶层外各所述层的一侧均设有用于抽拉传统服务器系统1或gpu服务器系统2的坦克链3,保证了各个层之间的整理连贯性,避免在抽拉层时,零部件的丢失,并在各所述层的另一侧设有固定扣4,加强了优化设计之后服务器的结构牢固性。

其中,传统服务器系统1包括cpu处理器摸块、存储模块、网络模块、电源和风扇,gpu服务器系统2内设有多个gpu处理器模块,优选于6个gpu处理器,进行人工智能、深度学习、神经网络推演时,可以大大提升工作效率,其能效可以比肩多台传统服务器。传统服务器系统1和gpu服务器系统2均独立设置于不同的层内,独立设置方便后期维护;另外所述电线为供电电线和数据业务走线,并通过穿插在坦克链3与传统服务器系统1或gpu服务器系统2连接,实现服务器cpu对gpu资源的访问。

另外,在除顶层外各所述层的一侧采用坦克链3,坦克链3起到适合于使用在往复运动的场合,能够对内置的所述电线起到牵引和保护作用;坦克链3每节由左右链板和上下盖板组成,每节都能打开且链节之间转动自如,便于安装和维修,装拆方便、不必穿线,打开盖板后即可把电缆方便的安装在内部,大大提升了走线的便捷程度;坦克链3具有较高的压力和抗拉负荷,良好的韧性、高弹性和耐磨性,阻燃,高低温时性能稳定,可以使用在室外,运行速度稳定。

结合图2所示,本发明还提供了一种优化设计服务器的维护方法,利用上述优化设计的服务器,当所述服务器进行升级换代或运维更换时,

a.进入传统服务器系统1并disable掉相对应的gpu服务器系统2;

b.解除固定扣4将需更换或运维的gpu服务器系统2拉出,待成功更换后推回更换之后的gpu服务器系统2;

c.安装固定扣,再次进入传统服务器系统1重新更新驱动并识别相对应的gpu服务器系统2,则该服务器进入正常业务模式。

利用本发明的服务器进行维护的方法清晰合理,在对该服务器进行运维或迭代升级,实现该服务器的不间断运行,避免了数据丢失。

以上所述仅是本发明的优选实施方式,应当指出对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和替换,这些改进和替换也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1