一种冗余的PCIE池化架构的制作方法

文档序号:15654358发布日期:2018-10-12 23:38阅读:500来源:国知局

本发明涉及计算机技术领域,尤其涉及一种冗余的PCIE池化架构。



背景技术:

大数据是在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息。

高清流媒体的出现极大地方便了人们的工作和生活。在地球的另一端,某大学的课堂上,某个教授正在兴致盎然地传授一门你喜欢的课程,在网络上找到该在线课程,课程很长,只管点击播放,教授的身影很快出现在屏幕上,课程一边播放一边下载。除了远程教育,流媒体在视频点播、网络电台、网络视频等方面也有着广泛的应用。

随着大数据、高清流媒体及深度学习对计算能力的要求越来越高,PCIE池化逐渐成为新一代计算发展的方向。但PCIE池化产品在使用也遇到了技术问题,如在主板工作时,往往会在运行过程中出现故障,造成系统的宕机、停机,不利于大数据、高清流媒体的正常运行。



技术实现要素:

为了克服上述现有技术中的不足,本发明提供一种冗余的PCIE池化架构,包括:监控单元,至少两个主板以及架构背板;

至少两个主板中设有至少一个备用主板;

监控单元通过架构背板分别与每个主板连接;

主板包括:BMC模块,PCIE芯片以及背板连接器;

每个主板分别通过背板连接器与架构背板连接;

BMC模块用于检测主板的工作电流,工作电压,PCIE芯片的温度以及PCIE芯片的在位状态;

PCIE芯片通过背板连接器与架构背板连接,每个PCIE接口分别与PCIE芯片连接;

监控单元包括:BMC检测模块;

BMC检测模块分别与每个主板的BMC模块连接BMC检测模块用于通过主板的BMC模块获取PCIE芯片的在位情况,主板的工作电流,工作电压以及PCIE芯片的温度。

优选地,监控单元还包括:工作切换模块;

工作切换模块用于当BMC检测模块检测某一PCIE芯片在位,且主板的工作电流超阈值故障报警,或工作电压超阈值故障报警,或PCIE芯片的温度超阈值故障报警时,工作切换模块将当前故障主板的运行工作,切换至备用主板进行接替运行。

优选地,至少两个主板中包括:一主工作主板和与所述主工作主板相对应的一备用主板。

优选地,主板还包括:GPU卡接口、NVMe接口、SSD接口、网卡接口;

GPU卡接口、NVMe接口、SSD接口、网卡接口分别与PCIE芯片连接。

优选地,主板还包括:温度检测传感器以及湿度检测传感器;

BMC模块分别通过温度检测传感器以及湿度检测传感器获取主板的温度信息和湿度信息;

监控单元通过I2C总线分别与主板的温度检测传感器以及湿度检测传感器连接,获取主板的温度信息和湿度信息。

优选地,主板包括:至少两颗PCIE芯片;

PCIE芯片采用PLX9797PCIE芯片;

PCIE芯片之间通过PCIEx16数据总线互连,构成一个PCIE芯片组。

优选地,主板还包括:第一PCIE数据线束以及第二PCIE数据线束;

PCIE芯片依次通过第一PCIE数据线束和背板连接器连接架构背板;

PCIE芯片通过第二PCIE数据线束分别与GPU卡接口、NVMe接口、SSD接口、网卡接口连接。

优选地,第一PCIE数据线束采用16*PCIEx8PCIE数据线;

第二PCIE数据线束采用16*PCIEx4PCIE数据线。

从以上技术方案可以看出,本发明具有以下优点:

BMC检测模块可以检测每个主板的工作参数,当主板出现故障或运行参数超阈值时,可以发出提示信息。在PCIE池化系统内部署多个主板,在任一主板出现故障时,将当前故障主板的运行工作,切换至备用主板进行接替运行。,确保业务不受影响,提高架构可靠性。

附图说明

为了更清楚地说明本发明的技术方案,下面将对描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为冗余的PCIE池化架构实施例一示意图;

图2为冗余的PCIE池化架构实施例二示意图。

具体实施方式

为使得本发明的发明目的、特征、优点能够更加的明显和易懂,下面将运用具体的实施例及附图,对本发明保护的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本专利中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本专利保护的范围。

实施例一,本实施例提供一种冗余的PCIE池化架构,如图1所示,包括:监控单元1,至少两个主板4以及架构背板2;至少两个主板4中设有至少一个备用主板4;监控单元1通过架构背板2分别与每个主板4连接;主板4包括:BMC模块,PCIE芯片以及背板连接器3;每个主板4分别通过背板连接器3与架构背板2连接;

BMC模块用于检测主板4的工作电流,工作电压,PCIE芯片的温度以及PCIE芯片的在位状态;PCIE芯片通过背板连接器3与架构背板2连接,每个PCIE接口分别与PCIE芯片连接;

监控单元1包括:BMC检测模块;BMC检测模块分别与每个主板4的BMC模块连接BMC检测模块用于通过主板4的BMC模块获取PCIE芯片的在位情况,主板4的工作电流,工作电压以及PCIE芯片的温度。

可以理解的是,主板4在正常工作时具有额定的工作电流,额定的工作电压,PCIE芯片的温度在一定阈值范围内,同时BMC检测模块可以检测到PCIE芯片具有一定的工作状态,PCIE芯片的在位情况可以是具有数据进出及处理量,并且数据进出及处理量在PCIE芯片的承受范围内,PCIE芯片的承受范围为预设的。这表明在上述数据中主板4工作正常,当然还包括主板4工作时的其他数据,这里就不一一列举。

BMC检测模块可以检测每个主板的工作参数,当主板出现故障或运行参数超阈值时,可以发出提示信息。

本实施例中,监控单元1还包括:工作切换模块;工作切换模块用于当BMC检测模块检测某一PCIE芯片在位,且主板4的工作电流超阈值故障报警,或工作电压超阈值故障报警,或PCIE芯片的温度超阈值故障报警时,工作切换模块将当前主板4的运行工作,切换至备用主板4进行接替运行。

也就是如果某一主板4出现了主板4的工作电流超阈值故障报警,或工作电压超阈值故障报警,或PCIE芯片的温度超阈值故障报警时,工作切换模块将当前主板4的运行工作,切换至备用主板4进行接替运行。也可以时空闲为工作的主板4。本实施例中的主板4具有相同的参数,相同的配置,可以相互切换执行相应的工作。

实施例二,与实施例一基本相同,其中与实施例一不同之处在于,如图2所示,至少两个主板中包括:一主工作主板11和与所述主工作主板11相对应的一备用主板12。

这样主备主板一一对应,可以起到在工作切换模块切换时,有针对性,也可以起到不用将所有的主板都配置成一样的,只要将主备主板一致即可。提高架构配置的灵活性。主主板出现问题,就可以切换至备用主板。

实施例三,与实施例一基本相同,其中与实施例一不同之处在于,

主板还包括:GPU卡接口、NVMe接口、SSD接口、网卡接口;GPU卡接口、NVMe接口、SSD接口、网卡接口分别与PCIE芯片连接。当然主板还不局限于上述几种接口,还可以包括其他的接口形式。

主板还包括:温度检测传感器以及湿度检测传感器;BMC模块分别通过温度检测传感器以及湿度检测传感器获取主板的温度信息和湿度信息;监控单元通过I2C总线分别与主板的温度检测传感器以及湿度检测传感器连接,获取主板的温度信息和湿度信息。

实施例四,与实施例一基本相同,其中与实施例一不同之处在于,

主板包括:至少两颗PCIE芯片;PCIE芯片采用PLX9797PCIE芯片;PCIE芯片之间通过PCIEx16数据总线互连,构成一个PCIE芯片组。多颗PCIE芯片可以提高主板处理效率。

主板还包括:第一PCIE数据线束以及第二PCIE数据线束;PCIE芯片依次通过第一PCIE数据线束和背板连接器连接架构背板;PCIE芯片通过第二PCIE数据线束分别与GPU卡接口、NVMe接口、SSD接口、网卡接口连接。

具体的,第一PCIE数据线束采用16*PCIEx8PCIE数据线;第二PCIE数据线束采用16*PCIEx4PCIE数据线。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参考即可。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1