一种多个相同板卡共用时的区分结构及方法与流程

文档序号:29128596发布日期:2022-03-05 00:53阅读:103来源:国知局
一种多个相同板卡共用时的区分结构及方法与流程

1.本发明属于服务器板卡连接纠错技术领域,具体涉及一种多个相同板卡共用时的区分结构及方法。


背景技术:

2.在服务器设计中,经常会出现同时使用多张相同板卡的情况,如扩展卡、背板等。这些板卡在硬件上完全相同,板卡内cpld等逻辑器件无法互相区分这些板卡,主板bmc只能通过切换i2c线路来对应不同的板卡,又因为不同板卡的相同芯片i2c地址相同,因而无法在硬件上区分。
3.在以前的设计中,针对多背板的项目,bmc会配置为同时升级各背板cpld、fru等,各背板cpld同步接收命令进行升级等操作。所有cpld监控到的数据,都要全部回传给bmc,由bmc来判断具体是哪张背板,然后切换到对应的i2c线路上回传相应的命令给对应背板板卡的cpld来进行下一步操作。而上述过程一般通过i2c线路以及系统带内盘序识别,来确定具体背板板卡的位置。
4.上述方式中,主要的判断逻辑由bmc承担,会占用一部分资源,存在一定的轮询延迟。而且,如果背板灯板卡的设计上i2c线路与其他信号在不同的连接器上,当线缆错插时,会出现因板卡信号不同源导致的板卡信息识别冲突的问题,可能会使bmc识别出不准确的信息,造成故障。
5.此为现有技术的不足,因此,针对现有技术中的上述缺陷,提供一种多个相同板卡共用时的区分结构及方法,是非常有必要的。


技术实现要素:

6.针对现有技术的上述多张相同板卡共用时,无法区分各板卡,使得板卡内部逻辑芯片无法明确自身板卡的具体位置,从而使得bmc出现逻辑错误以及导致不同板卡间信息冲突的缺陷,本发明提供一种多个相同板卡共用时的区分结构及方法,以解决上述技术问题。
7.第一方面,本发明提供一种多个相同板卡共用时的区分结构,包括服务器主板和两个背板,第一背板和第二背板;
8.服务器主板上设置有bmc,bmc连接有第一i2c扩展芯片和第二i2c扩展芯片;
9.第一i2c扩展芯片连接有两个第一带外连接器;
10.第二i2c扩展芯片连接有两个第一i2c连接器;
11.每个背板上均设置有cpld、第二带外连接器和第二i2c连接器,每个背板还连接有一个硬盘;
12.每个背板的第二带外连接器与第一带外连接器及cpld连接,cpld与硬盘连接;
13.每个背板第二i2c连接器与第一i2c连接器及硬盘连接;
14.与同一背板的第二带外连接器和第二i2c连接器分别连接的第一带外连接器和第
一i2c连接器为一个连接器组;
15.同一个连接组中的第一带外连接器和第一i2c连接器均连接上拉电阻或下拉电阻;
16.不同连接器组中的连接器连接上拉电阻和下拉电阻中的不同类型。一个连接器组的连接器接上拉电阻时,另一个连接器组的连接器接下拉电阻。
17.进一步地,第一i2c扩展芯片和第二i2c扩展芯片采用pca9546型号的芯片。通过i2c扩展芯片实现bmc的i2c信号扩展,解决了bmc的i2c管脚不足的问题。
18.进一步地,第一带外连接器与第二带外连接器通过带外i2c信号线连接,第二带外连接器与cpld通过带外i2c信号线连接,cpld与硬盘通过带外信号线连接;
19.第一i2c连接器与第二i2c连接器通过i2c信号线连接,第二i2c连接器与硬盘通过i2c信号线连接。bmc通过带外的方式通过带外i2c信号线与cpld通信,控制背板逻辑,硬盘通过i2c信号线向bmc返回状态信息。
20.进一步地,cpld还连接有pcie switch芯片和sas扩展芯片。cpld获取到所在背板的id号信息后,还将背板id号通知背板上的pcie switch芯片和sas扩展芯片,确保pcie switch芯片和sas扩展芯片可准确指定自身所在的背板,并识别对应命令。
21.第二方面,本发明提供一种基于上述第一方面的多个相同板卡共用时的区分方法,包括如下步骤:
22.s1.根据服务器主板的两个连接组的上下拉电阻设置生成服务器主板与背板的连接器关系表;
23.s2.将服务器主板与两个背板进行插接;
24.s3.bmc根据服务器主板与背板的连接器关系表判断两个背板与服务器主板的连接器是否出现错接;
25.s4.当两个背板与服务器主板的连接器正确连接时,bmc判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;
26.s5.当两个背板与服务器主板的连接器出现错接时,bmc判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障。
27.进一步地,步骤s1具体步骤如下:
28.s11.将服务器主板同第一背板连接的连接器组连接下拉电阻,用0表示;
29.s12.将服务器主板同第二背板连接的连接器组连接上拉电阻,用1表示;
30.s13.生成服务器主板与背板的连接器关系表,其中,第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二i2c连接器与第一连接器组的第一i2c连接器连接时,对应第一背板id号为00;
31.第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二i2c连接器与第二连接器组的第一i2c连接器与连接时,对应第一背板id号01;
32.第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二i2c连接器与第一连接器组的第一i2c连接器连接时,对应第二背板id号10;
33.第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二i2c连接器与第二连接器组的第一i2c连接器连接时,对应第二背板id号11。硬盘背板的id号是预先设计的,并且bmc提前获知。
34.进一步地,步骤s2具体步骤如下:
35.s21.将服务器主板第一连接器组的第一带外连接器和第一i2c连接器分别与对应第一背板的第二带外连接器和第二i2c连接器连接;
36.s22.将服务器主板第二连接器组的第一带外连接器和第一i2c连接器分别与对应第二背板的第二带外连接器和第二i2c连接器连接。此处的连接方式为无连接器错接时的正确连接方式。
37.进一步地,步骤s3具体步骤如下:
38.s31.获取服务器主板与背板的连接器关系表中硬盘id号00、01、10及11;
39.s32.判断第一背板id号为00,第二背板id号为11,还是第一背板id号为01,第二背板id号为10;
40.s33.当第一背板id号为00,第二背板id号为11时,判定两个背板与服务器主板的连接器正确连接,进入步骤s4;
41.s34.当第一背板id号为01,第二背板id号为10时,判定两个背板与服务器主板的连接器出现错接,进入步骤s5。步骤s34中的连接器错接指的是两背板的第二i2c连接器错接,本发明还存在两背板的第二带外连接器错接时的情形。
42.进一步地,步骤s4具体步骤如下:
43.s41.bmc根据对应连接器组返回的i2c信号判断是否存在对应背板故障;背板故障包括硬盘故障;
44.若是,进入步骤s42;
45.若否,进入步骤s43;
46.s42.bmc通过对应带外连接器向对应背板的cpld发送控制信号,消除背板故障;
47.s43.结束。没有连接器错接时,bmc通过正确背板的id号即可通知故障背板所在cpld即可,消除背板故障。
48.进一步地,步骤s5具体步骤如下:
49.s51.bmc根据对应连接器组返回的i2c信号判断是否存在对应背板故障;背板故障包括硬盘故障;
50.若是,进入步骤s52;
51.若否,进入步骤s53;
52.s52.bmc通过对应带外连接器向对应背板的cpld发送控制信号,消除背板故障;
53.s53.结束。出现两个背板的第二i2c错接时,需要准确识别出是哪个背板发生了故障,再通过bmc向对应背板发送控制,消除对应背板故障,从而避免逻辑出错,陷入死循环。
54.本发明的有益效果在于:
55.本发明提供的多个相同板卡共用时的区分结构及方法,通过为连接器设置上下拉电阻的方式,实现bmc获取cpld识别的背板id号,判断是否出现连接器错插,并在连接器错插时能够对背板故障进行消除,实现对bmc的判断逻辑优化,减少资源调用。
56.此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
57.由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。
附图说明
58.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
59.图1是本发明的多个相同板卡共用时的区分结构的示意图。
60.图2是本发明的多个相同板卡共用时的区分结构连接器错接时的示意图。
61.图3是本发明的多个相同板卡共用时的区分方法实施例3流程示意图。
62.图4是本发明的多个相同板卡共用时的区分方法实施例4流程示意图。
具体实施方式
63.为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
64.实施例1:
65.如图1所示,本发明提供一种多个相同板卡共用时的区分结构,包括服务器主板和两个背板,第一背板和第二背板;
66.服务器主板上设置有bmc,bmc连接有第一i2c扩展芯片和第二i2c扩展芯片;
67.第一i2c扩展芯片连接有两个第一带外连接器;
68.第二i2c扩展芯片连接有两个第一i2c连接器;
69.每个背板上均设置有cpld、第二带外连接器和第二i2c连接器,每个背板还连接有一个硬盘;
70.每个背板的第二带外连接器与第一带外连接器及cpld连接,cpld与硬盘连接;
71.每个背板第二i2c连接器与第一i2c连接器及硬盘连接;
72.与同一背板的第二带外连接器和第二i2c连接器分别连接的第一带外连接器和第一i2c连接器为一个连接器组;
73.同一个连接组中的第一带外连接器和第一i2c连接器均连接上拉电阻或下拉电阻;
74.不同连接器组中的连接器连接上拉电阻和下拉电阻中的不同类型。
75.本发明提供的多个相同板卡共用时的区分结构,通过为连接器设置上下拉电阻的方式,实现bmc获取cpld识别的背板id号,判断是否出现连接器错插,并在连接器错插时能够对背板故障进行消除,实现对bmc的判断逻辑优化,减少资源调用。
76.实施例2:
77.如图1所示,本发明提供一种多个相同板卡共用时的区分结构,包括服务器主板和两个背板,第一背板和第二背板;
78.服务器主板上设置有bmc,bmc连接有第一i2c扩展芯片和第二i2c扩展芯片;第一i2c扩展芯片和第二i2c扩展芯片采用pca9546型号的芯片;通过i2c扩展芯片实现bmc的i2c信号扩展,解决了bmc的i2c管脚不足的问题;
79.第一i2c扩展芯片连接有两个第一带外连接器;
80.第二i2c扩展芯片连接有两个第一i2c连接器;
81.第一背板和第二背板上均设置有cpld、第二带外连接器和第二i2c连接器,每个背板还连接有一个硬盘;cpld还连接有pcie switch芯片和sas扩展芯片;cpld获取到所在背板的id号信息后,还将背板id号通知背板上的pcie switch芯片和sas扩展芯片,确保pcie switch芯片和sas扩展芯片可准确指定自身所在的背板,并识别对应命令;
82.每个背板的第二带外连接器与第一带外连接器及cpld连接,cpld与硬盘连接;
83.每个背板第二i2c连接器与第一i2c连接器及硬盘连接;
84.第一带外连接器与第二带外连接器通过带外i2c信号线连接,第二带外连接器与cpld通过带外i2c信号线连接,cpld与硬盘通过带外信号线连接;
85.第一i2c连接器与第二i2c连接器通过i2c信号线连接,第二i2c连接器与硬盘通过i2c信号线连接;bmc通过带外的方式通过带外i2c信号线与cpld通信,控制背板逻辑,硬盘通过i2c信号线向bmc返回状态信息;
86.与第一背板的第二带外连接器和第二i2c连接器连接的第一带外连接器和第一i2c连接器为第一连接器组;
87.与第二背板的第二带外连接器和第二i2c连接器连接的第一带外连接器和第一i2c连接器为第二连接器组;
88.第一连接组的第一带外连接器和第一i2c连接器均连接下拉电阻;
89.第二连接组的第一带外连接器和第一i2c连接器均连接上拉电阻;一个连接器组的连接器接上拉电阻时,另一个连接器组的连接器接下拉电阻,从而可起到区分连接器的作用。
90.在上述实施例2中,若出现如图2所示的连接器错插时,第一连接器组的第一i2c连接器与第二背板的第二i2c连接器连接,第二连接器组的第一i2c连接器与第一背板的第二i2c连接器,同时第二背板连接的硬盘出现故障,原有不加上下拉电阻时,bmc会接收到第一连接器组的第一i2c连接器通过i2c信号返回的硬盘故障信号,此时bmc并不知道连接器错插,因此会通过第一连接器组的第一带外连接器向第一背板的cpld发送控制信号,消除硬盘故障,但此时第一背板连接的硬盘并没有故障,而第二背板连接的硬盘故障又无法消除,会不断向bmc发出硬盘故障信号,因此会陷入死循环;
91.本技术中在第一连接器组的第一带外连接器和第一i2c连接器连接下拉电阻,而第二连接器组的第一带外连接器和第一i2c连接器连接上拉电阻后,bmc内部预设i2c通路对应的背板id信息,第一连接器组的第一i2c连接器的i2c信号线匹配到背板id号00和背板id号10对应背板,第二连接器组的第一i2c连接器的i2c信号线匹配到背板id号01和背板id号11对应背板,第一连接器组的第一带外连接器上i2c信号线匹配到背板id号00和背板id号01对应背板,第二连接器组第一带外连接器的i2c信号线匹配到背板id号10和背板id号11对应背板,id号01为连接器错接时第一背板id号,而id号00为连接器正确连接时第一背板id号,而id号10出现错插时第二背板的id号,id号11连接器正确连接时第二背板的id号;
92.第一背板与第二背板的第二i2c连接器出现错插时,第一背板id号为01,第二背板id号为10,bmc可快速识别到连接器错插,若错插时,还同时发生背板故障,以第二背板连接的硬盘故障为例,bmc此时会抓取到来自第一连接器组的第一i2c连接器对应i2c线路的信
息,匹配到id号为10的第二背板,按照预留设计,bmc会发送命令从第二连接器组的第一带外连接器对应i2c信号线给给背板id为10的第二背板的cpld,控制背板逻辑,此时第二背板连接的硬盘可断电消除故障,并作出警示。
93.同理,背板其他部位故障时,也可识别到对应背板并发出命令给准确故障的背板,两个背板的第二带外连接器错插时,第一背板的id号为10,第二背板的id号为01。
94.同时,此设计下,通过背板id号的识别,也可判断出多连接器时的连接关系是否正确,可以避免错插的情况,同时将错插时的影响降低。
95.实施例3:
96.如图3所示,本发明提供一种基于上述实施例1或实施例2的多个相同板卡共用时的区分方法,包括如下步骤:
97.s1.根据服务器主板的两个连接组的上下拉电阻设置生成服务器主板与背板的连接器关系表;
98.s2.将服务器主板与两个背板进行插接;
99.s3.bmc根据服务器主板与背板的连接器关系表判断两个背板与服务器主板的连接器是否出现错接;
100.s4.当两个背板与服务器主板的连接器正确连接时,bmc判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;
101.s5.当两个背板与服务器主板的连接器出现错接时,bmc判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障。
102.本发明提供的多个相同板卡共用时的区分及方法,通过为连接器设置上下拉电阻的方式,实现bmc获取cpld识别的背板id号,判断是否出现连接器错插,并在连接器错插时能够对背板故障进行消除,实现对bmc的判断逻辑优化,减少资源调用。
103.实施例4:
104.如图4所示,本发明提供一种多个相同板卡共用时的区分方法,包括如下步骤:
105.s1.根据服务器主板的两个连接组的上下拉电阻设置生成服务器主板与背板的连接器关系表;具体步骤如下:
106.s11.将服务器主板同第一背板连接的连接器组连接下拉电阻,用0表示;
107.s12.将服务器主板同第二背板连接的连接器组连接上拉电阻,用1表示;
108.s13.生成服务器主板与背板的连接器关系表,其中,第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二i2c连接器与第一连接器组的第一i2c连接器连接时,对应第一背板id号为00;
109.第一背板的第二带外连接器与第一连接器组的第一带外连接器连接,第一背板的第二i2c连接器与第二连接器组的第一i2c连接器与连接时,对应第一背板id号01;
110.第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二i2c连接器与第一连接器组的第一i2c连接器连接时,对应第二背板id号10;
111.第二背板的第二带外连接器与第二连接器组的第一带外连接器连接,第二背板的第二i2c连接器与第二连接器组的第一i2c连接器连接时,对应第二背板id号11;硬盘背板的id号是预先设计的,并且bmc提前获知;
112.s2.将服务器主板与两个背板进行插接;具体步骤如下:
113.s21.将服务器主板第一连接器组的第一带外连接器和第一i2c连接器分别与对应第一背板的第二带外连接器和第二i2c连接器连接;
114.s22.将服务器主板第二连接器组的第一带外连接器和第一i2c连接器分别与对应第二背板的第二带外连接器和第二i2c连接器连接;此处的连接方式为无连接器错接时的正确连接方式;
115.s3.bmc根据服务器主板与背板的连接器关系表判断两个背板与服务器主板的连接器是否出现错接;具体步骤如下:
116.s31.获取服务器主板与背板的连接器关系表中硬盘id号00、01、10及11;
117.s32.判断第一背板id号为00,第二背板id号为11,还是第一背板id号为01,第二背板id号为10;
118.s33.当第一背板id号为00,第二背板id号为11时,判定两个背板与服务器主板的连接器正确连接,进入步骤s4;
119.s34.当第一背板id号为01,第二背板id号为10时,判定两个背板与服务器主板的连接器出现错接,进入步骤s5;步骤s34中的连接器错接指的是两背板的第二i2c连接器错接,本发明还存在两背板的第二带外连接器错接时的情形;
120.s4.当两个背板与服务器主板的连接器正确连接时,bmc判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;具体步骤如下:
121.s41.bmc根据对应连接器组返回的i2c信号判断是否存在对应背板故障;背板故障包括硬盘故障;
122.若是,进入步骤s42;
123.若否,进入步骤s43;
124.s42.bmc通过对应带外连接器向对应背板的cpld发送控制信号,消除背板故障;
125.s43.结束;没有连接器错接时,bmc通过正确背板的id号即可通知故障背板所在cpld即可,消除背板故障;
126.s5.当两个背板与服务器主板的连接器出现错接时,bmc判断是否存在背板故障,并在存在背板故障时,识别出对应背板,消除故障;具体步骤如下:
127.s51.bmc根据对应连接器组返回的i2c信号判断是否存在对应背板故障;背板故障包括硬盘故障;
128.若是,进入步骤s52;
129.若否,进入步骤s53;
130.s52.bmc通过对应带外连接器向对应背板的cpld发送控制信号,消除背板故障;
131.s53.结束;出现两个背板的第二i2c错接时,需要准确识别出是哪个背板发生了故障,再通过bmc向对应背板发送控制,消除对应背板故障,从而避免逻辑出错,陷入死循环。
132.第一背板与第二背板的第二i2c连接器并未出现错插时,第一背板id号为00,第二背板id号为11,若此时发生背板故障,以第二背板连接的硬盘故障为例,bmc此时会抓取到来自第二连接器组的第一i2c连接器对应i2c线路的信息,匹配到id号为11的第二背板,按照预留设计,bmc会发送命令从第二连接器组的第一带外连接器对应i2c信号线给背板id为11的第二背板的cpld,控制背板逻辑,此时第二背板连接的硬盘可断电消除故障,并作出警示。
133.第一背板与第二背板的第二i2c连接器出现错插时,第一背板id号为01,第二背板id号为10,bmc可快速识别到连接器错插,若错插时,还同时发生背板故障,以第二背板连接的硬盘故障为例,bmc此时会抓取到来自第一连接器组的第一i2c连接器对应i2c线路的信息,匹配到id号为10的第二背板,按照预留设计,bmc会发送命令从第二连接器组的第一带外连接器对应i2c信号线给背板id为10的第二背板的cpld,控制背板逻辑,此时第二背板连接的硬盘可断电消除故障,并作出警示。
134.同理,背板其他部位故障时,也可识别到对应背板并发出命令给准确故障的背板,两个背板的第二带外连接器错插时,第一背板的id号为10,第二背板的id号为01。
135.同时,此设计下,通过背板id号的识别,也可判断出多连接器时的连接关系是否正确,可以避免错插的情况,同时将错插时的影响降低。
136.尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1