一种快速定位主板上内存条异常的方法及系统的制作方法

文档序号:10686941阅读:263来源:国知局
一种快速定位主板上内存条异常的方法及系统的制作方法
【专利摘要】本发明提供一种快速定位主板上内存条异常的方法及系统,所述快速定位主板上内存条异常的方法包括以下步骤:步骤S1,启动BIOS,并对与内存条插槽连接的通用输入输出接口进行初始化;步骤S2,初始化内存条,并逐一读取内存条的配置信息数据,检测内存条插槽中的内存条状态;步骤S3,判断内存条状态是否正常,并发送反馈信息,直到所有内存条插槽中的内存条检测完毕;步骤S4,将所有内存条插槽中的内存条状态发送给基板管理控制器。一旦主板检测到没有内存条、内存条损坏以及内存条类型不被支持中的任意一个问题,用户都能通过本发明直观定位到具体的异常内存条,进而大大降低排查主板错误的技术难度,简单便捷,快速高效。
【专利说明】
一种快速定位主板上内存条异常的方法及系统
技术领域
[0001]本发明涉及一种定位异常的方法,尤其涉及一种快速定位主板上内存条异常的方法,并涉及采用了该快速定位主板上内存条异常的方法的系统。
【背景技术】
[0002]内存条是主板上必不可少的硬件之一,每一片主板上最少要插入一根内存条,才能正常启动运行。每一种主板根据设计需求,满配时内存条的数量都不同,服务器主板上的内存条数量比较多,满配时可能有十几根,甚至几十根;所有插入主板的内存条都要检测正常,主要才能正常启动,而且主板检测内存条的工作,会在主板启动的早期,优先其他设备的检测,因为有了大量的内存资源,主板才能更加快速高效的进行其他操作。
[0003]主板上电启动后,进行最必要的初始化后,就开始检测内存条是否正常,如果所有插入内存条插槽上的内存条都是正常的,然后再检查其他设备,例如显示控制器等。在检测内存条过程中,如果检测出没有内存条、有内存条损坏或者有内存条类型不被主板支持等错误,B1S将停止运行,此时显示控制器还没有被检测,因此显示器不会被点亮。用户所能看到的是主板已经上电,风扇旋转,但是显示器不亮,鼠标键盘无法使用,没有故障点线索,这给用户带来了比较大的麻烦,需要逐一排查问题点,即使排查到内存条的问题,几十根内存条,逐条排查,整个过程需要耗费大量时间,甚至需要设备厂商的技术支持才行。

【发明内容】

[0004]本发明所要解决的技术问题是需要提供一种能够直观检查主板上每一个内存条插槽上的内存条状态信息的快速定位主板上内存条异常的方法,并需要提供采用了该快速定位主板上内存条异常的方法的系统。
[0005]对此,本发明提供一种快速定位主板上内存条异常的方法,包括以下步骤:
步骤SI,启动B1S,并对与内存条插槽连接的通用输入输出接口进行初始化;
步骤S2,初始化内存条,并逐一读取内存条的配置信息数据,检测内存条插槽中的内存条状态;
步骤S3,判断内存条状态是否正常,并发送反馈信息,直到所有内存条插槽中的内存条检测完毕;
步骤S4,将所有内存条插槽中的内存条状态发送给基板管理控制器。
[0006]本发明的进一步改进在于,所述内存条插槽与集成南桥芯片相连接,所述集成南桥芯片通过通用输入输出接口与指示模块相连接,其中,所述指示模块与所述内存条插槽之间建立有一一对应的关系。
[0007]本发明的进一步改进在于,所述指示模块采用指示灯,所述指示灯设置于与之对应的内存条插槽的旁边。
[0008]本发明的进一步改进在于,所述通用输入输出接口设置有待机电源,在关机或待机状态下,所述通用输入输出接口通过待机电源实现输出控制。
[0009]本发明的进一步改进在于,所述步骤S2中,初始化内存条包括以下子步骤:
步骤S201,配置内存条的运行频率;
步骤S202,检查配置内存条的内存区块结构;
步骤S203,初步配置内存条参数;
步骤S204,配置内存控制器;
步骤S205,配置内存条扼制数据;
步骤S206,运行内存条的读写测试;
步骤S207,配置使用内存条。
[0010]本发明的进一步改进在于,所述步骤S3中,包括以下子步骤:
步骤S301,判断内存条插槽中的内存条是否在位,若否则通过通用输入输出接口发送第一触发信号至所述指示模块,若是则跳转至步骤S302;
步骤S302,判断当前内存条的类型是否被支持,若是则跳转至步骤S303,若否则发送第二触发信号至所述指示模块;
步骤S303,判断当前内存条的初始化是否正常,若是则发送内存条状态正常的反馈信息,若否则发送第三触发信号至所述指示模块;
步骤S304,判断当前内存条是否为最后一个内存条插槽的内存条,若是则跳转至步骤S4,若否则跳转至步骤S301对下一个内存条插槽的内存条进行检测和判断。
[0011]本发明的进一步改进在于,所述第一触发信号为低电平触发信号,所述第二触发信号和第三触发信号均为闪烁指示信号。
[0012]本发明的进一步改进在于,所述步骤S4中,将内存条状态通过IPMI接口命令传递给基板管理控制器,再判断其检测结果,若接收到第一触发信号、第二触发信号和第三触发信号中的任意一个,则B1S暂停运行,等待处理;若所有内存条初始化正常,B1S将进行其他操作,操作结束。
[0013]本发明的进一步改进在于,所述步骤S4中,所述基板管理控制器对B1S传递过来的命令进行轮询,直到接收到B1S传递过来的命令,再判断该命令是否是内存条插槽上内存条的信息命令,如果是,开始收集存储与所述从内存条插槽上的内存条状态信息,然后将所有内存条插槽的内存条状态信息逐条显示在基板管理控制器的管理界面上。
[0014]本发明还提供一种快速定位主板上内存条异常的系统,采用了如上所述的快速定位主板上内存条异常的方法。
[0015]与现有技术相比,本发明的有益效果在于:一旦主板检测到没有内存条、内存条损坏以及内存条类型不被支持中的任意一个问题,用户都能通过本发明直观地检查出主板上每个内存条插槽的内存条状态信息,就可以定位到具体的异常内存条,还可以直接通过主板上内存条插槽的内存条状态指示灯将故障内存条取下或者替换,进而大大降低排查主板错误的技术难度,简单便捷,快速高效。
【附图说明】
[0016]图1是本发明一种实施例的工作流程示意图;
图2是本发明一种实施例的电路原理不意图;
图3是本发明一种实施例的详细工作流程示意图; 图4是本发明一种实施例的基板管理控制器的工作流程示意图。
【具体实施方式】
[0017]下面结合附图,对本发明的较优的实施例作进一步的详细说明。
[0018]如图1所示,本例提供一种快速定位主板上内存条异常的方法,包括以下步骤:
步骤SI,启动B1S,并对与内存条插槽连接的通用输入输出接口进行初始化;
步骤S2,初始化内存条,并逐一读取内存条的配置信息数据,检测内存条插槽中的内存条状态;
步骤S3,判断内存条状态是否正常,并发送反馈信息,直到所有内存条插槽中的内存条检测完毕;
步骤S4,将所有内存条插槽中的内存条状态发送给基板管理控制器。
[0019]本例所述内存条插槽与集成南桥芯片相连接,所述集成南桥芯片通过通用输入输出接口与指示模块相连接,其中,所述指示模块与所述内存条插槽之间建立有一一对应的关系。优选的,所述指示模块采用指示灯,所述指示灯设置于与之对应的内存条插槽的旁边;所述通用输入输出接口设置有待机电源,在关机或待机状态下,所述通用输入输出接口通过待机电源实现输出控制。所述内存条的配置信息数据包括SPD地址以及类型等,所述SF1D为Serial Presence Detect ,SF1D是一组关于内存条的配置信息,如P-Bank数量、电压、行地址/列地址数量、位宽以及各种主要的操作时序等,所述操作时序包括CL、tRCD、tRP和t RAS 等。
[0020]如图2所示,在硬件设计上,本例优选将主板上每一根DIMM插槽旁边放置一个发光二极管作为指示灯,用以表示DHM插槽上内存条的状态,有η个DMM插槽就用η个发光二极管,所有发光二极管负极统一接地,每个发光二极管的正极都连接到PCH上面的一个GP1接口管脚上面,η个发光二极管对应η个GP1接口的管脚,这些GP1接口需要是待机电源控制的,因此在关机状态下,GP10接口的输出值仍然是可以保留的,操作人员可以在关机状态下通过指示灯状态异常信息,对异常内存条进行处理。另外GP1接口的选择上,也可以是BMC上面的GP1。所述D頂M插槽为内存条插槽,所述GP1接口为通用输入输出接口;所述BMC为基板管理控制器,即主板的控制器;所述PCH为集成南桥芯片。
[0021]如图3所示,B1S启动以后,首先对GP1接口进行初始化,将用于DMM插槽状态显示的GP1接口设置为输出低电平的触发信号,这样发光二极管是熄灭状态,表明所有DMM插槽默认没有内存条,然后进行内存控制器初始化,根据D頂M插槽上内存条的sro地址,逐一读取Sro数据,来判断DIMM插槽上内存条的状态,如果能正常获取有效SPD数据,表明D頂M插槽上有内存条在位,如果不能获取有效Sro数据,表明DMM插槽上没有内存条在位。如果内存条没有在位,设置对应的GP1接口为低电平,这样对应发光二极管是熄灭状态,表明内存条不在位;如果内存条在位,通过SMBUS协议方式获取sro数据,sro模块类型数据能表明此内存条的类型,例如UDmM、RDmM和so-DMM,根据sro模块类型来判断此内存条类型是否被主板平台所支持,因为每种主板平台芯片组所支持内存条类型是固定的,如果不支持,将对应的GP1接口设置为输出闪烁的触发信号,如果支持,继续对内存条进行初始化,如果能正常初始化,将对应的GP1接口设置为输出高电平,如果初始化过程有报错,将对应的GP1接口设置为输出为闪烁,这样GP1接口输出高电平,发光二极管会被点亮,表明内存条在位且处于正常工作状态,GP1接口输出闪烁,发光二极管也会进行闪烁,表明内存条在位但是有问题,无法正常工作。
[0022]本例所述步骤S2中,初始化内存条包括以下子步骤:
步骤S201,配置内存条的运行频率;
步骤S202,检查配置内存条的内存区块结构,所述内存区块结构即RANK结构,倘若系统资料位元宽度是64bit,则每一个Rank就必须是64bit;
步骤S203,初步配置内存条参数;
步骤S204,配置内存控制器,具体为配置内存控制器的Channel Training,即类型和模式等;
步骤S205,配置内存条扼制数据,也就是配置内存条Thrott I ing;
步骤S206,运行内存条的读写测试;
步骤S207,配置使用内存条。
[0023]以上初始化内存条的子步骤中,任何一个子步骤运行错误,都会报错,将对应的GP1接口设置为输出闪烁,跳出此内存条的初始化过程。
[0024]主板上有多个DIMM插槽,判断是否所有DIMM插槽都已经检查完毕,如果没有,继续检查下一个D頂M插槽,如果已经检查完毕,将检查结果通过IPMI接口命令传递给BMC,再判断检查结果,如果主板上没有内存条或者有某个内存条初始化错误,B1S将暂停运行,等待操作人员处理,如果所有内存条初始化正常,B1S将进行其他操作,操作结束。如果硬件上选择BMC上面的GP1接口,GP10接口的设置状态由BMC来完成。所述IPMI接口命令即为智能平台管理接口的命令。
[0025]也就是说,如图3所示,本例所述步骤S3中,包括以下子步骤:
步骤S301,判断内存条插槽中的内存条是否在位,若否则通过通用输入输出接口发送第一触发信号至所述指示模块,若是则跳转至步骤S302;
步骤S302,判断当前内存条的类型是否被支持,若是则跳转至步骤S303,若否则发送第二触发信号至所述指示模块;
步骤S303,判断当前内存条的初始化是否正常,若是则发送内存条状态正常的反馈信息,若否则发送第三触发信号至所述指示模块;
步骤S304,判断当前内存条是否为最后一个内存条插槽的内存条,若是则跳转至步骤S4,若否则跳转至步骤S301对下一个内存条插槽的内存条进行检测和判断。
[0026]本例所述第一触发信号为低电平触发信号,用于触发指示灯点亮;所述第二触发信号和第三触发信号均为闪烁指示信号,用于触发指示灯闪烁。
[0027]本例所述步骤S4中,将内存条状态通过IPMI接口命令传递给基板管理控制器,再判断其检测结果,若接收到第一触发信号、第二触发信号和第三触发信号中的任意一个,则B1S暂停运行,等待处理;若所有内存条初始化正常,B1S将进行其他操作,操作结束。
[0028]如图4所示,所述步骤S4中,所述基板管理控制器对B1S传递过来的命令进行轮询,直到接收到B1S传递过来的命令,再判断该命令是否是内存条插槽上内存条的信息命令,如果是,开始收集存储与所述从内存条插槽上的内存条状态信息,然后将所有内存条插槽的内存条状态信息逐条显示在基板管理控制器的管理界面上,每个DIMM插槽上的内存条状态信息分为不在位、正常和异常三种状态。如果硬件上选择BMC的GP1接口,BMC需要根据这三种状态来设置GP1接口的输出状态。图4中所示的工作流程,其实就是图3中的BMC处理流程所表示的工作流程。
[0029]一旦主板检测到没有内存条、内存条损坏以及内存条类型不被支持中的任意一个问题,用户都能通过本例直观地检查出主板上每个内存条插槽的内存条状态信息,就可以定位到具体的异常内存条,还可以直接通过主板上内存条插槽的内存条状态指示灯将故障内存条取下或者替换,进而大大降低排查主板错误的技术难度,简单便捷,快速高效。
[0030]本例还提供一种快速定位主板上内存条异常的系统,采用了如上所述的快速定位主板上内存条异常的方法。
[0031 ]本例提出了DMM插槽上内存条异常状态快速具体定位的解决方案。硬件设计上,使用了发光二极管作为DMM插槽上内存条状态的指示灯,GP1接口控制有PCH和BMC两种可以选择,本例优选采用BMC A1S程序设计上对所有DMM插槽上内存条状态信息进行收集,将GP1接口设置正确输出,确保状态指示灯显示正确,并传递给BMC,然后再进行下一步操作,是停止运行还是继续其他操作。BMC接收到DIMM插槽内存条状态信息,将信息显示在BMC管理界面,操作人员可通过BMC管理界面或者DIMM插槽状态指示灯信息,来判断内存条状态信息。此方法,由硬件、B1S和BMC配合完成,操作人员能够无技术难度地判断出DIMM插槽上内存条的状态异常。
[0032]其中,IPMI接口为智能平台管理接口(Intelligent Platform ManagementInterface)是一种开放标准的硬件管理接口规格,定义了嵌入式管理子系统进行通信的特定方法。IPMI信息通过基板管理控制器BMC(位于IPMI规格的硬件组件上)进行交流。使用低级硬件智能管理而不使用操作系统进行管理,用户可以利用IPMI监视服务器的物理健康特征,如温度、电压、风扇工作状态、电源状态等。而且更为重要的是IPMI是一个开放的免费标准,用户无需为使用该标准而支付额外的费用。具有两个主要优点:首先,此配置允许进行带外服务器管理;其次,操作系统不必负担传输系统状态数据的任务。
[0033]所述BMC为基板管理控制器(Baseboard Management Controller)。一般内置在主板上,支持行业标准的IPMI规范。BMC提供的功能包括:本地和远程诊断、控制台支持、配置管理、硬件管理和故障排除。
[0034]PCH为Platform Controller Hub,是Intel公司的集成南桥芯片;B1S是BasicInput Output System,也就是基本输入输出系统,主要用于计算机开机过程中各种硬件设备的初始化和检测;GP1是General Purpose Input Output,也就是通用输入/输出;DIMM为Dual Inline Memory Modules,也就是双列直插式存储模块,即通常看到的主板上面的内存条。
[0035]以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
【主权项】
1.一种快速定位主板上内存条异常的方法,其特征在于,包括以下步骤: 步骤SI,启动B1S,并对与内存条插槽连接的通用输入输出接口进行初始化; 步骤S2,初始化内存条,并逐一读取内存条的配置信息数据,检测内存条插槽中的内存条状态; 步骤S3,判断内存条状态是否正常,并发送反馈信息,直到所有内存条插槽中的内存条检测完毕; 步骤S4,将所有内存条插槽中的内存条状态发送给基板管理控制器。2.根据权利要求1所述的快速定位主板上内存条异常的方法,其特征在于,所述内存条插槽与集成南桥芯片相连接,所述集成南桥芯片通过通用输入输出接口与指示模块相连接,其中,所述指示模块与所述内存条插槽之间建立有一一对应的关系。3.根据权利要求2所述的快速定位主板上内存条异常的方法,其特征在于,所述指示模块采用指示灯,所述指示灯设置于与之对应的内存条插槽的旁边。4.根据权利要求2所述的快速定位主板上内存条异常的方法,其特征在于,所述通用输入输出接口设置有待机电源,在关机或待机状态下,所述通用输入输出接口通过待机电源实现输出控制。5.根据权利要求1至4任意一项所述的快速定位主板上内存条异常的方法,其特征在于,所述步骤S2中,初始化内存条包括以下子步骤: 步骤S201,配置内存条的运行频率; 步骤S202,检查配置内存条的内存区块结构; 步骤S203,初步配置内存条参数; 步骤S204,配置内存控制器; 步骤S205,配置内存条扼制数据; 步骤S206,运行内存条的读写测试; 步骤S207,配置使用内存条。6.根据权利要求2至4任意一项所述的快速定位主板上内存条异常的方法,其特征在于,所述步骤S3中,包括以下子步骤: 步骤S301,判断内存条插槽中的内存条是否在位,若否则通过通用输入输出接口发送第一触发信号至所述指示模块,若是则跳转至步骤S302; 步骤S302,判断当前内存条的类型是否被支持,若是则跳转至步骤S303,若否则发送第二触发信号至所述指示模块; 步骤S303,判断当前内存条的初始化是否正常,若是则发送内存条状态正常的反馈信息,若否则发送第三触发信号至所述指示模块; 步骤S304,判断当前内存条是否为最后一个内存条插槽的内存条,若是则跳转至步骤S4,若否则跳转至步骤S301对下一个内存条插槽的内存条进行检测和判断。7.根据权利要求6所述的快速定位主板上内存条异常的方法,其特征在于,所述第一触发信号为低电平触发信号,所述第二触发信号和第三触发信号均为闪烁指示信号。8.根据权利要求6所述的快速定位主板上内存条异常的方法,其特征在于,所述步骤S4中,将内存条状态通过IPMI接口命令传递给基板管理控制器,再判断其检测结果,若接收到第一触发信号、第二触发信号和第三触发信号中的任意一个,则B1S暂停运行,等待处理;若所有内存条初始化正常,B1S将进行其他操作,操作结束。9.根据权利要求8所述的快速定位主板上内存条异常的方法,其特征在于,所述步骤S4中,所述基板管理控制器对B1S传递过来的命令进行轮询,直到接收到B1S传递过来的命令,再判断该命令是否是内存条插槽上内存条的信息命令,如果是,开始收集存储与所述从内存条插槽上的内存条状态信息,然后将所有内存条插槽的内存条状态信息逐条显示在基板管理控制器的管理界面上。10.—种快速定位主板上内存条异常的系统,其特征在于,采用了如权利要求1至9任意一项所述的快速定位主板上内存条异常的方法。
【文档编号】G06F11/32GK106055438SQ201610363368
【公开日】2016年10月26日
【申请日】2016年5月27日
【发明人】马井彬
【申请人】深圳市国鑫恒宇科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1