一种通过多cpu节点控制器芯片进行调试的方法和系统的制作方法

文档序号:6634222阅读:131来源:国知局
一种通过多cpu节点控制器芯片进行调试的方法和系统的制作方法【专利摘要】本发明提供了一种通过多CPU节点控制器芯片进行调试的方法和系统,其中,所述方法包括:收集多CPU节点控制器芯片中各个模块发生的错误;将收集的错误映射成系统事件;根据所述系统事件产生相应的中断信号向CPU节点发送。上述技术方案减少多CPU节点控制器芯片调试时间。【专利说明】一种通过多CPU节点控制器芯片进行调试的方法和系统【
技术领域
】[0001]本发明涉及控制器芯片调试领域,尤其涉及一种通过多CPU节点控制器芯片进行调试的方法和系统。【
背景技术
】[0002]高端服务器是一种在网络环境下为客户机提供共享资源(包括查询、存储和计算)的设备,其具有闻可罪性、闻性能、闻吞吐能力和大内存容量等特点,并且具备强大的网络功能和友好的人机界面,是以网络为中心的现代计算环境的关键设备。[0003]随着需求的增加,对高端服务器的要求越来越高,高端服务器中CPU的数量也随之增加,用于协调多CPU的节点控制器芯片在高端服务器中的作用越发凸显。由于涉及多个CPU,所述节点控制器芯片对多CPU节点的调试时间相对现有技术对单CPU节点的调试时间有了显著增加,而过多的调试时间无疑会增加高端服务器的研制成本,不利于高端服务器的普及应用。【
发明内容】[0004]本发明提供了一种通过多CPU节点控制器芯片进行调试的方法和系统,以解决如何减少多CPU节点控制器芯片调试时间的技术问题。[0005]为解决上述技术问题,本发明提供了一种通过多中央处理器(CPU)节点控制器芯片进行调试的方法,所述方法包括:[0006]收集多CPU节点控制器芯片中各个模块发生的错误;[0007]将收集的错误映射成系统事件;[0008]根据所述系统事件产生相应的中断信号向CPU节点发送。[0009]可选地,所述方法还包括:[0010]收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点控制器芯片中各个模块发生的错误映射为相应的错误等级,错误等级包括:可纠正错误(CorrectableErrors)、可恢复错误(RecoverableErrors)和不可纠正错误(FatalErrors);[0011]将所述相应的错误等级映射为与该错误等级对应的显示标识并显示。[0012]可选地,所述将收集的错误映射成系统事件,包括:[0013]在收集的错误中选择需屏蔽的错误;[0014]将收集的未被屏蔽的错误映射为系统事件。[0015]可选地,所述将收集的未被屏蔽的错误映射为系统事件,包括:[0016]设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置I;[0017]未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误时,将该位置位,触发一个或多个系统事件。[0018]为解决上述技术问题,本发明还提供了一种通过多中央处理器(CPU)节点控制器芯片进行调试的系统,所述系统置于所述多CPU节点控制器芯片内,所述系统包括设置在多CPU节点控制器芯片中各个模块的本地错误获取模块、全局错误处理模块以及中断产生模块,其中[0019]本地错误获取模块,用于获取其所在模块发生的错误,并将获取的错误发送至全局错误处理模块;[0020]所述全局错误处理模块,用于收集各个本地错误获取模块获取的错误,并将收集的错误映射成系统事件,将所述系统事件发送至所述中断产生模块;[0021]所述中断产生模块,用于根据系统事件产生相应的中断信号向CPU节点发送。[0022]可选地,[0023]所述本地错误获取模块,还用于在收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点控制器芯片中各个模块发生的错误映射为相应的错误等级;将所述相应的错误等级映射为与该错误等级对应的显示标识并显示;[0024]所述错误等级包括:可纠正错误(CorrectableErrors)、可恢复错误(RecoverableErrors)和不可纠正错误(FatalErrors)。[0025]可选地,所述全局错误处理模块,用于将收集的错误映射成系统事件,包括:[0026]在收集的错误中选择需屏蔽的错误,将收集的未被屏蔽的错误映射为系统事件。[0027]可选地,所述全局错误处理模块,用于将收集的未被屏蔽的错误映射为系统事件,包括:[0028]设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置I;未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误时,将该位置位,触发一个或多个系统事件。[0029]上述技术方案的节点控制器芯片能够快速获取定位错误,减少了多CPU节点控制器芯片的调试时间。【专利附图】【附图说明】[0030]图1为本实施例的通过多CPU节点控制器芯片进行调试的方法流程图;[0031]图2为本实施例的通过多CPU节点控制器芯片进行调试的系统组成图。【具体实施方式】[0032]为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。[0033]图1为本实施例的通过多CPU节点控制器芯片进行调试的方法流程图。[0034]SlOl收集多CPU节点控制器芯片中各个模块发生的错误;[0035]其中,多CPU节点控制器芯片中各个模块包括:存储控制器(MemoryController,MC)模块、链路层接口(SocketInterface,SI)模块和本地代理(LocalProxy,LP)模块;[0036]可选地,[0037]在收集多CPU节点控制器芯片中各个模块发生的错误后,将所述各个模块发生的错误映射为相应的错误等级,错误等级包括:可纠正错误(CorrectableErrors)、可恢复错误(RecoverableErrors)和不可纠正错误(FatalErrors);[0038]可以根据各个模块的功能为该模块出现的错误定义映射的错误等级;[0039]其中,可纠正错误(CorrectableErrors),是指硬件可纠正的错误,发生该错误后,出现错误的系统可恢复,且恢复后无信息丢失;如链路CRC错误,可以通过数据链路层的重试来纠正;[0040]不可纠正错误(FatalEirors),是指产生一个硬件不可靠性的错误,需要系统复位来使该硬件恢复到可靠状态;如Cache的不可纠正的tagerror、永久的PC1-E链路失败或者QPI失败;相对于可纠正错误,不可纠正错误由于对系统复位,致使错误出现之前的数据和操作会在复位后全部丢失,需要复位后的系统重新进行相应的操作;[0041]可恢复错误(RecoverableErrors),除可纠正错误和不可纠正错误之外的错误,该错误发生后导致相应的数据检错事务不可靠,但系统硬件功能仍可继续运行;如ECC错误,其只影响数据检错事务的数据部分;[0042]将所述相应的错误等级映射为与该错误等级对应的显示标识并显示,如所述显示标识为带颜色的提示灯,不同的错误等级对应为不同颜色的提示灯,当模块出现错误时,通过提示灯的颜色区分错误等级,可方便开发调试人员及时准确的定位错误;[0043]S102将收集的错误映射成系统事件;[0044]可选地,步骤S102包括:[0045]在收集的错误中选择需屏蔽的错误,将收集的未被屏蔽的错误映射为系统事件;其中,非致命错误可被屏蔽,如FatalErrors;[0046]可选地,可通过设置单独的错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,对错误状态寄存器相应位置1,可实现对与该位对应的错误进行屏蔽;[0047]未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误,即该位被置位(从O到I),则触发一个或多个系统事件;[0048]S103根据所述系统事件产生相应的中断信号向CPU节点发送;[0049]可选地,将根据所述系统事件产生的中断信号发送至所述控制器芯片的中断产生模块(IPU),再通过包含IPU的一般代理模块(GeneralProxy,GP)将II3U产生的中断信号向CPU节点发送;[0050]可选地,将根据所述系统事件产生的中断信号发送至所述控制器芯片的中断产生模块(IPU)的方式包括:[0051]通过以电平触发的硬连接方式将中断信号发送至IPU;[0052]可选地,为将II3U产生的中断信号向CPU节点发送,所述GP内设置一个状态寄存器,状态寄存器的初始值为0,当IPU的中断管脚为高电平时,GP将II3U产生的中断信号向(PU节点发送,同时将状态寄存器的值置I。待CPU的中断处理程序对该中断信号进行处理完毕后,再将状态寄存器的值清O。[0053]图2为本实施例的通过多CPU节点控制器芯片进行调试的系统组成图。[0054]所述系统置于所述多CPU节点控制器芯片内,所述系统包括设置在多CPU节点控制器芯片中各个模块的本地错误获取模块、全局错误处理模块以及中断产生模块,其中:[0055]本地错误获取模块,用于获取其所在模块发生的错误,并将获取的错误发送至全局错误处理模块;[0056]可选地,所述本地错误获取模块,还用于在收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点控制器芯片中各个模块发生的错误映射为相应的错误等级;将所述相应的错误等级映射为与该错误等级对应的显示标识并显示;所述错误等级包括:可纠正错误(CorrectableErrors)、可恢复错误(RecoverableErrors)和不可纠正错误(FatalErrors)[0057]所述全局错误处理模块,用于收集各个本地错误获取模块获取的错误,并将收集的错误映射成系统事件,将所述系统事件发送至所述中断产生模块;[0058]可选地,所述全局错误处理模块,用于在收集的错误中选择需屏蔽的错误,将收集的未被屏蔽的错误映射为系统事件,包括:[0059]设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置I;未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误时,将该位置位,触发一个或多个系统事件;[0060]所述中断产生模块,用于根据系统事件产生相应的中断信号向CPU节点发送;[0061]可选地,所述中断产生模块,用于将根据所述系统事件产生的中断信号发送至所述控制器芯片的中断产生模块(IPU),再通过包含IPU的一般代理模块(GeneralProxy,GP)将II3U产生的中断信号向CPU节点发送。[0062]本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成,所述程序可以存储于计算机可读存储介质中,如只读存储器、磁盘或光盘等。可选地,上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现,相应地,上述实施例中的各模块/单元可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。[0063]需要说明的是,本发明还可有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。【权利要求】1.一种通过多中央处理器(CPU)节点控制器芯片进行调试的方法,其特征在于,所述方法包括:收集多CPU节点控制器芯片中各个模块发生的错误;将收集的错误映射成系统事件;根据所述系统事件产生相应的中断信号向CPU节点发送。2.如权利要求1所述的方法,其特征在于,所述方法还包括:收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点控制器芯片中各个模块发生的错误映射为相应的错误等级,错误等级包括:可纠正错误(CorrectableErrors)、可恢复错误(RecoverableErrors)和不可纠正错误(FatalErrors);将所述相应的错误等级映射为与该错误等级对应的显示标识并显示。3.如权利要求1所述的方法,其特征在于,所述将收集的错误映射成系统事件,包括:在收集的错误中选择需屏蔽的错误;将收集的未被屏蔽的错误映射为系统事件。4.如权利要求3所述的方法,其特征在于,所述将收集的未被屏蔽的错误映射为系统事件,包括:设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置I;未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误时,将该位置位,触发一个或多个系统事件。5.一种通过多中央处理器(CPU)节点控制器芯片进行调试的系统,其特征在于,所述系统置于所述多CPU节点控制器芯片内,所述系统包括设置在多CPU节点控制器芯片中各个模块的本地错误获取模块、全局错误处理模块以及中断产生模块,其中本地错误获取模块,用于获取其所在模块发生的错误,并将获取的错误发送至全局错误处理模块;所述全局错误处理模块,用于收集各个本地错误获取模块获取的错误,并将收集的错误映射成系统事件,将所述系统事件发送至所述中断产生模块;所述中断产生模块,用于根据系统事件产生相应的中断信号向CPU节点发送。6.如权利要求5所述的系统,其特征在于,所述本地错误获取模块,还用于在收集多CPU节点控制器芯片中各个模块发生的错误后,将多CPU节点控制器芯片中各个模块发生的错误映射为相应的错误等级;将所述相应的错误等级映射为与该错误等级对应的显不标识并显不;所述错误等级包括:可纠正错误(CorrectableErrors)、可恢复错误(RecoverableErrors)和不可纠正错误(FatalErrors)。7.如权利要求5所述的系统,其特征在于,所述全局错误处理模块,用于将收集的错误映射成系统事件,包括:在收集的错误中选择需屏蔽的错误,将收集的未被屏蔽的错误映射为系统事件。8.如权利要求7所述的系统,其特征在于,所述全局错误处理模块,用于将收集的未被屏蔽的错误映射为系统事件,包括:设置错误状态寄存器存储收集的错误,其中每个错误对应错误状态寄存器的一位,当要屏蔽错误时,将错误状态寄存器中与被屏蔽错误对应的位置I;未被屏蔽的错误输出至设置的系统事件状态寄存器,系统事件状态寄存器的每一位对应一个未被屏蔽的错误;当事件状态寄存器的位接收到错误时,将该位置位,触发一个或多个系统事件。【文档编号】G06F11/22GK104407952SQ201410645684【公开日】2015年3月11日申请日期:2014年11月12日优先权日:2014年11月12日【发明者】王振江申请人:浪潮(北京)电子信息产业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1