信息处理的方法、装置和系统的制作方法

文档序号:6369315阅读:145来源:国知局
专利名称:信息处理的方法、装置和系统的制作方法
技术领域
本发明涉及通信技术领域,特别涉及一种信息处理的方法、装置和系统。
背景技术
目前许多大型的通信系统都是由多个服务器组成的,在系统中每个服务器都是ー个节点,节点和节点之间通过预设的线路连接在一起,组成ー个完整的系统,每个节点处理都会有相应的处理任务,节点间相互配合工作。对于多个节点组成的系统,如果ー个节点出现了故障,其它节点都会受到影响,所以对节点的故障检测并进行故障处理是需要解决的问题。现有技术中,在系统运行过程中,如果某个节点出现故障,则通过传感器可以获知 各个节点的温度,当发现其中某个节点的温度超过预设的阈值时,则表明该节点出现了故障,暂停系统的运行,并将该节点从系统中拿出来,对该节点进行单独调试,获知该节点的故障原因,并进一歩地根据故障原因对该节点进行恢复,对该节点调试完成后再放入系统中,重新调试并运行系统,从而实现了对系统中节点的故障检测和恢复。在实现本发明的过程中,发明人发现现有技术至少存在以下问题现有技术中当发现系统出现故障时,只能通过传感器获知故障节点,并不能详细的获取故障信息,需要暂停系统的运行,将故障节点从系统中拿出来进行调试,等到故障节点调试完毕并重装到系统中后,才重新调试并运行系统,这样耗时较长,降低系统工作效率。

发明内容
为了解决现有技术中对故障节点的调试耗时比较长的问题,本发明实施例提供了一种信息处理的方法、装置和系统。所述技术方案如下—方面,提供了一种信息处理的方法,所述方法包括当设备管理系统DMS管理的多个节点运行时,所述DMS获取所述每个节点的中央处理器CPU运行信息;当所述多个节点中出现故障节点吋,所述DMS根据所述每个节点的CPU运行信息获知故障节点;所述DMS对所述故障节点进行调试。另ー方面,提供了一种设备管理系统,所述设备管理系统包括获取模块,用于当DMS管理的多个节点运行时,获取所述每个节点的CPU运行信息;故障诊断模块,用于当所述多个节点中出现故障节点时,根据所述每个节点的CPU运行信息获知故障节点;故障调试模块,用于对所述故障节点进行调试。另ー方面,还提供了ー种节点,所述节点包括现场可编程门阵列FPGA、调试接ロXDP和中央处理器CPU,其中所述FPGA包括
接收模块,用于接收所述CPU通过所述XDP传送的CPU运行信息;信息处理模块,用于将所述接ロ信息转换成设备管理系统DMS能够显示的信息,并将所述转换后的信息传送给板上管理控制器BMC的CPU,使所述BMC的CPU对所述转换后的信息进行封装并将所述封装后的信息传送给所述DMS。另ー方面,还提供了ー种信息处理的系统,所述系统包括如上所述的设备管理系统和如上所述的节点。本发明实施例提供的技术方案带来的有益效果是当设备管理系统DMS管理的多个节点运行时,所述DMS获取所述每个节点的中央处理器CPU运行信息;当所述多个节点中出现故障节点时,所述DMS根据所述每个节点的CPU运行信息获知故障节点;所述DMS对所述故障节点进行调试。通过在线获取各个节点CPU运行信息当系统中的节点出现故障吋, 能够及时根据各个节点的CPU运行信息,查找到故障节点,并在线对故障节点进行调试,不需要把故障节点单独拿下来进行调试,解决了现有技术中对故障节点调试耗时较长的问题。


为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图I是本发明实施例I中提供的一种信息处理的方法的流程图;图2是本发明实施例2中提供的一种信息处理的方法的流程图;图3是本发明实施例3中提供的一种设备管理系统的示意图;图4是本发明实施例3中提供的一种节点的示意图;图5是本发明实施例3中提供的ー种FPGA的示意图;图6是本发明实施例3中提供的一种信息处理的系统的示意图。
具体实施例方式为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进ー步地详细描述。本发明主要解决了在多节点组成的系统中,当其中一个或多个节点CPU出现故障时,不必再从系统中将单节点拿下,进行单节点的単独调试,调试完毕后再进行组系统;而是直接通过在线的方法对单节点的CPU运行信息实时在线搜集并显示,从而通过搜集的信息对CPU故障进行在线调试,进而节约系统故障排除时间与提高系统维护效率。实施例I參见图1,本实施例中提供了一种信息处理的方法,所述方法包括101、当DMS(DEVICE MANAGEMENT SYSTEM,设备管理系统)管理的多个节点运行时,所述DMS获取所述姆个节点的CPU (Central Processing Unit,中央处理器)运行信息;102、当所述多个节点中出现故障节点时,所述DMS根据所述每个节点的CPU运行信息获知故障节点;
103、所述DMS对所述故障节点进行调试。优选地,所述DMS管理的姆个节点均包括FPGA(Field Programmable Gate Array,现场可编程门阵列)、XDP (Xtended Debug Port)和CPU,XDP是Intel定义的ー个新的调试接ロ,用于对CPU进行调试,所述DMS获取所述每个节点的CPU运行信息之前,所述DMS管理的每个节点执行以下步骤节点的FPGA接收所述节点的CPU通过XDP传送的CPU运行信息;所述FPGA将所述CPU运行信息转换成所述DMS能够显示的信息,并将所述转换后的信息传送给BMC的CPU,使所述BMC的CPU对所述转换后的信息进行封装并将所述封装后的信息传送给所述DMS。优选地,所述将所述转换后的信息发送给BMC的CPU,包括
所述FPGA向BMC的CPU发送中断请求信息,使所述BMC的CPU从所述FPGA中取出所述转换后的信息。优选地,所述DMS对所述故障节点进行调试,包括所述DMS根据所述故障节点的CPU信息获取所述故障节点的故障恢复信息;所述DMS将所述故障节点的故障恢复信息通过BMC的CPU传送给FPGA,使所述FPGA将所述故障恢复信息转换为所述故障节点的CPU能够执行的指令并将所述指令通过XDP传送给所述故障节点的CPU。本实施例的有益效果包括当设备管理系统DMS管理的多个节点运行时,所述DMS获取所述每个节点的中央处理器CPU运行信息;当所述多个节点中出现故障节点时,所述DMS根据所述每个节点的CPU运行信息获知故障节点;所述DMS对所述故障节点进行调试。通过在线获取各个节点CPU运行信息当系统中的节点出现故障吋,能够及时根据各个节点的CPU运行信息,查找到故障节点,并在线对故障节点进行调试,不需要把故障节点单独拿下来进行调试,解决了现有技术中对故障节点调试耗时较长的问题。实施例2本实施例中提供了一种信息处理的方法,其中,节点包括FPGA、XDP和CPU,主板上的XDP信号经过FPGA逻辑实现XDP信号的转换,再将转换的信号通过某种方式传向BMC的CPU,经过BMC的CPU对信息按IPMI的协议格式进行封装处理,再由BMC与DMS间的通道实现CPU故障在线处理机制。其中BMC可以是集成在节点上的模块,也可以是ー个独立的模块,对此本实施例不做具体限定。參见图2,本实施例中的信息处理方法具体包括201、当DMS管理的多个节点运行时,DMS获取每个节点的CPU运行信息。本实施例中,DMS管理系统中的各个节点,将节点中的FPGA的器件挂到BMC的LOCAL BUS总线上,主板上的XDP信号经过FPGA逻辑实现XDP信号解析。节点CPU的XDP调试接ロ与FPGA之间相互通信,其中DMS获取每个节点的CPU运行信息之前,所述DMS获取所述每个节点的CPU运行信息之前,所述DMS管理的每个节点执行以下步骤节点的FPGA接收所述节点的CPU通过XDP传送的CPU信息;所述FPGA将所述接ロ信息转换成所述DMS能够显示的信息,并将所述转换后的信息传送给BMC的CPU,使所述BMC的CPU对所述转换后的信息进行封装并将所述封转后的信息通过FE PHY(FAST ETHNET PHY,快速以太网PHY)传送给所述DMS。本实施例中,在具体实时过程中,在FPGA上设置数据接收区OUT、数据缓冲区I、数据缓冲区2和数据接收区IN。数据接收区OUT用于存放从节点CPU的XDP进入到FPGA的数据,数据缓冲区I用于存放FPGA将数据接收区OUT中的数据进行解析后的数据,数据缓冲区2用于存放DMS向该节点下达的命令,即故障恢复信息,数据接收区IN用于存放FPGA将数据缓冲区2中的数据解析为CPU语言的数据。基于上述数据区域的划分,获取系统各个节点的CPU运行信息具体包括I)在系统运行时,节点的CPU的XDP调试的接ロ信息进入FPGA的数据接收缓冲区OUT ;其中,节点的CPU的XDP调试的接ロ信息即为CPU运行信息。2)FPGA将数据缓冲区OUT的数据进行协议解析,并将解析后的数据放入数据缓冲区I ;其中,对数据缓冲区OUT中的数据进行协议解析就是将CPU运行信息转换成DMS 能够显示的信息的过程。在系统运行时,节点的CPU的运行信息为ニ进制的代码,该代码如果直接在DMS上显示,可能会出现乱码,DMS系统不能识别,因此需要FPGA对CPU的运行信息进行转换,转换为DMS能够显示的语言。3) FPGA向BMC的CPU发送中断请求信息,BMC的CPU接收到该中断请求后,将数据缓冲区I的数据取出,并将数据以IPMI的协议形式进行封装,然后通过CPU与FEPHY间的通道传输到DMS,由DMS将信息包进行处理并显示。其中,FPGA向BMC的CPU发送中断请求信息,BMC的CPU接收到该中断请求后,将数据缓冲区I的数据取出,并将数据以IPMI的协议形式进行封装,然后通过CPU与FEPHY间的通道传输到DMS的过程,就是将解析后的信息传送给BMC的CPU,BMC的CPU对转换后的信息进行封装并将封转后的信息通过FEPHY传送给所DMS的过程。202、当多个节点中出现故障节点吋,DMS根据每个节点的CPU运行信息获知故障节点。本实施例中,在系统运行时,实时的获取系统中各个节点的CPU运行信息,当系统中的某个或多个节点出现故障吋,DMS对各个节点的CPU运行信息进行分析,找到出现故障的ー个或多个节点。其中具体的分析过程包括将运行信息中的运行结果与预设的运行结果进行比较,如果超出预设的运行结果,则确认该节点出现了故障。其中对CPU的运行信息进行分析以获知其是否出现故障属于现有技术,对此本实施例不再赘述。203、DMS对所述故障节点进行调试。本实施例中,找到故障节点后,DMS切換到故障节点上,分析出故障节点的故障原因,并根据故障节点的故障原因向故障节点下达指令,该指令包括故障节点的故障恢复信息,以在线调试该故障节点的CPU,使故障节点在运行故障信息后能够恢复正常工作。其中对故障节点进行调试,具体包括=DMS根据所述故障节点的CPU运行信息获取所述故障节点的故障恢复信息;所述DMS将所述故障节点的故障恢复信息通过BMC的CPU传送给FPGA,使所述FPGA将所述故障恢复信息转换为所述故障节点的CPU能够执行的指令并将所述指令通过XDP传送给所述故障节点的CPU。本步骤中,DMS下达的指令节点的CPU是不能够直接运行的,需要将该指令转换为节点CPU能够执行的指令,具体本实施例中使用FPGA进行转换,但是也不限于此种转换方式,对此本实施例不做具体限定。具体实施过程中,基于FPGA划分的数据区,DMS找到故障节点并对故障节点进行调试的信息流的走向与步骤201中的信息流的走向相反,具体的信息流程包括DDMS向下发出命令并对该命令以IPMI协议形式进行封装,将封装后的命令传到BMC 的 CPU ;其中DMS下发的命令中包括节点的故障恢复信息。2) BMC的CPU对IPMI的格式的信息进行解析,BMC的CPU通过其与FPGA间的通道向FPGA传送解析后的信息,FPGA将接收到的解析信息放到达数据缓冲区2 ;3)FPGA通过XDP协议将数据缓冲区2中的数据转换成XDP协议格式的内容,并将转换后的内容放入数据接收区IN,数据缓冲区IN中的数据再通过XDP进入节点的CPU,使CPU执行命令,并恢复节点的正常运行。204、对故障节点调试完成后,系统正常工作。本步骤中,在对故障节点调试完成后,节点正常工作的同时,系统也正常工作,并继续获取各个节点的CPU运行信息,重复执行步骤201-204,对此本实施例不再赘述。本实施例的有益效果包括当设备管理系统DMS管理的多个节点运行时,所述DMS获取所述每个节点的中央处理器CPU运行信息;当所述多个节点中出现故障节点时,所述DMS根据所述每个节点的CPU运行信息获知故障节点;所述DMS对所述故障节点进行调试。通过在线获取各个节点CPU运行信息当系统中的节点出现故障吋,能够及时根据各个节点的CPU运行信息,查找到故障节点,并在线对故障节点进行调试,不需要把故障节点单独拿下来进行调试,解决了现有技术中对故障节点调试耗时较长的问题。且,通过FPGA实现节点的XDP与BMC间的通信,实现简单,可操作性強。实施例3參见图3,本实施例中提供了一种设备管理系统,其特征在于,所述设备管理系统包括获取模块301、故障诊断模块302和故障调试模块303。获取模块301,用于当DMS管理的多个节点运行时,获取所述每个节点的CPU运行
信息;故障诊断模块302,用于当所述多个节点中出现故障节点时,根据所述每个节点的 CPU运行信息获知故障节点;故障调试模块303,用于对所述故障节点进行调试。优选地,所述故障调试模块303,包括获取单元,用于根据所述故障节点的CPU运行信息获取所述故障节点的故障恢复信息;命令下发单元,用于将所述故障节点的故障恢复信息通过BMC的CPU传送给FPGA,使所述FPGA将所述故障恢复信息转换为所述故障节点的CPU能够执行的指令并将所述指令通过XDP传送给所述故障节点的CPU。參见图4,本实施例中还提供了ー种节点,所述节点包括现场可编程门阵列FPGA100、调试接ロ XDP200和中央处理器CPU300,其中參见图5,所述FPGA包括接收模块401和信息处理模块402。接收模块401,用于接收CPU通过XDP传送的CPU运行信息;信息处理模块402,用于将所述接ロ信息转换成DMS能够显示的信息,并将所述转换后的信息传送给BMC的CPU,使所述BMC的CPU对所述转换后的信息进行封装并将所述封装后的信息传送给所述DMS。优选地,信息处理模块402,包括第一发送单元,用于向BMC的CPU发送中断请求信息,使所述BMC的CPU从所述FPGA中取出所述转换后的信息。优选地,所述信息处理模块402还包括接收单元,用于接收所述DMS通过所述BMC的CPU传送的所述节点的故障恢复信息;转换单元,用于将所述故障恢复信息转换为所述节点的CPU能够执行的指令;第二发送单元,用于将所述指令通过所述XDP传送给所述CPU。 其中FPGA包括四个数据区域,数据接收区OUT、数据缓冲区I、数据缓冲区2和数据接收区IN。数据接收区OUT用于存放从CPU的XDP进入到FPGA的数据,数据缓冲区I用于存放FPGA将数据接收区OUT中的数据进行解析后的数据,数据缓冲区2用于存放DMS向该节点下达的命令,即故障恢复信息,数据接收区IN用于存放FPGA将数据缓冲区2中的数据解析为CPU语言的数据。參见图6,本实施例中还提供了ー种信息处理的系统,所述系统包括如上所述的设备管理系统400和如上所述的节点500。本实施例的有益效果包括当设备管理系统DMS管理的多个节点运行时,所述DMS获取所述每个节点的中央处理器CPU运行信息;当所述多个节点中出现故障节点时,所述DMS根据所述每个节点的CPU运行信息获知故障节点;所述DMS对所述故障节点进行调试。通过在线获取各个节点CPU运行信息当系统中的节点出现故障吋,能够及时根据各个节点的CPU运行信息,查找到故障节点,并在线对故障节点进行调试,不需要把故障节点单独拿下来进行调试,解决了现有技术中对故障节点调试耗时较长的问题。本实施例提供的设备管理系统、节点及系统,具体可以与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于ー种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1.一种信息处理的方法,其特征在于,所述方法包括 当设备管理系统DMS管理的多个节点运行时,所述DMS获取所述每个节点的中央处理器CPU运行信息; 当所述多个节点中出现故障节点时,所述DMS根据所述每个节点的CPU运行信息获知故障节点; 所述DMS对所述故障节点进行调试。
2.根据权利要求I所述的方法,其特征在于,所述DMS管理的每个节点均包括现场可编程门阵列FPGA、调试接ロ XDP和CPU,所述DMS获取所述每个节点的CPU运行信息之前,所述DMS管理的每个节点执行以下步骤 节点的FPGA接收所述节点的CPU通过调试接ロ XDP传送的CPU运行信息; 所述FPGA将所述CPU运行信息转换成所述DMS能够显示的信息,并将所述转换后的信息传送给板上管理控制器BMC的CPU,使所述BMC的CPU对所述转换后的信息进行封装并将所述封装后的信息传送给所述DMS。
3.根据权利要求2所述的方法,其特征在于,所述将所述转换后的信息发送给BMC的(PU,包括 所述FPGA向BMC的CPU发送中断请求信息,使所述BMC的CPU从所述FPGA中取出所述转换后的信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述DMS对所述故障节点进行调试,包括 所述DMS根据所述故障节点的CPU信息获取所述故障节点的故障恢复信息; 所述DMS将所述故障节点的故障恢复信息通过BMC的CPU传送给FPGA,使所述FPGA将所述故障恢复信息转换为所述故障节点的CPU能够执行的指令并将所述指令通过XDP传送给所述故障节点的CPU。
5.一种设备管理系统DMS,其特征在于,所述设备管理系统包括 获取模块,用于当DMS管理的多个节点运行吋,获取所述每个节点的中央处理器CPU运行信息; 故障诊断模块,用于当所述多个节点中出现故障节点时,根据所述每个节点的CPU运行信息获知故障节点; 故障调试模块,用于对所述故障节点进行调试。
6.根据权利要求5所述的设备管理系统,其特征在于,所述故障调试模块,包括 获取单元,用于根据所述故障节点的CPU运行信息获取所述故障节点的故障恢复信息; 命令下发单元,用于将所述故障节点的故障恢复信息通过板上管理控制器BMC的CPU传送给现场可编程门列阵FPGA,使所述FPGA将所述故障恢复信息转换为所述故障节点的CPU能够执行的指令并将所述指令通过XDP传送给所述故障节点的CPU。
7.ー种节点,其特征在于,所述节点包括现场可编程门阵列FPGA、调试接ロ XDP和中央处理器CPU,其中所述FPGA包括 接收模块,用于接收所述CPU通过所述XDP传送的CPU运行信息; 信息处理模块,用于将所述接ロ信息转换成设备管理系统DMS能够显示的信息,并将所述转换后的信息传送给板上管理控制器BMC的CPU,使所述BMC的CPU对所述转换后的信息进行封装并将所述封装后的信息传送给所述DMS。
8.根据权利要求7所述的节点,其特征在于,所述信息处理模块,包括 第一发送单元,用于向BMC的CPU发送中断请求信息,使所述BMC的CPU从所述FPGA中取出所述转换后的信息。
9.根据权利要求7或8所述的节点,其特征在于,所述信息处理模块还包括 接收单元,用于接收所述DMS通过所述BMC的CPU传送的所述节点的故障恢复信息; 转换单元,用于将所述故障恢复信息转换为所述CPU能够执行的指令; 第二发送单元,用于将所述指令通过所述XDP传送给所述节点的CPU。
10.一种信息处理的系统,其特征在于,所述系统包括如权利要求5-6任一项所述的设备管理系统DMS和如权利要求7-9任ー项所述的节点。
全文摘要
本发明公开了一种信息处理的方法、装置和系统,属于通信技术领域。所述方法包括当设备管理系统DMS管理的多个节点运行时,所述DMS获取所述每个节点的中央处理器CPU运行信息;当所述多个节点中出现故障节点时,所述DMS根据所述每个节点的CPU运行信息获知故障节点;所述DMS对所述故障节点进行调试。本发明通过在线获取各个节点CPU运行信息当系统中的节点出现故障时,能够及时根据各个节点的CPU运行信息,查找到故障节点,并在线对故障节点进行调试,不需要把故障节点单独拿下来进行调试,解决了现有技术中对故障节点调试耗时较长的问题。
文档编号G06F11/07GK102693166SQ20121014315
公开日2012年9月26日 申请日期2012年5月10日 优先权日2012年5月10日
发明者牛功彪, 贾群, 赵俊峰 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1