计算机装置和计算机装置的控制方法

文档序号:9240028阅读:709来源:国知局
计算机装置和计算机装置的控制方法
【技术领域】
[0001]本发明涉及这样的技术:向安装有OS (Operating System,操作系统)的计算机装置追加实现处置CPU (Central Processing Unit,中央处理单元)例外的异常处置功能(=RAS功能(RAS -Reliability Availability Serviceability ;可靠性、可用性、可服务性))的程序即RAS模块,而不用修改OS模块。
[0002]并且,本发明涉及这样的技术:向一并安装了 OS及Hypervisor (管理程序)的计算机装置追加RAS模块而不用修改OS和Hypervisor的模块。
[0003]另外,管理程序是实现计算机装置的虚拟化的软件。
[0004]管理程序是位于OS与计算机硬件之间、用于仿真计算机装置的动作的软件,在I个计算机装置上使多个OS同时动作,进行多个OS间的通信和资源共享的中介等。
[0005]并且,CPU例外是在CPU处于无法继续进行通常处理的状态的情况下(例如零除法运算等)的例外。
[0006]成为这样的构造:在CPU例外发生时,可以调用事先设定的别的程序。
[0007]另外,在本说明书中,将CPU例外和除了 CPU例外以外的中断这两者称为“中断”。
[0008]并且,将“中断”中的CPU例外以外的中断称为“标准中断”,与CPU例外分别开。
【背景技术】
[0009]在现有技术中,在OS (也可以是存在一个或多个)或管理程序(也可以是没有管理程序的结构)分别以独立的模块结构进行动作的计算机装置中,在实现与CPU例外对应的RAS功能的情况下,使用向OS或管理程序追加与CPU例外对应的处理等的方法来实现。
[0010]例如,在专利文献I中,公开了这样的结构:在VM监视器(相当于本说明书中的管理程序(Hypervisor))处设置有从故障信息存储区域取出在遭遇了本体系故障(相当于本说明书中的CPU例外)的虚拟计算机中处于执行状态的处理的故障信息的构件。
[0011]并且,例如,在专利文献2中,公开了这样的技术:在利用管理程序使多个OS进行动作的虚拟计算机中解决例外。
[0012]具体地,公开了这样的技术:将在例外发生时OS执行的处理部分的存储图像复制到管理程序侧,管理程序通过仿真在例外发生时OS执行的处理中的特权命令来解决例外。
[0013]现有技术文献
[0014]专利文献
[0015]专利文献1:日本特开平01 - 053238号公报
[0016]专利文献2:日本特开2006 - 155272号公报

【发明内容】

[0017]发明所要解决的课题
[0018]以往,在向OS (也可以是存在一个或多个)和管理程序(也可以不存在管理程序)由独立的模块构成的计算机系统中追加与该OS的例外处理对应的RAS功能的情况下,有必要对该OS、管理程序、CPU具有的中断检测机构施加修改和变更。
[0019]例如,在专利文献I和专利文献2的技术中,使管理程序侧预先具有与CPU例外对应的功能来实现RAS功能。
[0020]因此,存在的课题是,在难以对OS或管理程序的模块施加修改的情况下(也包含:技术上的难易度高而花费成本的情况,由于许可(license)而不能施加修改的情况、从品质保持的观点上不想进行修改的情况等),追加RAS功能是困难的。
[0021]本发明的主要目的是解决上述的课题。
[0022]也就是说,本发明的主要目的是,能够向计算机装置追加RAS模块而不对OS进行修改,适当地实现RAS功能。
[0023]用于解决课题的手段
[0024]本发明的计算机装置,具有:
[0025]CPU (Central Processing Unit,中央处理单元),其包含有检测中断的中断检测机构;和
[0026]OS (Operating System,操作系统),其包含有中断判定部,所述中断判定部在所述中断检测机构检测出中断时被所述中断检测机构调用,判定所述中断检测机构检测出的中断是否是CPU例外,
[0027]所述计算机装置的特征在于,
[0028]在向所述计算机装置追加了进行针对CPU例外的处理的程序即RAS(Reliability、Availability、Serviceability ;可靠性、可用性、可修性)模块的情况下,
[0029]所述CPU
[0030]在所述计算机装置起动时,调用所述RAS模块中包含的第I初始化进程,执行所述第I初始化进程,对所述RAS模块使用的资源进行初始化,
[0031]在所述RAS模块的所述第I初始化进程执行后,调用所述OS中包含的初始化进程,执行所述初始化进程,对所述OS使用的资源进行初始化,
[0032]在所述OS的所述初始化进程执行后,调用所述RAS模块中包含的第2初始化进程,执行所述第2初始化进程,将所述OS中包含的所述中断判定部复制到所述RAS模块,将所述中断检测机构设定成在所述中断检测机构检测出中断时调用复制到所述RAS模块的中断判定部而不是所述OS的中断判定部。
[0033]发明的效果
[0034]根据本发明,能够向计算机装置追加RAS模块,而不修改针对安装在计算机装置内的OS,并且,在CPU的中断检测机构检测出中断的情况下,合适地调用RAS模块,实现RAS功能。
【附图说明】
[0035]图1是示出实施方式I的计算机装置的结构例的图。
[0036]图2是示出实施方式I的计算机装置中的初始化处理的概要的流程图。
[0037]图3是示出实施方式I的RAS模块的第I初始化进程的详情的流程图。
[0038]图4是示出实施方式I的OS的初始化进程的详情的流程图。
[0039]图5是示出实施方式I的RAS模块的第2初始化进程的详情的流程图。
[0040]图6是示出实施方式I的计算机装置中的CPU例外发生时的动作例的图。
[0041]图7是示出实施方式I的计算机装置中的CPU例外发生时的动作例的图。
[0042]图8是示出实施方式2的计算机装置的结构例的图。
[0043]图9是示出实施方式2的计算机装置中的初始化处理的概要的流程图。
[0044]图10是示出实施方式2的RAS模块的第I初始化进程的详情的流程图。
[0045]图11是示出实施方式2的计算机装置中的CPU例外发生时的动作例的图。
[0046]图12是示出实施方式2的计算机装置中的CPU例外发生时的动作例的图。
[0047]图13是示出实施方式2的计算机装置中的CPU例外发生时的动作例的流程图。
[0048]图14是示出实施方式3的计算机装置中的中断发生时的动作例的图。
[0049]图15是示出实施方式3的计算机装置中的中断发生时的动作例的流程图。
[0050]图16是示出实施方式I的计算机装置的RAS模块追加前的结构例的图。
[0051]图17是示出实施方式2的计算机装置的RAS模块追加前的结构例的图。
【具体实施方式】
[0052]在以下的实施方式I?3中,说明I个或多个OS或管理程序进行动作的计算机装置。
[0053]更具体地,说明以下的计算机装置和计算机装置的控制方法:可以追加处置CPU例外的RAS模块,而不修改OS或管理程序的模块,并且,在发生CPU例外时,适当地调用RAS模块,通过RAS模块实施针对CPU例外的处理。
[0054]并且,在实施方式I?3中,说明这样的计算机装置:即使在与CPU例外的发生并发地OS或管理程序也发生了故障的情况下,也执行RAS功能。
[0055]在OS或管理程序本身构成为实现RAS功能的情况下,存在如下问题:当在CPU例外发生时并发了进行动作的OS或管理程序本身的故障时,无法执行RAS功能。
[0056]在实施方式I?3中,说明解决这样的问题的计算机装置。
[0057]并且,在实施方式I?3中,说明这样的RAS模块:在CPU例外发生时,通过判定哪个OS(或者管理程序)进行了动作,可以取得相应的OS(或者管理程序)的故障信息。
[0058]并且,说明这样的RAS模块:在发生标准中断而不是CPU例外的情况下,通过参照OS侧的中断判定部来调用对应的中断处理部,即使在OS侧变更了中断登记内容的情况下(也包含从计算机装置的起动到该中断发生时的期间动态变更了中断登记内容的情况),也能够正确调用中断处理部。
[0059]实施方式I
[0060][实施方式1:结构的说明]
[0061]图1是示出实施方式I的计算机装置(100)的结构例的框图。
[0062]计算机装置(100)的结构大致划分为硬件和软件。
[0063]在计算机装置(100)内,作为硬件存在CPU(1l)、存储器(103)、二次存储装置
(104)ο
[0064]CPU(1l)也可以是存在一个或多个的结构(多核、多CPU、多处理器等)。
[0065]在CPU(1l)内存在中断检测机构(102)。
[0066]中断检测机构(102)检测中断(CPU例外和标准中断)。
[0067]存储器(103)是RAM (Random Access Memory,随机存取存储器)。
[0068]并且,二次存储装置(104)例如是ROM (Read Only Memory,只读存储器),HDD (HardDisk Drive,硬盘驱动器)、SSD (Solid State Drive,固态驱动器)。
[0069]后述的软件被存储在二次存储装置(104)内,在执行时,从二次存储装置(104)被装入到存储器(103),依次从存储器(103)被读入到CPU(1l)而被执行。
[0070]并且,通过后述的软件执行所得到的信息、数据、变
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1