计算机系统的制作方法

文档序号:6415737阅读:153来源:国知局
专利名称:计算机系统的制作方法
计算机系统中,特别是诸如在通信技术交换系统的实时系统中,集成了合乎标准的软件维护机构,这些维护机构准备了抵销软件故障的措施。
这些措施是自动重新起动系统中的一部分或整个系统,此时数据,运行装置,运行系统资源和软件(SW)的编码部分自动分段复位和重新初始化。
自动重新起动措施一般是如下分段的1.用其本地数据的初始化重新起动单个SW过程或重新起动一组过程。
2.用全局数据的初始化重新起动一个处理器(在多处理器系统中)的所有过程。
3.同步化地起动一个处理器的所有SW-过程。
4.在系统范围用同步化的开始运行所有处理器来重新起动。
5.在系统范围用同步化的开始运行所有处理器来重新起动,并且装入数据和编码。
6.在系统范围用同步化的开始运行所有处理器来重新起动,与返回到上一个在整个系统内起动试验过的SW代(SW-Genaration)相结合。
在其中现在故障是这样抵销的,由数据的初始化和由各式各样的由从属数据的编码得出的程序状态所决定,纯粹统计地导致故障的那些系统配置(Systemkonstellation)(数据和编码),在中期(也就是说一直到在场内例如借助于在实验室完成的PATCH修正SW故障)是不能再调整的。
这种方法从原理上有一个决定性的缺点在重大故障时,始终出现导致系统范围起动阶段的一个扩展(重新起动的扩展),在其中原则上整个的SW被重新起动。也就是说有故障的SW和从前一样包括在系统中,并且还能够动态地起作用。如果涉及到一个硬的可再生的故障,则通过上述机构是不可以抵销该故障的。如果故障也已经存在于上一代的返回代(Rueckfallgeneration)中,则系统滚动并且由自身的力量不能重新回到工作状态。
本发明的任务是,避免或减小上述缺点。
此任务是由本发明解决的。
下面借助于附图详细地叙述本发明的一个实施例,其中包括2个附图。


图1表示,在西门子公司的电子数字交换系统EWSD上实现的起动系统。下面详细叙述通过统计故障评估自动驱动起动系统部件。
通过部件实施起动的措施可分为新起动NSTARTs和初始起动ISTARTs。在中央处理器上NSTARTs的作用是将所有SW过程或/SW过程组复位和新起动。这是在两个阶段(NSTARTO/1和NSTART3)中进行的,这两个阶段在数据初始化的深度上是有区别的(见下面)。初始起动是使整个系统复位并且新起动所有处理器。
一个部件或起动阶段NEUSTARTO(简称NSTARTO),用本地数据初始化新起动在协调处理器(CP)中的所有非技术交换过程。
一个部件或起动阶段NSTART1新起动在CP中的所有过程。
一个部件或起动阶段NSTART3,附加地将背景存储器中的半永久性的数据和编码补充装入,并且将瞬时数据在CP上初始化。
一个部件或起动阶段ISTART1,附加地将交换技术的外部设备复位和重新激活。
一个部件或起动阶段ISTART2(在当前的SW代中最有能力的起动阶段),附加地将CP中的工作存储器格式化,并且将数据补充装入交换技术的外部设备中。
直到目前为止始终是当前的系统代被加载。如果通过这个起动还不能抵销故障时,则返回到上一(编码)代。
一个部件ISTART2G替代当前的装入一个返回代,从而将新编码附加装入到交换技术的外部设备中。
现在有一个故障类别,这个故障类别通过这种扩大机制是不能抵销的如果有故障的SW不仅位于当前的,而且也位于SW返回代中,并且这个SW用在两代中不能区分的数据工作,则在每次新起动时重新诱发这个故障。例如在交换系统EWSD中的磁盘双故障(Plattendoppelfehler),HW-故障和硬的SW-故障。如果不是一个滚动起动时,在这些情况下至少到目前为止是返回到上一代。两者对经营商都有很大的负作用(在滚动起动时在紧张状态下不用标志排除干扰,在返回到上一SW代以后重新恢复具有数据库现实化的当前的SW版本)。
本发明中基本的思想是,在出现上述故障时重新回想起通信系统的重要方面交换计算机的原始功能是交换对话和传输数据。
在这个思路的基础上,引入自动重新起动阶段或重新起动措施,这些只新起动与交换技术有关的SW。从而使有故障的SW以比较大的或然率被选除。
详细的分析起动阶段的定义,系统在第一次初始启动以后(加速到正常运行)起动阶段是这样置入于扩展机制中的,在正常运行中当识别一个故障时,至少自动进行一个重新起动,这个重新起动首先尝试将计算机系统重新过渡到正常运行,并且只有当重新起动失败时(或者正常运行不能保持稳定)进行加速到按照本发明的运行情况,从这时起称为“交换技术基础运行”。从属的部件或起动阶段被称为ISTART1B。在这种起动时只起动对于交换技术有重要意义的SW功能。就是说系统没有过渡到正常运行状态,而是进入到一种减少了的功能性状态。
通过将这个起动阶段有目标地置入扩展机制中,也就是在顺序排列方面在起动阶段前面用存储器格式化,这种机制在系统中还提供了针对磁盘双损失的有效措施位于存储器中的SW仅新起动交换技术重要的部分,不必要补充装入磁盘上的SW和初始化数据。在这种情况下返回到新起动阶段,这个阶段不需要将当前数据用初始化数值加以标注。从属的部件或起动级称为NSTART1B。
附图2表示了将交换系统分为围绕一个核心的几个壳。
核心包括有基础输入/输出功能I/O,具有交换技术基础功能性VT的交换技术过程和具有重新起动系统REC的操作系统BS,重新起动系统借助于附图1已经详细地叙述过了。在围绕核心功能的第一个壳上有例如在维护中心内的警报或有用AMA(自动通知结算=单个付款证明)的结算。在第二个壳上安排了虽然是负责交换技术专用的特殊任务的功能,但是这些功能对于经营商或最终用户不受很大限制地就可以去掉(例如操作机服务功能和查账)。
在第一次尝试中将核心和两个壳激活。在扩展监控中统计地重新出现一个故障,则在每次去掉最外壳情况下重复起动。如果还不能工作,则故障存在于核心功能内。然后必须在扩展中进行下一个步骤。分步地返回到不同壳上是每次通过一个新起动ISTART1B进行的,待激活的过程数量每次进一步减少。
因为在交换系统EWSD中涉及到多处理器系统,上述的重新起动措施不仅是处理器专用的而且在系统范围也是可实施的。
其它与上述重新起动措施关系重大的重要功能是警报,标志安全保证,排除干扰和恢复到正常运行。
·警报使经营商有可能识别和分析处理限定的系统功能性,也就是说交换技术的基础运行。
·标志安全保证(Indiziensicherung)为排除干扰准备了重要的信息(例如基础运行状态说明,关于引起SW故障的信息,经过外部设备的起动平衡(Hochlaufbilanzierung)等)。这些信息不仅在本地的操作机(在规避标准输出路径情况下)而且还在维护中心被给出。同样在状态“交换技术的基础运行”期间,子系统脱落将借助于标志安全保证予以输出。
·排除干扰使机构可提供使用,这些机构一方面允许分析故障情况(在运行的/工作的系统上)。另一方面它提供给经营商修正系统中SW故障的功能性(正常运行标准),一旦经营商要求时,这自动地在背景中准备好。也就是说SW故障可以在系统运行时在减少的功能性情况下被修正。在排除干扰开始时,在基础运行中所激活的SW状态是′冻结的′。也就是说在排除干扰时出现其它的故障,则用一个新起动(ISTART1B或NSTART1B)重新恢复开始排除干扰前的调整状态,因为新出现的具有高或然率的SW故障归结于排除干扰措施。
·最后存在重新建立正常运行的一种恢复。这一般是一开始叙述的标准的可提供的起动措施之一,为了这个目的该措施必须是手动可释放的。
下面详细叙述本发明对经营商及其客户的优点。
现在很典型的可以大约有50%到80%的SW在控制计算机上被去掉,对交换系统相对于最终用户的业务没有重要的限制。从而通过标准措施不能测得的所有的SW故障大约也有50%到80%被抵销,在这个起动阶段从属的SW不再被激活。上述关系在将来还会改善,因为当交换系统进一步成熟和精密时,在不呼叫过程SW部分比呼叫过程SW部分增加得快。
应注意的另一点故障或然率在SW中不是平均分布的。如果将SW提供给客户时,大约20%交换技术的重要的SW是会非常快地无故障的,因为这部分将用各种交换装置运行,并且只需掌握很少特殊情况。其余的80%很少进入运行必须明确掌握的复杂故障情况(例如处理在系统中的多次故障),和因此还包括剩余故障的一个比较高的比例。
系统可供使用性随着引入在EWSD中的这个性能明显地得到改善。整个系统停机时间,也就是说系统不能提供使用的时间,没有交换技术基础运行大约高于50%。没有交换技术基础运行具体的TSDT目前为1.5分/VST/年,具有交换基础运行为小于1分/VST/年。
对于经营商的一个另外的好处是,避免了返回到老一代的SW。从而排除了非常复杂的费时间的滚动前进(Ro1l Forward)到当前的一代。同时从而排除了经营商由于滚动前进引起的费用损失。
避免了滚动恢复,也就是说交换系统给电话客户提供标准业务(打电话,紧急呼叫和可提供的服务!)。
排除故障在时间上不再是关键性的。排除故障可以在制造商(开发专业人员)的支持下在正常的工作时间进行。在这方面有例子,如果必须在星期天调整交换技术基础运行时,然而在星期一才进行排除故障。
权利要求
1.计算机系统,其特征为,一个重新起动部件(ISTART1B,NSTART1B)只新起动那些允许具有减少了的功能性的计算机系统继续运行的软件。
2.计算机系统,具有一个重新起动机构,这个机构在正常运行出现一个故障时首先至少尝试一次,将计算机系统重新过渡到正常运行,并且如果这个失败时或正常运行不能保持稳定时,则要进行一个重新起动措施,这个重新起动措施只新起动计算机系统的那些允许具有减少了的功能性的计算机系统系统继续运行的软件。
3.按照权利要求1或2之一的计算机系统,其特征为,当计算机系统涉及到多处理器系统时,在其中上述重新起动措施可以对处理器单个地进行。
4.按照权利要求1至3之一的计算机系统,其特征为,计算机系统涉及的是交换系统,系统基础运行的软件功能是涉及到交换技术的基础功能。
5.计算机系统,a)分为围绕一个核心的几个壳,在其中a1)核心包括计算机系统的硬件以及对系统的基础运行所要求的软件功能,a2)围绕核心至少安排了一个另外的壳,这个壳包括有对于系统扩展运行所需要的另外的软件功能,b)包括控制重新起动的重新起动机构,在其中这个机构首先至少尝试一次,将核心和所有的壳激活,并且如果此时重新出现一个故障,则在每次去掉一个最外壳情况下重复起动或重复激活尝试。
6.重新起动一个计算机系统的方法,按照这种方法只新起动那些允许具有减少了的功能性(基础运行)的系统继续运行的软件。
7.在减少了的或被限定的功能性状态下排除干扰的方法,按照这种方法在排除干扰开始时调整的SW环境被冻结,并且在其它一些干扰时这个SW环境准确地重新被激活。
8.按照权利要求7的方法,其特征为,对于排除干扰所必要的SW功能(与正常运行时完全一样的功能)自动地在系统中被激活,不需要经营商采取特殊措施,而且只有在排除干扰措施的时间点上,并且不是已经在起动到交换技术基础运行时。
9.按照权利要求6或7的方法,其特征为,当减少了的功能性的运行继续时和在排除干扰时没有费用的损失。
全文摘要
在交换系统中为了抵销软件故障使用了自动重新起动系统的一部分或整个系统。在一个硬的可重复出现的故障时,不能通过上述机构抵销故障。本发明解决这个问题是通过一个重新起动机构,这个重新起动机构只新起动那些允许具有减少了的功能性的计算机系统继续运行的软件。
文档编号G06F11/14GK1265205SQ98807558
公开日2000年8月30日 申请日期1998年7月21日 优先权日1997年7月23日
发明者H·埃格尔斯, R·施拉格, W·保尔, M·施梅尔兹, J·尼森 申请人:西门子公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1