用于处理网络管理系统中的故障信息的方法和系统的制作方法

文档序号:6511700阅读:189来源:国知局
专利名称:用于处理网络管理系统中的故障信息的方法和系统的制作方法
技术领域
本发明涉及一种方法,其中网络管理系统(NMS)处理由高容量网络设备产生的故障信息,如大量告警或事件等,并实时地向客户端转发处理过的故障信息,更具体地,涉及一种故障信息处理方法和系统,用于使用数据库表建模更快速和有效地处理告警,以改善在应用中将数据存储在告警数据库中的延迟,这种延迟是处理告警和事件中最严重的问题。
背景技术
通常,网络管理系统用于管理多个系统与之相连的网络。因此,网络管理系统直接和间接与构成了网络的每个系统相连,并接收每个系统的状态信息,以管理该系统。此外,可以在与网络管理系统相连的每个操作员的计算机上确认此状态信息。
与网络管理系统相连的系统包括交换系统、传输系统等。网络管理系统与交换系统和传输系统相连,以便从每个系统收集故障数据和维护数据,以作为数据库对数据进行管理。
在以往的技术中,按照同步的方式实时处理故障数据。术语‘同步’表示如下方式当产生表示告警或事件的软中断(trap)时,故障管理模块接收软中断,按照可存储的格式处理数据,然后,将处理过的数据共同存储在系统内的数据库表中。
即,同步方式表示顺序执行从接收软中断的步骤开始到作为最后步骤的将所述软中断存储在数据库表中的步骤的各个步骤,即并不按照单独的处理来执行各个步骤。
图1是示出了根据以往的技术的同步告警和事件处理系统的示意图。网络管理系统100总是监控通信网络的状态,以便将网络维护在最佳状态下,收集并累积网络的状态、故障、业务数据等,并存储网络中所产生的多个故障信息,并将所需的故障信息提供给客户端170,所述客户端170是与网络管理系统100交互工作的多个故障管理计算机。
即,当网络中所产生的故障信息或软中断到达网络管理系统100时,网络管理系统100将软中断存储在数据库表中,并进行管理,以便响应来自客户端170的请求,提供适当的信息。
如图所示,根据以往技术的网络管理系统100包括故障管理模块110,用于将从外部系统接收到的故障信息存储在数据库表中;监听端口监视模块120,用于执行针对监听器的额外任务;监听表130,用于临时存储从外部接收到的软中断;告警表140和事件表150,用于从监听表130接收并存储与告警或事件有关的数据;以及客户端列表160,用于管理单独的客户端170,并存储客户端的列表。
根据以往的技术,网络管理系统100将从外部接收到的软中断存储在监听表130中,可以将监听表130理解为临时存储空间,然后,利用接收到的软中断更新告警表140和事件表150。
即,在以往的技术中,在由于网络故障的产生而接收到软中断时,由网络管理系统100中的故障管理模块110更新告警表140和事件表150中的故障产生历史。这种更新与将接收到的软中断存储在监听表130中的处理一起执行。
为此,监听数据库具有监听表,作为针对单独客户端170的故障信息识别空间。客户端170可以从分配给该客户端的监听表中读取故障信息,并识别故障产生,所述故障产生由作为客户端170 PC中所驱动的应用程序的故障管理器来识别。
即,如果客户端运行故障管理器以处理实时事件,将表格分配给该故障管理器,其是由服务器创建的数据库中的监听器。将按照已驱动故障管理器的数目来创建监听表。这样做的目的在于转发由每个故障管理器执行的不相关任务的结果。
在根据以往技术的故障管理器中,故障管理模块110由软中断接收端口监视器构成,用于在存储数据时执行除了存储纯软中断信息以外的几项额外任务。典型地,端口监视器是连续运行并为了处理计算机系统期望接收到的周期性服务器请求的目的而存在的程序。端口监听程序用于执行与系统操作有关的任务,同时在后台状态下进行操作,以及正确地转发要由其他程序或处理进行处理的收集请求。
因此,作为故障管理端口监视应用程序的软中断接收端口监视器保持在后台状态下,并自动开始操作,并在产生要处理的任务的条件下,执行所需的任务。例如,当接收到释放告警时,作为软中断接收端口监视器的故障管理模块110利用如位置、时间等告警产生信息,在现有的已产生和已存储告警中找出相应的告警,并写入告警释放,或执行告警总结任务,用于指示上层网络图上的代表告警。
在根据以往技术的同步软中断处理结构中,在产生每个软中断时,都执行这种额外的功能。即,各个客户端170利用轮询方法,接收如上述进行处理的软中断,并在屏幕上显示该信息。
轮询的意思是客户端周期性地查询数据库中的监听表130,以确定是否有新到的告警信息存在,然后取出该数据。
告警表140存储并管理网络中所产生的全部告警数据,以及事件表150存储网络中所产生的除告警之外的全部事件。
监听表130是临时存储设备中所产生的全部软中断(例如,告警或事件)从而使客户端170能够轮询所述软中断的表。监听表130用于向客户端170转发轮询方式的实时软中断。为此,监听表130临时存储所有产生的软中断,并且每个客户端170通过周期性地轮询监听表130来接收软中断信息。
监听端口监视(LD)模块120利用最后读取的告警序列号,周期性地删除已经由所有客户端170读取出的监听表130中的软中断信息,同时对已经请求轮询的所有客户端的列表进行管理。
此时,最后读取的告警序列号表示由客户端进行周期性告警轮询时最后读取的告警的序列号,并被称为最后序列(last_seq)。换句话说,在解析告警的同时,将序列号赋予每个新转发的告警。此号码是递增自然数,并将如1、2、3、4、5、6、…等序列号应用于已转发告警。
例如,如果一个客户端轮询新到达监听表130的十个告警1、2、3、4、5、6、7、8、9和10,则最后序列(last_seq)为10。
在传统的同步告警处理方法中,在最后存储每个已产生的告警信息之前,需要执行特定的相关任务,以便实时地转发告警信息。例如,直到执行该任务为止,每个客户端170都不能对告警进行轮询,例如,所述任务为释放告警、处理代表告警或针对按照交迭的方式产生的告警递增告警计数等。
为此,软中断接收端口监视器110执行单一的提交(commit),用于将告警存储在表格130、140和150中。各个客户端170不能对告警进行轮询,直到执行了单一的提交为止。提交表示在成功完成了事务时所执行的对数据库的更新。
同时,由SQL删除语句,只针对由全部客户端170读取的告警,周期性地删除存储在表格130、140和150中的软中断信息。这极大地减少了每秒所能处理的告警数,这是因为在处理中的额外任务阻塞了实时告警,而花费了大量的时间。
网络规模和管理范围的几何级数扩大需要能够管理更高容量网络的网络管理系统(NMS)。作为使高容量处理成为可能的NMS功能之一的告警管理器必须能够处理比目前针对小系统而开发的传统结构中所能处理的软中断数(例如,20到30个TPS)多得多的软中断(例如,最小值为200个TPS)。
如上所述,在以往的技术中,在由于所产生的网络故障接收到软中断时,由作为软中断接收端口监视器的故障管理模块110对告警表140和事件表150中的故障产生历史进行更新,并且与将接收到的软中断存储在监听表130中的处理一起进行更新。
此外,在以往的技术中,在产生单独的告警或事件时,独立地执行由故障管理模块110在接收到软中断时所执行的上述处理。即,在以往的技术中,存在由于在产生一个告警时所重复的处理而延迟软中断处理时间的问题。

发明内容
因此,本发明的一个目的是提出一种用于在NMS中处理故障信息的方法和系统,允许使用异步方式和块提交方式周期性地实时处理故障信息和共同处理大量软中断,以便向具有增加高容量的网络系统中的操作员快速地转发多个告警和事件信息,而这是现有的同步方式不能实现的。
本发明的另一目的是提出一种在监听表中对软中断的临时存储,由故障管理模块或其他耗时的额外功能简单地执行,通过监听端口监视模块采用异步事务处理方式来执行,以便更快地处理大量的告警和事件信息,而这是现有的同步方式无法实现的,从而实现多个软中断的实时处理。
本发明的另一目的是提出一种用于处理故障信息的方法和系统,其易于且廉价地实施,并具有更高的效率。
为了实现上述和其他目的,本发明基于一种具有以下单独模块的网络管理系统。即,根据本发明的网络管理系统包括告警表,用于存储和管理告警;事件表,用于存储和管理类似事件的信息;监听表,即临时软中断存储数据库,用于客户端告警管理器的轮询;客户端列表,用于管理相连客户端的列表;故障管理模块,用于将从外部系统接收到的故障信息存储在所述监听表中;以及监听端口监视(LD)模块,用于按照异步方式只存储和转发与实时告警本身有关的信息,并在告警产生时允许作为后台任务执行额外的任务,以增强实时告警处理速度。
根据本发明,如果从网络产生告警或事件,则向作为网络管理系统中的故障管理模块的软中断接收端口监视模块转发该告警和事件。所述软中断接收端口监视模块对所产生的软中断进行处理,并将其存储在数据库中。
本发明的特征在于,通过改善针对现有告警处理而设计的数据库表建模和应用异步告警转发方式来增强实时告警处理速度。


通过当结合其中以相似的参考符号表示相同或相似的组件的附图考虑时参考以下详细描述,本发明更全面的评价及其多个附带优点将显而易见,并得到更好的理解,其中图1是示出了根据以往技术的同步告警和事件处理系统的示意图;图2是示出了根据本发明的异步告警和事件处理系统的示意图;以及图3是示出了根据本发明的异步故障产生信息处理过程的示意图。
具体实施例方式
此后,将参照附图,对本发明的优选实施例进行详细地描述。如果在以下对本发明的描述中,认为对公知的相关功能或结构的详细讨论将给本发明的主题带来不必要的模糊,将省略对其的描述。下述术语是考虑到其在本发明中的功能而定义的术语。该定义应当被理解为基于这里所描述的内容,由于其可能会根据用户的意愿、实践等发生变化。
图2是示出了根据本发明的异步告警和事件处理系统的示意图。如图所示,本发明包括故障管理模块210,用于将从外部系统接收到的故障信息存储在监听表230中,所述监听表230是用于客户端告警管理器轮询的临时软中断存储数据库;告警表240,用于存储和管理告警;事件表250,用于存储和管理类似事件的信息;客户端列表260,用于管理相连客户端的列表;以及监听端口监视模块220,用于通过在产生告警的同时,实时地向告警表和事件表共同发送故障信息,来按照异步方式执行历史管理。
作为故障管理模块210的软中断接收端口监视器是设备中所产生的告警首先到达的单元。软中断接收端口监视器的最大作用是将告警数据解析为可存储在数据库中的格式。端口监视器还周期性地执行块提交,并将数据包存储在监听表230中。
此时,解析表示将系统中所产生的告警数据处理为可存储在数据库中的格式。此外,提交是类似于插入的概念,其中插入表示将数据放入表格中,而非存储。提交表示最后存储数据,其中直到执行了提交时才存储数据。
同时,按照每次通过上述插入写入数据时执行最终存储的方式,每次执行对盘的写任务,花费了大量的时间。因此,本发明的特征在于通过一次共同存储数据包的块提交来执行数据存储。
监听端口监视模块220是服务器中执行监听表230的几个额外功能并执行根据本发明的异步告警信息处理的程序。与以往技术中的同步方式不同,异步告警信息处理方式包括故障管理模块210收集故障信息并将其存储在监听表中的处理、以及通过单独执行的监听端口监视模块220更新告警表240和事件表250中的故障信息的处理。这用于避免在依赖于传统的同步方式时所遇到的延迟处理时间。
此监听端口监视模块220适合于通过执行以逐个分区为基础的块提交和周期性数据删除来提高告警信息处理速度,这些是本发明的特征。
如前所述,监听表230是出现在数据库中的表格,其中可以将该表理解为用于存储数据的特定空间。监听表230是本发明所定义的术语,其表示所有客户端观察监听表230以确定告警信息是否到达。即,如果产生了告警,其将被立即存储在监听表230中,并且所有客户端将读取监听表230,并取出所需的告警信息。
告警表240和事件表250接收并最终存储与来自监听表230的告警或事件有关的数据。
在操作中,向每个客户端270赋予其惟一的标识符(ID)号码以区分各个客户端270,并且标识符(ID)号码由数据库所给出的序列号(如1、2、3、…等)组成。
按照如前所述赋予的标识符(ID)号码,对客户端270进行管理。存储和管理这样驱动的客户端270的表格是数据库中的客户端列表260。
图3是示出了根据本发明的异步故障产生信息处理过程的示意图。
如上所述,本发明的特征在于当从网络产生软中断时,作为故障管理模块210的软中断接收端口监视器将到达的软中断存储在监听表230即数据库中;以及监听端口监视模块220以逐个分区为基础周期性地执行对软中断的块提交和数据删除,作为存储所述软中断之后的单独进程。
此时,客户端270将能够通过监听表230中的周期性软中断轮询来识别网络故障产生。
将更为详细地讨论该过程。首先,如果网络中所产生的软中断到达故障管理模块210,则故障管理模块210将到达的软中断数据解析为可存储格式,然后将其临时存储在监听表230中(10)。
如前所述,解析表示将系统中所产生的告警数据处理成可存储在数据库中的格式,通常指分析输入语句中的单词的功能在语法上是否正确。
当软中断到达时,针对故障管理模块210,驱动作为故障管理模块210中的额外程序线程的定时器,以周期性地执行块提交(例如,每一秒)(20)。
块提交表示一次共同存储数据包,并用于避免由于接收到的软中断数据的单独存储而引起的处理速度退化。
监听端口监视模块220是服务器中以逐个分区为基础周期性地执行块提交和数据删除的程序,这是本发明的特征。监听端口监视模块220从监听表230中周期性地取出跟随在最后序列(last_seq)之后的全部软中断信息(30)。如前所述,最后序列(last_seq)表示在客户端周期性地进行告警轮询时所读取出的最后一个告警的序列号。
周期性地取出跟随在最后序列(last_seq)之后的全部软中断表示周期性地检索(轮询)监听表230,以取出新到达的告警。最后序列(last_seq)用于区分新到达的告警。
监听端口监视模块220能够只取出大于先前已经正确读取出的最后告警序列号的号码。例如,假设告警序列号(alarm seq_no)如1、2、3、4、5、6、7、8、9、10、11和12目前出现在监听表230中。此时,如果在前一轮询时最后号码为10,只需在新轮询时,取出具有大于10的告警号码的数据,从而只取出11、12和13。
监听端口监视模块220将已经如上所述从监听表230中取出的软中断信息存储在告警表240和事件表250中(40)。当其为告警时,监听端口监视模块220将从监听表230中取出的软中断信息存储在告警表240中,并在产生故障释放等时,将软中断信息记录在告警表240中。此外,当产生交迭告警时,监听端口监视模块220相应地执行产生计数递增。
告警表240由表示特定告警的产生或非产生、产生次数等的表格构成。在单独产生故障时,将产生释放或非产生释放和交迭产生或非交迭产生记录在告警表中,并对故障产生信息进行更新。
因此,监听端口监视模块220将通过根据产生释放或非产生释放和交迭产生或非交迭产生更新写入告警表240中的故障产生信息,来进行针对故障产生的历史管理。
与由故障管理模块210执行的将故障产生信息存储在监听表230中分离地执行由监听端口监视模块220执行的这种历史管理。即,在以往的技术中,由故障管理模块210顺序执行故障产生信息的存储和历史管理,将引起历史管理的时间延迟。
本发明通过监听端口监视模块220执行历史管理,与由故障管理模块210执行的故障产生信息的存储相分离,并将已更新故障产生信息存储在告警表和事件表中。此时,也通过周期性的块提交来执行对已更新故障产生信息的存储,伴随下述代表告警处理。
即,监听端口监视模块220与对从监听表210中取出的软中断的历史管理一起,处理代表告警。代表告警的处理表示从大量产生的告警中计算代表告警信息的任务。在本发明中,通过检查从监听表210中取出的告警来选择代表告警信息,并通常通过具有最高告警类的告警来确定。
即,监听端口监视模块220选择具有最严重故障程度的告警,并将其作为代表告警进行处理。此代表告警处理使根据块提交的共同代表告警选择成为可能。
即,在将从监听表230中取出的软中断信息存储在告警表240和事件表250中时,监听端口监视模块220执行其中对数据进行打包并共同处理的块提交,在该处理中,选择显示出最高故障程度的数据包中的类。因此,根据所选择的类,执行共同代表告警选择(50)。
监听端口监视模块220的最重要的功能包括周期性的数据分区删除。存储在监听表230中的告警信息用于客户端270的轮询。应当周期性地删除已经进行了轮询的信息。因此,因为周期性地删除已存储的信息,监听表230中的存储可以被理解为临时存储。
本发明的特征在于在删除旧数据,即已经被读取的数据时,在存储在监听表230中的告警信息中,以逐个分区为基础,删除已存储的数据,而不必逐一找出和删除旧数据。
此时,以十分钟的时间间隔创建分区,并将包含在这十分钟内的告警全部存储在相同的分区中。如果时间已经过去,则删除该分区,即十分钟单位的旧分区,从而一次删除包含在该分区中的数据。
这用于增强在如上所述逐一找出并删除旧数据时所引起的处理速度延迟,并且根据以逐个分区为基础的共同删除,对处理速度的极大提升成为可能(60)。
此外,监听端口监视模块220从客户端列表260中周期性地删除异常终止的客户端的列表。如果正常终止了告警管理器,每个客户端270将不再执行轮询,并从客户端列表中删除其信息。
但是,由于在异常终止告警管理器时不能执行此处理,监听端口监视模块220监视异常终止,并在进行异常终止时,执行强制例程。
即,监听端口监视模块220监视客户端列表260,并将监视时间与客户端270的最后轮询时间进行比较,以确定是否进行了异常终止。如果确定为异常终止,监听端口监视模块220从客户端列表260中删除异常终止的客户端的列表(70)。
客户端270通过与网络管理系统200相连并收集所需的网络故障信息来执行直接网络管理,不同于前述网络管理系统200中的程序模块210到260。
为此,客户端270首先运行故障管理器,所述故障管理器为在客户端PC(个人计算机)中驱动的应用程序,然后将运行事实登记在客户端列表260中,并接收所分配的惟一号码(80)。
即,在最初运行中,客户端270写入其运行时间信息,并接收作为所述客户端的标识符的已分配客户端标识符(client_id),以便将该标识符登记在客户端列表260上。
在将标识符登记在客户端列表260上之后,客户端询问新告警数据是否出现。即,客户端270执行轮询,以确定在监听表230中是否存在新到达的告警信息,并检查是否存在大于最后序列(last_seq)号的号码(如上所述),以确认新告警数据是否到达(90)。换句话说,客户端270将从客户端列表260中读取已经被客户端轮询过的最后序列(last_seq),并将轮询出现在监听表230中的告警序列号(Alarmseq_no)中、具有大于最后序列(last_seq)号的数值的告警。在已经进行了轮询之后,客户端270将作为客户端执行轮询的时间的轮询终止时间和最后读取出的软中断的序列号(last_seq)存储在客户端列表260中。根据所设置的周期,重复执行此轮询任务。当正常终止故障管理器并因此终止连接时,客户端270执行从客户端列表260中删除其信息的任务。
根据上述本发明,能够处理在系统故障和不稳定时所引起的大量软中断拥塞,并使软中断处理期间的损失最小。此外,大量实时软中断(例如200或更多个TPS)的处理和存储成为可能,其在高容量集成网络管理中是必需的,从而与传统的每秒大约20到30个软中断处理相比,实现了每秒200或更多个软中断处理。
可以将本发明实现为计算机可读介质中的计算机可执行指令。计算机可读介质包括其中存储或包括计算机可读数据、或者可以包括能够由计算机或处理单元读取的任何类型的数据的所有种类的介质。例如,计算机可读介质包括但不限于存储介质,如磁存储介质(例如ROM、软盘、硬盘等);光读取介质(例如CD-ROM(只读光盘)、DVD(数字通用盘)、光盘的可重写版本等);混合磁光盘;有机盘;系统存储器(只读存储器、随机存取存储器);非易失性存储器,如闪速存储器等;或任何其他易失性或非易失性存储器;其他半导体介质;电介质;电磁介质;红外线或其他通信介质,如载波等(例如,通过因特网或其他计算机的传输)。通信介质通常具体实现为计算机可读指令、数据结构、程序模块或调制信号中的其他数据,如载波或其他包括任何信息传递媒介的可传送机制。如通信介质等计算机可读介质可以包括如射频、红外微波等无线介质和如有线网络等有线介质。而且,计算机可读介质可以存储和执行分布在通过网络相连的计算机中的计算机可读代码。计算机可读介质还包括在处理系统中或分布在可以是本地或远程处理系统的多处理系统中的协作或互连计算机可读介质。本发明还包括其上存储有数据结构的计算机可读介质,所述数据结构包括多个包含表示本发明的技术的数据的字段。
尽管已经结合附图对本发明的技术要旨进行了描述,其用于描述本发明的优选实施例而非限制本发明。此外,应当清楚的是,在不偏离本发明的精神和范围的前提下,本领域的普通技术人员可以对本发明进行多种改变和限制。
利用本发明,由故障管理模块简单地执行软中断在监听表中的临时存储,并通过监听端口监视模块采用异步事务处理方式来执行其他耗时的额外功能,以便更为快速地处理大量告警和事件信息,这在现有同步方式中是不能实现的,从而实现多个软中断的实时处理。
权利要求
1.一种处理网络管理系统中的故障信息的方法,所述方法包括第一步骤,由故障管理模块收集故障产生信息,并将其存储在监听表中;第二步骤,由监听端口监视模块以逐个分区为基础,周期性地删除所述监听表中的故障产生信息;以及第三步骤,由监听端口监视模块更新告警表和事件表中的故障产生信息,并处理代表告警。
2.根据权利要求1所述的方法,其特征在于在所述第一步骤中,所述故障管理模块解析并存储所收集到的故障产生信息。
3.根据权利要求1所述的方法,其特征在于在所述第一步骤中,所述故障管理模块通过周期性地执行块提交,将所收集到的故障产生信息存储在所述监听表中。
4.根据权利要求1所述的方法,其特征在于以特定的时间为基础形成所述第二步骤中的故障产生信息分区。
5.根据权利要求1所述的方法,其特征在于所述第二步骤中以逐个分区为基础删除所述故障产生信息表示周期性地删除旧数据分区。
6.根据权利要求1所述的方法,其特征在于所述第三步骤中,由监听端口监视模块对故障产生信息的所述存储以更新所述告警表和所述事件表中的故障产生信息是通过块提交来执行的。
7.根据权利要求1所述的方法,其特征在于所述第三步骤从针对用于更新故障产生信息的块提交的数据包中选择代表告警。
8.一种用于增强故障信息处理速度的网络管理系统,包括故障管理模块,用于收集来自网络的故障产生信息;监听表,用于存储从所述故障管理模块周期性地发送过来的故障产生信息;以及监听端口监视模块,用于以逐个分区为基础删除所述监听表中的故障产生信息,更新告警表和事件表中的故障产生信息,以及选择代表告警。
9.根据权利要求8所述的系统,其特征在于所述故障管理模块解析并存储所收集到的故障产生信息。
10.根据权利要求8所述的系统,其特征在于所述故障管理模块通过周期性地执行块提交,将所收集到的故障产生信息存储在所述监听表中。
11.根据权利要求8所述的系统,其特征在于所述监听表以特定的时间为基础形成分区。
12.根据权利要求8所述的系统,其特征在于所述监听端口监视模块执行块提交以更新所述告警表和所述事件表中的故障产生信息。
13.根据权利要求8所述的系统,其特征在于所述监听端口监视模块从针对用于更新故障产生信息的块提交的数据包中选择代表告警。
14.根据权利要求8所述的系统,其特征在于所述监听端口监视模块周期性地删除旧数据分区,从而以逐个分区为基础删除故障产生信息。
15.一种处理网络管理系统中的故障信息的方法,所述方法包括当网络中所产生的软中断到达故障管理模块时,由所述故障管理模块将到达的软中断数据解析为可存储格式,然后临时存储在监听表中;当软中断到达时,驱动所述故障管理模块的定时器,以周期性地执行块提交;由监听端口监视模块从所述监听表中周期性地取出跟随最后序列的全部软中断信息;由所述监听端口监视模块将从所述监听表中取出的软中断信息存储在告警表和事件表中;由所述监听端口监视模块根据所选择的类执行共同代表告警选择;通过由所述监听端口监视模块周期性地删除旧数据分区,以逐个分区为基础周期性地删除所述监听表中的故障产生信息,存储在所述监听表中的告警信息用于通过客户端进行轮询,并周期性地删除已经进行了轮询的信息,以及利用周期性的删除,所述监听表中的存储为临时存储;以及由所述监听端口监视模块监视所述客户端列表,并将监视时间与客户端的最后轮询时间进行比较,以确定是否进行了异常终止,当确定存在异常终止时,则由所述监听端口监视模块从所述客户端列表中删除异常终止的客户端的列表。
16.根据权利要求15所述的方法,其特征在于还包括由客户端运行所述故障管理器,然后通过最初运行,将客户端的标识符登记在所述客户端列表上,客户端写入其运行时间信息,并接收客户端标识符的已分配标识符。
17.根据权利要求16所述的方法,其特征在于还包括在将标识符登记在所述客户端列表上之后,由客户端查询新告警数据是否存在,并且客户端执行轮询,以确认所述监听表中是否存在新到达的告警信息,并检查是否存在大于最后序列号的号码,以确认新告警数据是否到达。
18.根据权利要求17所述的方法,其特征在于还包括通过周期性地轮询所述监听表,周期性地取出跟随最后序列的全部软中断,以取出新到达的告警,其中最后序列用于区分新到达的告警,并且最后序列是在客户端周期性地执行告警轮询时所读取的最后一个告警的序列号。
19.根据权利要求17所述的方法,其特征在于当其为告警时,所述监听端口监视模块将从所述监听表中取出的软中断信息存储在所述告警表中,并在产生故障释放时,将软中断信息记录在所述告警表中。
20.根据权利要求19所述的方法,其特征在于当产生交迭告警时,监听端口监视模块相应地执行产生计数递增。
21.根据权利要求17所述的方法,其特征在于所述告警表由表示特定告警的产生或非产生、产生次数的表格构成,当单独产生故障时,将产生释放或非产生释放和交迭产生和非交迭产生记录在所述告警表中,并更新故障产生信息。
22.根据权利要求17所述的方法,其特征在于在将从所述监听表中取出的软中断信息存储在所述告警表和所述事件表中时,所述监听端口监视模块执行其中对数据进行打包并共同处理的块提交,其中,选择显示出最高故障程度的数据包中的类。
23.根据权利要求17所述的方法,其特征在于还包括在删除包括已经被读取的数据的旧数据时,在存储在所述监听表中的告警信息中,以逐个分区为基础删除已存储数据群,而无需逐一地找出和删除旧数据,此时,以特定的时间间隔创建分区,并将包含在特定时间间隔中的告警全部存储在相同的分区中,当时间过去时,删除特定时间间隔单位的旧分区,其中一次删除包含在分区中的数据。
24.根据权利要求17所述的方法,其特征在于所述监听端口监视模块从所述客户端列表中周期性地删除异常终止的客户端的列表,当正常终止所述告警管理器时,每个客户端不再执行轮询并从所述客户端列表中删除其信息。
25.根据权利要求17所述的方法,其特征在于所述客户端通过与网络管理系统相连并收集所需的网络故障信息来执行直接网络管理。
26.一种用于增强故障信息处理速度的网络管理系统,包括故障管理模块,当网络中所产生的软中断到达所述故障管理模块时,将到达的软中断数据解析为可存储格式,然后临时存储在所述监听表中,当软中断到达时,驱动所述故障管理模块的定时器,以周期性地执行块提交;以及存储器,包括监听端口监视模块,用于从所述监听表中周期性地取出跟随最后序列的全部软中断信息,所述监听端口监视模块将从所述监听表中取出的软中断信息存储在所述告警表和所述事件表中,所述监听端口监视模块根据所选择的类执行共同代表告警选择,通过周期性地删除旧数据分区,所述监听端口监视模块以逐个分区为基础周期性地删除故障产生信息,存储在所述监听表中的告警信息用于通过客户端进行轮询,并周期性地删除已经进行了轮询的信息,以及利用周期性的删除,所述监听表中的存储为临时存储,所述监听端口监视模块监视所述客户端列表,并将监视时间与客户端的最后轮询时间进行比较,以确定是否进行了异常终止,当确定存在异常终止时,则由所述监听端口监视模块从所述客户端列表中删除异常终止的客户端的列表,客户端将客户端的标识符登记在所述客户端列表上,客户端写入其运行时间信息,并接收客户端标识符的已分配标识符,在将标识符登记在所述客户端列表上之后,由客户端查询新告警数据是否存在,并且客户端执行轮询,以确认所述监听表中是否存在新到达的告警信息,并检查是否存在大于最后序列号的号码,以确认新告警数据是否到达。
27.一种计算机可读介质,具有用于执行处理网络管理系统中的故障信息的方法的计算机可执行指令,包括当网络中所产生的软中断到达时,将到达的软中断数据解析为可存储格式,然后临时存储在第一表中;当软中断到达时,周期性地执行块提交;从所述第一表中周期性地取出跟随最后序列的全部软中断信息;将从所述第一表中取出的软中断信息存储在第二表和第三表中;根据所选择的类执行共同代表告警选择;通过周期性地删除旧数据分区,以逐个分区为基础周期性地删除所述第一表中的故障产生信息,存储在所述第一表中的告警信息用于通过客户端进行轮询,并周期性地删除已经进行了轮询的信息,以及利用周期性的删除,所述第一表中的存储为临时存储,在删除包括已经被读取的数据的旧数据时,在存储在所述第一表中的告警信息中,以逐个分区为基础删除已存储数据群,而无需逐一地找出和删除旧数据;监视第四表,并将监视时间与客户端的最后轮询时间进行比较,以确定是否进行了异常终止,当确定存在异常终止时,则从所述第四表中删除异常终止的客户端的列表;将客户端的标识符登记在所述第四表上,客户端写入其运行时间信息,并接收客户端标识符的已分配标识符;以及在将标识符登记在所述第四表上之后,由客户端查询新告警数据是否存在,并且客户端执行轮询,以确认所述第一表中是否存在新到达的告警信息,并检查是否存在大于最后序列号的号码,以确认新告警数据是否到达。
28.一种其上存储有数据结构的计算机可读介质,包括第一字段,包含表示由故障管理模块收集故障产生信息,并将其存储在监听表中的数据;第二字段,包含表示由监听端口监视模块以逐个分区为基础,周期性地删除所述监听表中的故障产生信息的数据;以及第三字段,包含表示由监听端口监视模块更新告警表和事件表中的故障产生信息,并处理代表告警的数据。
全文摘要
一种方法,其中网络管理系统(NMS)处理与从高容量网络设备产生的故障有关的信息,如大量的告警或事件等,并实时地向客户端转发处理过的故障信息。更具体地,本发明涉及一种故障信息处理方法和系统,使用数据库表建模,更快、更有效地处理告警,以改善在应用中将数据存储在告警数据库中的延迟,这种延迟是处理告警和事件中最严重的问题。利用本发明,由故障管理模块简单地执行软中断在监听表中的临时存储,并通过监听端口监视模块采用异步事务处理方式来执行其他耗时的额外功能,以便更为快速地处理大量告警和事件信息,这在现有同步方式中是不能实现的,从而实现多个软中断的实时处理。
文档编号G06F11/273GK1655517SQ200510003889
公开日2005年8月17日 申请日期2005年1月19日 优先权日2004年2月11日
发明者全应善 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1