虚拟化网元故障自愈方法及装置与流程

文档序号:12809148阅读:539来源:国知局
虚拟化网元故障自愈方法及装置与流程

本发明涉及通讯领域,尤其涉及一种虚拟化网元故障自愈方法及装置。



背景技术:

随着云计算技术的不断发展和成熟,云平台在多个领域得到了成功的运用。在此基础上,电信运营商为了提高通讯网络的灵活性,降低成本,提出了nfv(networkfunctionsvirtualization,电信网络功能虚拟化)概念。在虚拟化系统上由各种虚拟化网元来完成原来的物理网元设备所完成的工作,为了使各网元能正常工作,通常还需要对各虚拟化网元进行监控管理,方便在虚拟化网元产生各种故障后能及时对故障做出处理,恢复正常工作。

在现有技术中,也会监控各虚拟化网元上产生的各种故障告警,但是在监控到虚拟化网元上的严重的故障告警后需要人为手动的执行告警消除,根据故障告警的详细内容,进行相应的故障处理,每产生一个故障告警都需要手动执行一次故障消除,因此,存在需要人工实时监控的问题,并且对于某些故障手动重复处理,降低了工作效率,浪费了人力资源。

因此,提供一种能够对虚拟化网元的故障告警自动处理的虚拟化网元故障自愈方法是现有技术中亟需解决的问题。



技术实现要素:

本发明要解决的主要技术问题是,提供一种虚拟化网元故障自愈方法及装置,解决现有技术中存在的需要人工实时监控虚拟化网元的故障情况的问题。

为解决上述技术问题,本发明提供一种用于电信网络功能虚拟化系统的虚拟化网元故障自愈方法,包括:

监听并接收虚拟化网元的故障告警;

当接收到故障告警,从数据库中调用与所述故障告警对应的故障处理规则;

根据所述故障处理规则对所述故障告警进行处理。

在本发明一种实施例中,在监听并接收虚拟化网元的故障告警之前,还包括:针对不同故障告警设置对应的故障处理规则,并将所述故障处理规则保存至数据库,所述故障处理规则包括针对不同故障告警设置的故障消除方式。

在本发明一种实施例中,在接收到故障告警之后,从数据库中调用与所述故障告警对应的故障处理规则之前,还包括:判断数据库中是否存在与所述故障告警相对应的故障处理规则,若是,则直接调用与所述故障告警相对应的故障处理规则;否则,将所述故障告警上报,或者通过分析已处理的故障告警,确定所述故障告警的故障处理规则,并将所述故障处理规则更新到数据库。

在本发明一种实施例中,通过分析已处理的故障告警,确定所述故障告警的故障处理规则包括:调用已处理故障的故障处理记录,判断所述已处理的故障与所述故障告警的故障内容是否相同或相似,若是,则采用与所述已处理故障告警的相同故障消除方式,形成所述故障告警相应的故障处理规则。

在本发明一种实施例中,当接收到故障告警,读取网元标识,所述网元标识用于记录发送所述故障告警的虚拟化网元。

在本发明一种实施例中,在根据所述故障处理规则对所述故障告警进行处理之后还包括:将所述故障告警的处理结果发送给上报所述故障告警的虚拟化网元。

在本发明一种实施例中,在接收到故障告警之后,判断所述故障告警的故障内容是否为自愈可以消除的故障,若是则从数据库中调用与所述故障告警对应的故障处理规则;否则直接将所述故障告警上报。

本发明还提供一种虚拟化网元故障自愈装置,其特征在于,包括:

监听模块:用于监听虚拟化网元的故障告警,接收故障告警;

处理模块:用于当接收到故障告警,从数据库中调用与所述故障告警对应的故障处理规则;

执行模块:用于根据所述故障处理规则对所述故障告警进行处理。

在本发明一种实施例中,还包括设置模块,用于针对不同故障告警设置对应的故障处理规则,并将所述故障处理规则保存至数据库,所述故障处理规则包括针对不同故障告警设置的故障消除方式。

在本发明一种实施例中,所述处理模块还用于,在接收到故障告警之后,从数据库中调用与所述故障告警对应的故障处理规则之前,判断数据库中是否存在与所述故障告警相对应的故障处理规则,若是,则直接调用与所述故障告警相对应的故障处理规则;否则,将所述故障告警上报,或者通过分析已处理的故障告警,确定所述故障告警的故障处理规则,并将所述故障处理规则更新到数据库。

在本发明一种实施例中,所述处理模块还用于调用已处理故障的故障处理记录;判断所述已处理的故障告警与所述接收到的故障告警的故障内容是否相同或相似;以及当判断结果为是的时候,采用与所述已处理故障告警的相同故障消除方式,形成所述故障告警相应的故障处理规则。

在本发明一种实施例中,还包括网元标识读取模块,用于在接收到故障告警,读取网元标识,所述网元标识用于记录发送所述故障告警的虚拟化网元。

在本发明一种实施例中,还包括处理结果发送模块,用于将所述故障告警的处理结果发送给上报所述故障告警的虚拟化网元。

在本发明一种实施例中,所述处理模块还用于,在接收到故障告警之后,判断所述故障告警中的故障是否可以自愈;若是,从数据库中调用与所述故障告警对应的故障处理规则;否则,直接将所述故障告警上报。

本发明的有益效果是:本发明提供了一种虚拟化网元故障自愈方法及装置,虚拟化网元故障自愈装置监听虚拟化网元的故障告警,虚拟化网元上发生故障, 会向虚拟化网元故障自愈装置上报该故障告警,虚拟化网元故障自愈装置接收到该故障告警后,从数据库中调用与该故障告警对应的故障处理规则,并根据故障处理规则来对故障进行处理。从对故障告警的监控,到接收到故障告警再到根据接收到的故障调用对应的故障处理规则,按照故障处理规则对故障进行处理,整个过程都由虚拟化网元故障自愈装置来执行,不需要人工参与,整个过程自动执行,从而达到提高工作效率,节省人力资源的效果。

附图说明

图1为本发明实施例一中的虚拟化网元故障自愈方法中虚拟化网元故障装置侧的工作流程图;

图2为本发明实施例一中的虚拟化网元故障自愈方法中虚拟化网元故障装置侧一种具体实施例的流程图;

图3为本发明实施例二中的虚拟化网元故障自愈装置的结构示意图;

图4为本发明实施例二中具体示例的工作流程图。

具体实施方式

下面通过具体实施方式结合附图对本发明作进一步详细说明。

实施例一:

本实施例提供一种虚拟化网元故障自愈方法,在完成虚拟化网元故障自愈时在虚拟化网元故障装置侧的具体执行方法请参考图1,包括:

s101:监听并接受虚拟化网元的故障告警;

s102:从数据库中调用与所述故障告警对应的故障处理规则;

s103:根据所述故障处理规则对所述故障告警进行处理。

在执行s101步骤,进行监听虚拟化网元上的故障告警之前,可以针对不同 故障告警设置对应的故障处理规则,并将设置好的故障处理规则保存到数据库,故障处理规则通常包括针对不同故障告警设置的消除故障的方式,例如,可以事先设定在虚拟化网元启动失败时采用重启该虚拟化网元来消除该故障、在收到重启虚拟化网元失败的故障告警时采用重建该虚拟化网元来消除该故障。对于不同的故障告警设置与其对应的故障处理规则,可以是由用户根据具体情况自行设置,也可以选择在安装虚拟机的时候根据推荐默认设置,也可以是虚拟化网元故障自愈装置根据之前已经处理过的各种故障自学习进行设置。

在本实施例中,虚拟化网元故障自愈装置接收到的故障告警中包括网元标识,该网元标识用于记录发送该故障告警的虚拟化网元,方便虚拟化网元故障自愈装置调用了相应的处理规则后,可以准确的确定应该将该故障处理结果发送给哪一个虚拟化网元,以免出现发送错误导致故障处理错误的情况。

对于步骤s102,在接收到故障告警后,从数据库中调用与所述故障告警对应的故障处理规则前,通常还需要判断数据库中是否存在与收到的故障告警相对应的故障处理规则,此时,请参考图2,表达了执行步骤s102的整个过程:

s201:接收故障告警;

s202:判断数据库中是否存在与接收到的该故障告警相对应的故障处理规则,若是则执行s203,否则执行s204。

s203:直接调用与该故障告警相对应的故障处理规则;

s204:将该故障告警上报,或者通过自学习方式确定相应的故障处理规则,并将该故障处理规则保存至数据库。

例如,事先设定了一条故障处理规则为:在虚拟化网元启动失败时采用重启该虚拟化网元来消除该故障,并将该故障处理规则保存在数据库中。现在收到了一条虚拟化网元重启失败的故障告警,先会查看数据库中存储的有没有处 理网元启动失败的处理方法,现在查询数据库就会发现数据库中已经定义好当启动失败时,采用重启的方式即可,也即是存在了对应的故障处理规则,此时,只需要直接调用这条故障处理规则。

也会存在收到的某些故障告警没有预设的故障处理规则与其对应,针对这种情况往往会采用步骤s204中的方式来进行,第一种方式是将其上报,由管理员来决定具体需要采用哪种故障消除方式;另外一种方式就是通过自学习的方式来确定相应的故障处理规则,所谓自学习方式,就是参考已经处理过的故障告警,看那些与该故障告警的告警原因内容等相似的故障告警的故障处理方法,并将其作为该故障告警的处理手段,获得处理规则后调用所述故障处理规则,并发送故障处理结果至上报该故障告警的网元,并将所述故障处理规则更新到数据库。可以想到的是,在步骤s104中可以先进行自学习,看能否通过自学习来获得故障处理规则,若不能,再上报;若可以通过自学习来获得故障处理规则,就通过自学习的方式获得故障处理规则,保存该故障处理规则到数据库的同时还通知管理员,让管理员知道本条故障处理规则通过自学习方式获得;当然也可以选择不发送给管理员,消除该故障就可以了。

由于本发明中,整个消除故障的过程仅靠虚拟化网元故障自愈系统自身完成,所以对于那些极其复杂的故障,比如需要管理员输入特定的参数值,是难以仅仅依靠虚拟化网元故障自愈系统自身来完成的,所以,自然也在本实施例的一种具体实施方式中,考虑到方案的可实现性,通常在接收到故障告警后,先判断该故障告警中的故障是可以自愈,还是必须要由管理员参与,采取特殊处理方式的故障。所谓自愈也即是不需要人工参与,系统自动执行,例如重启或重建,可以设置好流程由系统自动执行,如果是可以自愈的故障则执行s102以及接下来的相应步骤;如果是必须要由管理员参与,采取特殊处理方式的故 障就需要将该故障告警上报,由管理员来决定具体的故障处理方式。采用这种方法的好处是,先进行粗略的故障自愈可行性的筛选,对于不适合采用重启或重建的故障告警直接上报给管理员,不需要执行后续的读取数据库以及进行判断比对等步骤,减少虚拟机的工作负担,提高工作效率,节约时间和资源。

由于虚拟化网元使用虚拟资源,在消除故障后,通常还要将消除故障后的虚拟资源的信息通知给上报该故障告警的虚拟化网元,虚拟化网元接收到虚拟资源的信息,可以对其进行负载均衡处理,虚拟化网元可以继续正常工作了。

实施例二:

本实施例提供一种虚拟化网元故障自愈装置,请参见图3:

虚拟化网元故障自愈装置3包括监听模块31、处理模块32和执行模块33。监听模块31主要用于监听虚拟化网元的故障告警,并接收虚拟化网元发送的故障告警;处理模块32用于在监听模块31接收到故障告警的时候,从数据库中调用相应的故障处理规则;执行模块33用于根据所述故障处理规则对所述故障告警进行处理。虚拟化网元按照该故障处理规则进行故障处理,在发生故障时不需要人为干预就能消除故障。

虚拟化网元故障自愈装置3还包括设置模块34,在监听模块31进行监听虚拟化网元上的故障告警之前,可以针对不同故障告警设置对应的故障处理规则,并将设置好的那些故障处理规则保存到数据库,故障处理规则通常包括针对不同故障告警设置对应的消除故障的方式。对于不同的故障告警设置与其对应的故障处理规则,可以是由用户根据具体情况自行设置,也可以选择在安装虚拟化网元的时候根据推荐默认设置,也可以是虚拟化网元故障自愈装置根据之前已经处理过的各种故障自学习进行设置。

在本实施例的一种具体实施方式中,虚拟化网元故障自愈装置3还包括网 元标识读取模块35,网元标识读取模块35用于在接收到故障告警,读取对象标识,该对象标识用于记录发送该故障告警的虚拟化网元,方便虚拟化网元故障自愈装置调用了相应的处理规则后,可以准确的确定应该将该故障处理结果发送给哪一个虚拟化网元,以免出现发送错误导致故障处理错误的情况。

由于本发明中,整个消除故障的过程仅靠虚拟化网元故障自愈系统自身完成,所以对于那些及其复杂的故障,是难以仅仅依靠虚拟化网元故障自愈系统自身来完成的,所以,在本实施例的一种具体实施方式中,考虑到方案的可实现性,虚拟化网元故障自愈装置3的处理模块32还用于在接收到故障告警后,在接收到故障告警之后,判断该故障告警中的故障是否可以自愈(例如,最常见的自愈手段,通过重启或重建虚拟化网元),还是必须要由管理员参与,采取特殊处理方式的故障;如果是故障告警中的故障是可以自愈的,则处理模块32直接从数据库中调用相应的故障处理规则,否则,处理模块32将故障告警上报,通知管理员,由管理员来决定具体的故障处理方式。采用这种方法的好处是,先进行粗略的故障自愈可行性的筛选,对于不适合采用重启或重建的故障告警直接上报给管理员,不需要执行后续的读取数据库,进行判断比对等步骤,提高工作效率,节约资源和时间。

在本实施例的一种具体实施方式中,虚拟化网元故障自愈装置3中的处理模块32还用于在监听模块31接收到故障告警后,从数据库中调用与该故障告警对应的故障处理规则前,判断数据库中是否存在与收到的故障告警相对应的故障处理规则。当判断结果为数据库中不存在与接收到的故障告警相对应的故障处理规则时,将该故障告警直接上报。当判断结果为数据库中不存在与接收到的故障告警相对应的故障处理规则时,通过自学习方式确定该故障告警相应的故障处理规则,并将该故障处理规则保存至数据库。所谓自学习方式,就是参考已经处理过的故障告警,看那些与该故障告警的告警原因内容等相似的故 障告警的故障处理方法,并将其作为该故障告警的处理手段。获得处理规则后将所述故障处理规则更新到数据库。

处理模块32还用于调用已处理故障的故障处理记录;判断所述已处理的故障告警与接收到的故障告警的故障内容是否相同或相似;当判断结果为是的时候,采用与所述已处理故障告警的相同故障消除方式,形成所述故障告警相应的故障处理规则。

在一种具体实施例中,虚拟化网元故障自愈装置3还包括处理结果发送模块36,由于虚拟化网元需要使用虚拟机的资源,在消除故障后通常还要将故障已经消除的消息通知给上报该故障告警的虚拟化网元,虚拟化网元接收到故障消除的消息,启用修复后的虚拟资源,就知道可以继续正常工作了。

实施例提供一个具体示例,来帮助理解本发明的方案,请参考图4:

在使用nfv技术的情况下,原来的物理网元设备由vnf(virtualizednetworkfunction,虚拟化网络功能)代替,使得网络功能与具体硬件解耦,vnf与底层的nfvi(networkfunctionsvirtualizationinfrastructure,网络功能虚拟化基础架构)隔离。在本示例中,所述虚拟化网元自愈装置的功能由vnfm(vnfmanager,vnf)管理器来完成,而vim(virtualisedinfrastructuremanager,虚拟基础设施管理器)提供虚拟资源,另外,一个vnf是一个网络功能的虚拟化的实例,它可以部署在虚拟化或非虚拟化的网络中。这些网络功能可以共同形成一个网络服务,既可以部署在单个虚拟机上,也可以跨多个虚拟机部署,在本示例中vnf也即是一种虚拟化网元,在下面进行描述时,为了描述得更清晰,都直接采用vnfm、vim和vnf来进行说明。

s401:在vnfm上定义处理规则。

该过程包括:用户选择已经创建好的虚拟化网元,设置收到特定的告警时处理方法。这些特定的告警是指那些需要通过虚拟机操作(包括重启或者重建 等)才能清除的告警,如虚拟机启动失败,模块状态异常,等等。设置在收到这些告警后的处理规则,如在收到虚拟机启动失败的告警后,重建虚拟机,又如在收到模块状态异常,重启模块所在的虚机等。

s402:在vnfm上订阅vim的虚拟资源的告警和虚拟化网元的告警(订阅成功后,vim和网元有告警时会向vnfm发送告警)。

s403:在vnfm上,虚拟化网元故障自愈处理进程启动,自愈处理进程监听vim和网元发来的告警消息。

s404:如这时如果有vnf上报模块失效的告警给vnfm。

s405:vnfm查询处理规则数据库中是否有这条告警的处理规则。

s406:如果处理规则是重启虚拟机,vnfm通知vnf要重启虚拟机,vnf给vnfm应答,同意重启虚拟机。

s407:vnfm通知vim,携带虚拟机id,重启指定的虚拟机,vim给vnfm应答,虚拟机重启成功。

s408:如果处理规则是重建虚拟机,vnfm通知vnf重建虚拟机,再顺序执行,vnf给vnfm应答,同意重建虚拟机。

s409:vnfm向vim发起请求,携带虚拟机的id,将虚拟机删除,vim返回虚拟机删除成功。

s410:vnfm向vim发起请求,携带创建虚拟机的参数,创建虚拟机,vim返回虚拟机创建成功。

s411:vnfm将创建成功的消息通知给vnf,通知vnf启用虚拟机。

本示例中在vnfm上实现的过程,也可以在nfvo(networkfunctionvirtualizationorchestrator,nfv编排器)和ems(elementmanagementsystem,网元管理系统)上实现,能够达到同等的处理效果。

采用本实施例中的虚拟化网元故障自装置及系统,虚拟化网元故障自愈装置监听虚拟化网元的故障告警,虚拟化网元上产生故障告警后,会向虚拟化网元故障自愈装置上报该故障告警,虚拟化网元故障自愈装置接收到该故障告警,从数据库中调用与该故障告警对应的故障处理规则并执行处理,将该故障处理结果发送到虚拟化网元,虚拟化网元收到该故障处理规则,对该产生故障告警的虚拟化网元按照该故障处理规则进行故障处理,来消除故障。整个过程都由虚拟化网元故障自愈系统来执行,在不需要人为参与的情况下实现故障自愈,不需要人实时监控,整个过程自动执行,从而达到提高工作效率,节省人力资源的效果。

以上内容是结合具体的实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1