分布式通信网管理和控制系统的制作方法

文档序号:7586739阅读:249来源:国知局
专利名称:分布式通信网管理和控制系统的制作方法
技术领域
本发明总的涉及通信领域,具体地,涉及改进分布式通信网的性能管理的系统和方法。
相关技术描述管理和控制分布式通信网(例如,分布式数据网或分布式电信网)的性能的任务正变得越来越复杂,这是由于多种关键因素,例如网络技术增加的复杂性、动态性和多样性,具有不同的需求(例如,实况视频,文件传送等等)的高级业务的散布,以及得到服务的用户的提高的期望而造成的。其它的影响网络复杂性的关键因素是电信行业的逐渐放开,以及由此导致的激烈竞争的市场。
为了在这样的环境下生存,分布式通信网的运营者必须管理网络,以使得其利用被最大化(即,确保投资的最大回报),而同时确保所有提供的业务都在预期的范围内执行。为了执行这样的任务,运营者个人需要某些支持工具,帮助他们管理具有复杂性的任务。特别是,某些分布的、动态地改变的网络,诸如,下一代互联网和所谓的第三代移动通信网,更需要一种今天的支持系统没有提供的可行的支持级别。
运行和支持系统(OSS)典型地用来执行数据通信和电信系统中的例行程序支持任务,诸如业务测量、网络监管、和性能管理、分析、故障诊断、管理任务等等。OSS工业中用于网络性能管理的当前方法典型地包括在多种驻留在软件平台上的应用。软件平台通常支持不同的用于监视网络性能信息,管理告警条件和操纵共同功能的应用,以便启动对网络资源的管理操作。通常,除了这些应用共享同一个平台设施外,它们在很大的程度上没有被集成。因此,正是运营者必须把性能和告警信息相互联系起来,并且在必要时来决定在改进网络性能方面采取哪些行动是适当的。
这样,大多数涉及的支持系统被集中在单个的整体管理中心中,或者在某些情况下,被分布或散布在相对数目较少的、地理位置不同的管理中心中。在某些分布式系统的情况下,分布的主要原因是所涉及的团体组织中责任的分布特性。
当前,在典型的电信系统中,系统的网络单元收集在5或15分钟时间间隔内有关它处理的业务的统计数字。然后网络单元使这些信息可作为输出文件提供给系统,或本地存储它供以后检索。这样,用于以这种方式构建电信系统性能测量活动的两个原先的目的是使得产生的全部信息的量最小化,以及减小网络单元的处理器负荷。典型地,性能信息被网络单元的管理系统检索,以及被存储在数据库中,可以由此数据库周期地或按要求地产生性能报告。
在今天的电信网中相对较小的管理/控制功能子集被自动化。这些功能几乎仅仅在网络单元中实施,以及它们的范围典型地被限制于所涉及的特定的网络单元。这样的管理/控制功能的例子是“过载控制”,它试图调整网络单元上的负荷,以使得该单元的性能被保持在可接受的范围内。
尽管如此,当前的性能管理解决办法中仍存在有多个问题。然而,如下所述,具体与本发明有关的问题涉及到管理/控制的复杂性、定时和集中度。例如,电信网在它们的规模、网络和它们提供的业务的多样性以及必须被管理系统处理的、产生的大量的信息方面正在变得越来越复杂而难于管理。为了解决这些复杂性,将需要某些半自动化和自动化的管理解决办法,来支持网络运营者的人员。然而,这样的支持能力在今天提供的管理解决办法中实际上不存在。
特别是,今天的性能管理系统以5分钟、15分钟或1小时的固定的时间间隔(粒度)收集网络性能测量信息。然而,采用这样的固定时间间隔的实施方案在性能信息的可提供性上引入了固有的延迟或延时。因此,这些延时实际上限制了网络管理者分析它们的网络性能的能力。显然,在运行动态电信网(例如蜂窝网、互联网和宽带多媒体网络)时,这些延时在识别和解决网络性能问题方面是不能接受的。而且,随着网络管理/控制系统变得越来越自动化,在传递性能测量信息时的这样的延时和测量本身的很粗的粒度,将变得越来越不能接受。作为替代,所使用的测量和控制时间间隔应当由问题域的定时需求来规定,而不是由网络单元今天提供的解决方案来规定。
今天的电信网管理系统仅在网络的相对较小数目的位置上被采用。换句话说,管理功能被集中在较小数目的网络节点上。因为在今天的大的电信网中网络功能也被集中在非常大的和昂贵的网络单元中,所以这种方法在一定程度上还可以起到作用。如前所述,目前存在的控制算法(例如,过载控制)在范围上被限制到单个网络单元,然而,在将来的分布式处理网络中,这种单个网络单元的方法将是不能接受的,因为在整个分布式网络单元上的业务逻辑的分布,以及在分布网络单元之间的相互依赖性,将需要可以覆盖分布节点的控制解决方案。
发明概要按照本发明的优选实施例,分布式通信网管理和控制系统包括由多个控制代理组成的实时控制系统。控制代理从多个性能代理接收与分布式通信网有关的实时性能信息,分析该实时性能信息,以及在适当的时间,输出控制命令,该控制命令根据所接收的实时性能数据控制分布式通信网的性能。
本发明的一个重要技术优点在于,它提供一种系统,该系统支持被管理网络信息的提取,以便支持适合于解决不同的控制问题的视图。
本发明的另一个重要技术优点在于,它提供一种灵活的和可缩放的系统,具有配置系统以适合于各个运营者的需要、特定的网络尺寸和或要被采用的、特定的控制问题的可能性。
本发明的再一个重要技术优点在于,它提供一种分布式系统,允许在最需要的地方利用控制逻辑以及在分布的部件之间进行内部通信。
本发明的又一个重要技术优点在于,它提供一种分级的系统,这样,它支持控制信息的提取或“通过委托管理的”控制模式。
本发明的又一个重要技术优点在于,它提供一种系统,支持将详细的控制逻辑封装在较低级别的控制代理中,该控制代理把细节隐藏在较高级别的目标驱动的控制接口后。
本发明的再一个重要技术优点在于,它提供一种系统,使得能表示和处理对控制活动的实时限制,以便实现实时控制。
本发明的又一个重要技术优点在于,它提供一种系统,使得能实施控制策略,该控制策略可根据源数据的确定性来预测和使用这个确定性作为参量以决定要被采取的控制行动的性质。
本发明的再一个重要技术优点在于,它提供一种系统,使得能同步整个分布式控制系统中的控制行动,以及推理出在被管理网络的物理上分开的部分中的事件。
本发明的又一个重要技术优点在于,它提供相对现有系统的改进的基站控制器(BSC)过载保护控制。
本发明的再一个重要技术优点在于,它提供分级控制方法,该方法是把控制责任分解到小区、区域或子网络域,由此,允许在最适当的级别上进行接入控制。
本发明的再一个重要技术优点在于,它提供一种系统,它以高的概率避免强制重新启动管理资源(特别是BSC中央处理器),因为在控制逻辑中重新启动截止期被考虑和被作出反应。
本发明的又一个重要技术优点在于,它提供控制方案,涉及用于通过包括接入类别的滞后和协调的解除禁止来减小重复的过载时期(例如,禁止-解除禁止振荡)的机制。
附图简述当结合附图参考以下的详细说明时可以更完全地理解本发明的方法和设备,其中

图1是示例性分布式通信网管理和控制系统的方框图,该系统可被使用来实施本发明的优选实施例;图2是显示按照本发明的优选实施例的、可在图1所示的RTCS 14中利用和/或被RTSC 14利用的、控制代理的组成部分及其相互关系的方框图;图3是显示示例性蜂窝系统的图,该系统可被使用来实施本发明的优选实施例;图4是显示按照本发明的优选实施例的、可被应用来实现纯禁止/解除禁止的BSC过载保护控制方案的结构的图;图5是显示按照本发明的优选实施例的、可被测量的BTS往返行程延时的例子的图;以及图6是可被使用来实施本发明的优选实施例的GRAFCET功能图。
附图详细说明通过参考附图的图1-6,可以最好地理解本发明的优选实施例及其优点,相同的数字被使用于各个图的相同的和相应的部分。
按照本发明,分布式通信网管理和控制系统基本上包括由多个控制代理组成的实时控制系统。控制代理从多个性能代理接收与分布式通信网有关的实时性能信息,分析该实时性能信息,以及在适当的时间,输出控制命令,该控制命令根据所接收的实时性能数据控制分布式通信网的性能。
具体地,图1是示例性分布式通信网管理和控制系统10的方框图,该系统可被使用来实施本发明的优选实施例。如图所示,示例的系统10包括实时性能测量系统(RTPMS)12,实时控制系统(RTCS)14,和长期推理系统(LRTS)16。对于这个实施例,RTPMS 12的输出端把性能测量信息通过多个数据链路(例如,在这个分布式系统中的几个数据链路)18a耦合到人机接口20,和通过多个数据链路18b耦合到LTRS16。数据链路18b输送数据到没有实时重要性的LTRS 16。人机接口20的输出端通过多个数据链路22被耦合到LTRS 16,以及LTRS的输出端通过数据链路24被耦合到RTSC 14。显然,如较浅色箭头表示的,数据链路24输送数据到没有实时重要性的RTCS 14。
要被网络管理和控制系统10管理的电信网26通过数据链路28a-d(每个都包括多个数据链路)被耦合到RTCS 14的多个输出端,以及通过线路30a-d被耦合到RTPMS 12的多个输入端。RTPMS 12的输出端通过多个数据链路32被耦合到RTCS 14。
对于本示例性实施例,RTPMS 12主要用来实时地测量被管理网络26的性能。换句话说,RTPMS 12测量对于网络26中的被管理资源的需要的性能指示,以及在要求的时间帧内提供测量结果给请求者。显然,在需要的时间帧中提供结果的这种能力在这种情况中是非常重要的,因为在自动控制下,重要的不只是报告的信息。正是正好有重要的信息可提供的这个时间使得在适当的时间可以采取适当的控制行动。这样,涉及的时间尺度可以从几秒变化到几个小时。另外,被管理网络26是分布式系统。因此,如果网络26的当前性能的显示是定时地被提供的,则必须使得相关的信息在视图要被更新时对于显示系统(例如,接口20)是可提供的。
RTPMS 12也用来提供对于外部系统的预订接口,这样,外部系统可预订接收网络性能信息。RTPMS 12可根据它的满足在当前预订和/或现有预订中描述的限制条件的能力而接受或拒绝这样的预订,一旦这样的预订被接受,RTPMS 12就以事件的形式发送与预订有关的性能数据给预订系统。对于RTPMS 12和它的运行的更详细的说明,可参阅上述的序列号为No.09/097,413的美国专利申请。
对于本实施例,LTRS 16被用作为控制系统,它监视网络26被RTCS14控制得如何(正如以下更详细地描述的)。LTRS 16预订来自RTPMS 12的相关的性能信息,以及根据该信息,估计网络26被控制得如何。如有必要,LTRS 16会修改RTCS 14的控制政策,以便改进网络被控制的情形。显然,对于本实施例,LTRS 16没有实时运行,而是有比RTCS长得多的时间尺度。这样,LTRS 16可被利用作为自动化的“智能”系统,涉及专家的半自动判决支持系统,或人工地执行涉及的任务的个人。LTRS 16的一个适当的实施例在PCT专利出版的No.WO 97 07638中描述。
人机接口20实际上是显示系统,它是用于与网络的管理和控制有关的多个用户接口系统的集合。这样的系统的例子包括用于实时显形网络状态的装置,或在LTRS 16中支持操作者的用户接口。
图1所示的RTCS 14显示本发明的优选实施例。基本上,RTCS 14负责控制网络26,使得它在可接受的范围内执行。RTCS 14也负责使得网络管理资源的使用最佳化。为了尽到这个责任,RTCS从RTPMS 12预订它需要的实时性能信息,以及规定有关这个信息的定时限制。在从RTPMS 12接收实时性能信息后,RTCS 14分析该信息,如有必要,则采取补救行动(通过数据链路28a-d),以便改进网络性能。
RTCS 14实时地控制网络26的性能,这种控制服从在预定的控制政策中被规定的目标集。这个控制政策可由LTRS 16提供和更新。实施这种“责任”的分离是为了减小RTCS 14的复杂性(从而减小计算负荷),以使得它可成功地实时运行。
这时,规定与实时系统有关的某些相关概念是有用的。通常,有三种类型的实时系统,它们通过所要求的截止期来分类。第一,“硬”实时系统是其中严格要求系统在规定的截止期内响应它的输入的系统。错过硬截止期的结果通常是灾难性的。第二,“软”实时系统是其中系统的响应时间是重要的、但如果规定的截止期被错过它仍旧能运行的系统。因此,软截止期常常具有几个特征可用来描述截止期。例如,这些特征可包括截止期本身,错过截止期的概率的上边界,或传递的迟后的上边界。第三,“固”实时系统是其中截止期可被错过但其中迟后传递没有意义的系统。固实时截止期与软截止期有关,只是在固截止期的情况下,没有迟后传递的观念(即,如果固截止期被错过,则任务被中止)。因此,固件截止期的特征是截止期本身和错过截止期的概率的上边界。
回到图1,RTCS 14由一个或多个控制代理(CA)组成。这些CA被分配以相对于一组被管理网络资源(被称为“域”)的实时控制的责任。CA可被安排成分级结构,其中较高级别的CA具有较宽范围的责任,以及控制下级CA的目标。下级CA进而又控制实际的资源。下面将提供这些CA的详细说明和它们的分级安排的例子。
RTCS 14是按照以下的原则构建的提取-RTCS支持网络资源的不同的视图和相关的控制逻辑,这样,不同的控制应用(或单个应用的部件)可被提供以一个视图,该视图相对于要被解决的特定控制问题是处在正确的提取级别。
分布-电信网被定义为分布式系统,分布的级别取决于多种因素,至少是网络技术。RTCS 14是分布式控制系统,其中实时控制器可被放置成紧密靠近它们所负责的网络资源,但RTCS也可与其它不和它在一起的控制器进行交互作用。控制逻辑位于需要它的地方。CA是在RTCS 14内的分布的单元。如前所述,CA负责控制一组被管理资源(例如,域)。在分级安排中,这样的域也可以包含下级CA。
分级结构-在RTCS中的代理可被安排成分级结构,其中较低级别的CA具有关于管理资源以及它们的控制的本地详细的知识。较高级别的CA具有更多的全部知识(即,较高级别的CA覆盖多个较低级别的代理的域),但处在较高的提取级别。换句话说,当在分级结构中向上移动时,详细知识的级别降低,但知识的范围和提取增加。
通过委托的管理和控制逻辑的封装-在RTCS 14中的CA使用一种通过委托的管理范例,用于控制行动(或控制信号)的交换。换句话说,上级CA委托它们的下级CA去执行控制任务或规定对于下级域的控制目标。这种模型允许CA封装用于其特定资源的控制逻辑的细节。这样,该模型也允许较高级别的CA控制不同类型的资源,而不用知道这个任务实际上如何被实现的细节。
定时-RTCS 14必须能够控制服从可被应用于要解决的控制问题的定时限制的网络。不同应用的定时要求将变化,但RTCS提供用于表示这种可变性的方法,它使得控制应用能够处理这些限制以及推论出控制信号或源数据的时间。
不确定性的处理-在许多情况下,是根据不被保证100%可靠的数据流而作出控制判决,或者控制判决是被统计地得出的,所以要加上某些误差容限。根据觉察到的源数据的确定性,CA可以调节它们对被管理网络26采取的行动。例如,如果特定的数据是不确定的,则比起数据具有与它有关的高级别的确定性的情况,CA可能要采取更谨慎的方法。
“确定性”是对于其中它正在被使用的控制域特定的量。所以,RTPMS 12不一定总是能够估计测量信息的确定性,但它提供给控制系统进行这种估计所需要的必要的数据(例如,被使用来计算性能指示的样本数)。
同步-其上运行RTCS 14的实时结构,它支持被及时同步的控制行动的发出。这种运行是可能的,因为所有的CA共享同一个时间视图。时钟同步是通过例如使用在基础计算平台上的网络定时协议(NTP)而实现的。
CA之间的交互作用借助于控制命令执行,这些命令规定特定的CA必须满足的目标或限制,以及设置控制算法的目标。控制命令被分级结构中的上级CA设定,或由操作者通过图形用户接口人工地被设定。在后一种情况下,人实际上是上级CA。
控制命令技术条件的例子是0.02的丢失目标概率,它是由CA控制的域的阻塞概率的上限。控制命令的意义由控制逻辑决定。在以上给出的例子中,正是理解控制命令的控制逻辑规定上限。这种方法与本发明的、在CA内进行的封装控制判决的方法相一致。
RTCS 14致力于实时控制功能。因此,与该控制功能有关的定时限制也需要被传送。完成这些任务的两个示例性方法如下(1)隐含定时-定时限制被编码在控制逻辑本身中,以及当控制目标被修改时,这些改变服从隐含限制。这种方法适合于对控制算法有清晰定义的和恒定的定时限制的情形。例如,这种方法将应用于在过载控制应用中三分钟的GSM BSC重新启动时间间隔(下面将详细描述)。(2)明显定时-在这种情况下,定时限制在由高级CA发送的控制命令中被明显说明。然后CA必须试图满足服从这些定时限制的控制目标。典型地,这样的限制是新的控制目标应当满足的截止期。明显限制被使用于其中控制算法中的定时限制发生变化或没有明确地规定的情况中。
这样,要由RTCS 14处理的控制问题不属于一个单个类别。因此,上述的两个替换例都被使用于RTCS中。在使用定时限制的地方,根据先前规定的实时系统的类别(即,该行为是硬,软,还是固)表示限制的性质也是重要的。
图2是显示按照本发明的优选实施例的、可在图1所示的RTCS 14中利用和/或被RTSC 14利用的、CA(100)的组成部分及其相互关系的方框图。对于本示例性实施例,CA 100包括知识库(KB)102,它优选地是包含由CA执行的不同控制应用的说明的数据库。应用特定的控制功能又根据一个或多个控制任务(1-n)被规定,每个任务被给定一个优先级(规定该任务与其它任务相比的相对重要性)。与控制任务有关的是关于所需要的数据的信息(例如,要预订什么,具有哪种周期性等等),以及要对那个外部控制命令起反应。控制任务(1-n)也包含实现实际的控制算法的控制逻辑。这个逻辑可例如根据规则、神经网络、事例、或某些被使用来代表适合于所考虑的控制问题类别的知识的其它机制而被编码。下面更详细地描述涉及状态转移图和多个相关规则的控制任务的例子。
示例性CA 100也包括对象库104,它优选地是包含CA保持的、关于被管理网络26的信息,即其状态和其性能的数据库。对象库104包括从管理信息库(MIB)(未示出)读出的网络配置和状态信息,而网络性能是从RTPMS 12接收的。
预订和事件处理器108也被包括在内,它负责产生对于RTPMS 12的预订,以及又从RTPMS接收事件信息。预订参量由控制算法的信息需要和相关的定时限制规定。除了从RTPMS 12接收性能数据以外,预订和事件处理器108也从较高级别的CA,以及有可能直接从网络运营者,接收控制命令。预订和事件处理器108也可处理由LTRS 16产生的任何控制命令。
示例性CA 100也包括调度部件110,它负责调度CA内的实时功能,以使得满足对于这些功能的定时限制。在每个CA中的调度部件(110)必须与基础的计算平台112的调度设施(平台调度器)交互作用,以便实现这个功能。这个能力在CA与其它CA或与其它实体(例如,来自RTPMS12的PA)共享计算平台的情况下特别重要。
按照本发明的教导,提供了管理和控制结构,可被使用来处理电信领域中出现的多个问题。然而,按照优选实施例,这里描述的管理和控制结构特别适合于蜂窝系统,其中移动性对于移动或实时地调节蜂窝网资源提出了一定的要求,这样这些资源可以以最好的可能方式被利用。典型的、这样的蜂窝应用域是(1)网络过载保护控制-这个类别中的方法的目标是保护各个网络资源避免由太高的提供业务等级造成过载。这样,可以避免对于网络资源的昂贵的重新启动时间间隔,以及可以得到更高的网络可用性。(2)无线网配置-对于这种类别的方法,其基本思想是监视某些业务指示符,以及根据这些指示符,自适应地试图把资源移动到最需要它们的区域。典型地,这样的功能包括改变小区尺寸的行动(通常由越区切换参量设置作出,以便把业务强制放入某个小区或从某个小区移出),以及自适应信道频率分配。(3)自适应“高级别”控制-蜂窝系统常常配备有功率控制和接纳控制方案。由于所需要的快速响应(对于功率控制约几毫秒),这类控制判决在各个网络单元中被本地地作出。虽然这里描述的本发明的结构主要不是设计用于这样的短的响应时间的,但它仍旧可被使用于监视这些低级别控制器对于整个网络或部分网络的影响,以及如果需要的话,低级别控制器的参量甚至政策都可被改变。
图3是显示可被使用来实施本发明的优选实施例的示例性蜂窝系统200的图。对于本实施例,所显示的蜂窝系统200是全球移动通信系统(GSM),但本发明并不打算被限制于此。例如,本发明可被应用于任何现有的或将来的蜂窝标准,诸如数字-先进移动电话系统(DAMPS),个人数字蜂窝(PDC)系统,个人通信系统(PCS),宽带码分多址(WCDMA)系统等等。另外,对于本实施例,描述了对网络过载保护控制问题的解决办法,但本发明并不打算被限制于此,并且例如,本发明也可被应用来解决各种无线网配置和自适应高级别控制问题。
参照图3所示的示例性蜂窝系统200,系统包括多个移动台(MS),表示为MS 202,204和206。每个MS通过各自的射频空中接口209,211和213被连接到基站收发信台(BTS)208,210和212。对于GSM,射频空中接口是基于时分多址(TDMA)方案的。每个BTS 208,210,212等等处理在各自小区内的业务,这些小区是由所涉及的BTS规定的。BTS还被连接到特定的BSC 214或216。每个BSC分别包括多个收发信机处理器(TRH)215a和215b与217a和217b,以及主中央处理器(CP)218和220。BSC又与移动业务交换中心(MSC)222通信,后者以某种传统的方式被连接到固定网络(未示出)。固定网络可以是例如公共交换电话网(PSTN),综合业务数字网(ISDN),或互联网。蜂窝网也包括原籍位置寄存器(HLR)224,它是从网络MSC可接入的。
在图3所示的网络配置中,可以以多种不同的方式造成过载,且原则上可以在任何的网络单元中造成过载。为了简单起见,优选实施例的说明主要限制于由一个BSC监管的子网络和它的基础资源(CP,TRH,BTS等等)。然而,这里对于优选实施例的描述的管理和控制原理可被扩展到包括整个网络,另外涉及MSC和HLR。
这样,当太多的MS在相对较短的时间间隔(通常小于1分钟)内想要接入网络时典型地会在BSC或任何它的被管理资源中出现过载。当有大量“同时的”呼叫尝试(例如,在重大体育赛事或高速公路上交通事故后出现)时,会发生这种情形。事实上,大量的同时接入尝试,连同多个国际漫游尝试,造成了1993年9月在德国柏林遇到的、难以解决的BSC过载问题。当大量MS企图几乎同时登记到网络中时,这种过载情形也会发生。当具有一个900MHz和一个1800MHz GSM网络的运营者配置一个系统,允许在这些网络之间漫游时,则这种集中登记的情形可能发生。在其中一个网络出现故障后,约30000个MS会企图在小于一分钟时间内登记到另一个网络。
这样,后一种(登记)情形的短的和过度瞬变的类型在将来当运营者签署特定的漫游协议时,可能会更普便,该漫游协议可能说明在系统失效时它们各自的网络应当接管来自竞争者的业务。然而,非常希望所采用的BSC过载管理和控制系统能够克服上述的过载情形。
这时,描述为什么用今天的GSM过载保护方案很难解决严重的BSC过载情形是有用的。直至过载发生时,通常很少有量新发送,而那些已经产生的重发主要是由于在射频空中接口丢失消息而引起的。当过载发生时,随后的接入请求消息被放入队列中。因此,来自BSC的预期的应答将被延迟。如果BSC在预定的时间间隔(GSM中是250ms)内不应答,则MS重复它的接入请求(直到最大的允许次数)直至得到有效的应答。然而,这些重复的接入请求增加了负荷,因此使得在适当的时间得到应答变得更困难。接入消息数目的这种增加是非线性的,这样,很难进行全面分析。
如果过载情况在一定的时间间隔(对于GSM BSC的CP是3分钟)内继续,则BSC的部件被重新启动。在这个时间间隔期间,BSC的基础域不能正确地被服务。然而,重新启动不一定能解决过载问题,因为一旦资源再次可提供,MS将再次企图得到接入,这会再次导致过载,这样造成另一次重新启动。当情况如此时,这种重复的重新启动是相对普通的。
显然,从上述的过载情形看来,可以得到某些要点。例如,由爱立信电信制造的某些BSC是基于爱立信AXE数字交换系统技术的,以及它配备有负载监管器(LOAS),其目的是保护BSC的CP不过载。LOAS通过给CP加上LOAS知道CP能够处理的工作量,而完成这个功能。虽然LOAS的功能类型可帮助去除非常短的和中等的过载瞬变,但通常LOAS对于解决更严重的过载情形是没有用的。这种能力缺乏的主要原因在于,LOAS不包含用于减小所作的接入尝试数目的有力的装置。
而且,今天的运行支持系统典型地以15或甚至5分钟的间隔运行。这个报告粒度是粗略的,使得在由这样的支持系统检测到问题以前,差不多都会发生BSC的CP的重新启动。然而,即使在截止期内检测到过载条件,它也应当在该时间内被解决(通过适当的控制行动)。短的重新启动时间的情形也可通过使用人工解决方案消除。显然,运营者不能在所有被影响的小区中调查过载情形(例如,每个BSC可被连接到几百个BTS)、决定适当的控制行动,以及在BSC的CP重新启动截止期内实现它们。而且,非常希望避免重新启动,至少是避免BSC的CP的重新启动,以及仍旧对尽可能多的MS提供网络接入。这些目标在没有基于实时管理和控制系统时也是非常难以估计的,如果这种估计不是不可能的话。
在BSC过载保护控制后面的基本思想是监视一个BSC的性能和它的基础资源,以及在过载的情形下,试图通过改变相应的MS的接入模式而减小业务。这个功能原则上可以以三种方式被完成到不同的程度(1)间接控制-这是当性能指示符被控制系统作为用于计算接入网络的费用的基础来使用时的情形。费用信息被实时地传送到MS,但没有要求网络参量的改变。而是,希望在过载情形下接入网络的高的费用会导致较少的接入尝试。虽然这是相对较简单的技术,但这种方法不保证过载在重新启动截止期内被处理。这种方法的另一个问题是,只有与真实呼叫有关的接入可被阻止,因为移动用户无法控制登记消息的发送(即,该方法不能应用于所有可能的过载情形)。(2)资源分配控制-这种情形的主要思想是移动或适配网络资源,以使得它们以最好的可能的方式被利用。然而,在今天的蜂窝系统中,只可能作出相当小的适配,这将不足以处理大量的登记情形。(3)直接接入控制-对于这种方法,控制命令从管理和控制系统被发送到MS。这些控制命令规定MS的当前的许可的接入特权。这样,在特定的小区中有三种不同的方式控制移动台的接入行为,诸如(1)通过规定最大许可的重试数,(2)通过规定在接连接入之间的最小时间,以及(3)通过禁止/解除禁止任何的10种划分(GSM)MS的接入类别。禁止/解除禁止方法最适合用于确保过载情形可被处理,因为(在原理上)它允许从小区中去除所有的业务。其它两种方法优选地被用作为对第三种方法的补充,以便最佳化(细调谐)MS的接入行为。
按照本发明的优选实施例,一种结构被应用来实现纯禁止/解除禁止BSC过载控制方案。图4是显示这样的结构的图,它是用于BSC过载保护控制的代理(PA和CA)配置。首先,应当指出,图4所示的代理配置可被使用于任何的上述的控制方法。其次,通过加上另一个提取级别,和同样引入与BSC一样多的、图4所示的分级结构类型,本发明的范围可被扩展到提供适用于网络(MSC)级别过载保护的装置。
参照图4,从CA的观点(在RTCS 14中)看,对性能测量系统(RTPMS12)提出的基本要求是,它应当是基于预定的,和能够实时地传送应用特定的性能指示符的。在上述的序列号为No.09/097,413的美国专利申请中描述的性能代理(PA)理想地适合于这种功能,因为它们共享许多想要的特性(例如,提取,分布,分级结构设计等等),这些特性对于通过本发明实施的结构而言是很基本的。
在BSC过载的情况下要被监视的资源是BSC的CP(218),它的TRH215a-b等等(每个相应于一个区域),以及所有的基础BTS 208,210,212等等(每个相应于所涉及的BTS服务的小区和小的小区小组)。这精确地是图4的RTPMS 12所示的PA分级结构提供的视图。在这种情况下,应当指出,区域级别PA(2)的数目等于BSC中TRH的数目,以及小区级别PA(4)的数目等于被连接到BSC的BTS的数目。这样,这种安排实际上允许进行小区、区域和在子网络级别上的控制(即,所示的安排有利地允许控制在它被认为最有效的级别上进行)。
在每个级别上过载的检测可以基于直接来自(网络26的)管理资源的测量结果。在区域和子网络的情况下,过载的检测也可以基于预定来自较低级别的PA的较低级别性能指示符。在级别l上网络资源I的负载的一般数学描述可被表示为loadil=f(Mil,Qi,inputl,Qi,outputl,Lil,Dil),----(1)]]>其中l等于小区、区域或子网络,以及包括以下的资源测量Mil,或在某个预定的时间间隔期间在级别l上由资源I得到的接入请求的数目;Qi,inputl,或在级别l上资源I的输入队列的长度;Qi,outputl,或在级别l上资源I的输出队列的长度;Lil,或在级别l上资源I的负载;以及Dil,或对于来自级别l上资源I的某些分组已被服务的确认的延时。
在最后的类别中感兴趣的性能测量可被称为“BTS往返行程延时”,它被定义为来自BTS的接入请求由BSC经过立即分配回答来确认所花费的时间。图5所示的图显示了可被测量的BTS往返行程延时的例子。如图所示,这些延时测量只在BTS级别上是直接可提供的。然而,BTS往返行程延时的区域级别的变型可以通过允许它从所有的它的N个下级PA预订BTS往返行程延时且随后形成这些测量值的平均值(或加权和),而容易地在区域级别PA上得到,如下式表示Diregion=Σi=1NDicellN-----(2)]]>得出的区域级别往返行程延时进而又被组合到子网络PA中,以便形成子网络相关的往返行程延时。
等式(1)中的表示式f然后被使用来把(来自PA)不同的性能输入加权在一起。原始性能测量具有噪声的倾向。因此,常常必须对测量值进行低通滤波,或者对几个接连的样本取平均,以便得到代表的性能指示。这个功能也被包括在表示式f中。
实际上使用的精确的负载表示式取决于控制目标,但由于许多列出的测量值大概表示相同的东西,所以简化在每个级别上的负载等式以便只包括一种类型的资源测量值是合理的。例如,在这种情况中BTS往返行程延时被用于小区级别上的测量,而接收的接入请求的数目被使用来检测区域过载以及子网络过载。
按照本发明的优选实施例,且如图4的RTCS 14所显示的,用于BSC过载问题的优选的CA配置形成严格的分级结构。这种安排的主要原因在于,对网络施加的所有可能的设置确实是小区有关的(例如,禁止/解除禁止控制命令只对于特定的小区是有效的)。这也意味着,特定的网络资源参量的直接改变只可从单个代理(CA)提出,它有效地减小了在允许几个自动的CA这样做时可能存在的不一致性的风险。
现在,虽然较低级别的CA能发出控制命令“禁止(类别)”或“解除禁止(类别)”,其中参量“类别”是在1与10之间的数值,较高级别的CA不必为这些控制细节(例如,禁止哪个类别)操心。而是,较高级别的CA与另一个较高级别的控制命令集有关,诸如(1)外部过载(步调);(2)接受更多负载();以及(3)协调的解除禁止(有效的)(其中“有效”是布尔数值),其中任何命令可被传送到下级CA。在第一控制命令中,“pace”是指希望负载应当被减小的速度。头两个控制命令的意义是自说明性的,而第三个命令被使用于同步目的,正如下面更详细地描述的。
为了验证控制命令已被接受,验证消息被传送到命令的发出者。然后,直至发出者要采取必要的行动去处理无应答问题。记住这一点,现在有可能把控制逻辑(控制任务)封装到CA中,以及提供全面的和牢固的(至少到某种程度)控制解决方案。所谓牢固,是指即使某些CA无法运行,其余代理也将会做它们的工作,虽然没有以前那样好。例如,如果区域级别CA失败,则它的下级级别CA将仍旧尝试解决任何检测的过载问题,但现在是在它们自己之上以及仅仅根据可供使用的小区数据。
如前所述,CA可处理许多控制任务,每个任务由任务的优先级、所需要的数据(预订)、要对其进行反应的那些外部控制命令、和最后的但并非最不重要的控制逻辑而被规定。控制逻辑可被分成两个部分控制行动(例如,控制规则,神经网络映射等等);和在这些行动之间的序列(或定时)。
序列或定时可以以多种不同的方式被规定。对于本实施例,采用一种技术,它使用所谓的功能图,典型地被称为GRAFCET表示式。这样,GRAFCET是用于顺序控制的IEC标准,它支持高级别分级结构控制设计,以及通过它的图形表示,很容易配置和了解。
图6是GRAFCET功能图,它可被使用来实施本发明的优选实施例。如图所示,GRAFCET功能图主要由步骤(或状态)和转移组成,它们通过引导的链路被互联(除非被标记出,否则流程总是从上到下)。步骤可以是活性的(由称为标记的加亮的点表示)或非活性的。任何数目的控制行动可以与一个步骤有关,但这些行动只在该步骤是活性时被执行。从活性到非活性步骤的改变由位于所提到的步骤之间的转移(或,转移条件)确定。除了步骤和转移以外,GRAFCET也包括用于重复的特定的构造、和替换的路径以及平行性。
在GRAFCET表示式中原先许可的简单类型的控制行动(和转移条件)对于这里考虑的应用多少是限制性的。然而,按照本发明,通过引入在传统的基于知识的系统(诸如G2)中可提供的类型的、基于规则的干扰机(图2所示的KB102的部件),可以得到所需要的灵活性。这种灵活性包括事件触发规则(所有转移条件和一些控制规则是这种类型),它们被利用来立即对一个或多个输入的改变作出反应,以及扫描规则,它们被使用来实现必须周期地执行的控制行动。
这时,对于解决BSC过载问题的所有的需要的控制工具是可提供的。这样,图6显示了小区级别的过载保护控制器(控制任务),或这个问题的解决方案的CA部分。应当指出,对于本实施例,可以有与CA一样多的控制器。这样,所使用的不同的GRAFCET功能图的逻辑结构或多或少是相同的,不管该功能图被使用于小区、区域、还是子网络控制。
图6所示的控制器300(对于小区n)工作如下。在步骤302,正常运行模式是不做任何事情(等待)。在步骤304,当“过载检测”的转移条件被触发时,“禁止接入类别”的步骤306被启动,根据其控制器命令一个接入类别被禁止。应当指出,负载信息从监视当前小区资源的PA被周期地传送到CA。在本应用中,选择一个在1和10秒之间的周期是合理的。
在步骤306,在接连的禁止控制命令之间的周期(即,与“禁止接入类别”相联系的规则308的周期性)取决于过载是外部的还是本地的。为了能够在3分钟内完全地关闭小区,周期应当被设置为小于20秒。这样,在禁止状态时,控制器300要求越来越多的类别被禁止,以及一直进行到在步骤310“过载已处理”的转移条件被触发为止,这表示问题已被解决。应当指出,可以假定,已经从还没有被禁止的接入类别中按照预定的策略来进行类别的选择。
在步骤312,试图恢复原先的参量设置(其中允许小区中所有的MS接入网络)。接入类别被解除禁止,或者本地进行,或者在外部过载的情况下被从区域级别CA进行协调。应当指出,正如在禁止情形时那样,可以假定要解除禁止的类别的选择已经被确定。如果在这种恢复阶段期间,再次检测到过载,则接入类别的禁止将再次被要求(接着是图6的重复分支314)。在步骤302,在解除禁止阶段(步骤316)被成功地完成以后,初始的“等待”步骤被启动。
如前所述,区域或子网络控制器类似于小区级别控制器那样地被构建。主要的结构差别在于,在“无级别被禁止”转移下面加上另一个步骤,其中发出一个协调的解除禁止(假)消息。主要功能差别出现在步骤“禁止接入类别”(又称为“减小区域/子网络负载”)和“解除禁止接入类别”(又称为“接受更多的负载”)中。在前一种情形中,协调的解除禁止(真)消息首先被提出,以便通知较低的级别的CA从现在起直至协调被重置为止,由区域级别CA协调解除禁止接入类别,其运行又可被子网络CA协调。用于决定各个小区级别CA应当如何被协调以减小它们各自负载的实际策略可以是任意地复杂的。为了简单起见,同一个策略可被同时地应用于所有的下级CA,这典型地是指,过载被快速地减小。接受更多负载的策略是以某个周期通过所有的下级CA重复地循环,以及在建立时,传送一个接受更多命令()的消息。这是指,在一个时刻被管理域只有一个接入类别被“打开”,这是有利的特性(如下面描述的)。
按照优选实施例,控制器(例如,300)涉及多个必须被适当地设置的参量(例如,减小负载的周期性,接受更多负载的步调,禁止或解除禁止哪个接入类别等等)。这样,细调谐这些设置以便改进系统的总的性能是图1所示的LTRS 16的典型的任务。
有三个涉及到图6所示的控制方案的性能的问题。首先,在本应用中,定时和实时计算是重要的,因为检测到过载被延迟就意味着避免资源重新启动的时间被缩短。为了解决这个问题,控制器(例如,300)典型地要禁止比所必须的更多的MS(更多的接入类别)。尤其是,引入有效控制的延时越长,则对于不能满足它们的定时限制的接入而浪费的带宽越多。
第二,图6上的禁止-解除禁止循环(重复循环314)包括滞后的。其中类别被禁止和然后被解除禁止的循环由于“过载处理的”转移条件的设计而花费至少15秒。这是必须施加的预防措施,以便避免由有噪声的测量值造成的禁止-解除禁止振荡。最后,这也意味着,为传送这些控制设置所需要的最大带宽是已知的。
第三点是,当没有涉及到协调的解除禁止时,禁止-解除禁止振荡很容易发生。为了解释这个问题,假定在同一个区域中几个小区级别CA已检测到过载,以及开始在它们各自的域中禁止接入级别。如果大约同时地,多个CA检测到过载问题已解决,则它们将在相对较短的时间间隔内都命令解除禁止接入类别。然后,负载将增加(当网络中同时有许多MS试图登记时),以及有紧迫的风险,即这将使得另一个过载情形发生。通过协调的解除禁止,有可能控制在先前过载的区域中同时被解除禁止的类别的数目,这意味着禁止-解除禁止振荡的风险可被大大地减小。
虽然在附图中显示了和在以上的详细说明中描述了本发明的方法和装置的优选实施例,但将会看到,本发明并不限于所揭示的实施例,而是在不脱离如以下的权利要求阐述和规定的、本发明的精神的情况下,能够作出多种重新安排、修改和替换。
权利要求
1.用于分布式通信网的实时控制系统,包括至少一个控制代理;至少一个输入数据链路,用于接收与所述分布式通信网有关的实时性能数据;以及至少一个输出数据链路,用于根据所述实时性能数据控制所述分布式通信网的性能。
2.权利要求1的实时控制系统,其特征在于,还包括至少一个输入控制连接,用于接收与所述分布式通信网的长期性能有关的控制信号。
3.权利要求1的实时控制系统,其特征在于,其中所述至少一个控制代理改而包括被分级地连接的多个控制代理。
4.权利要求1的实时控制系统,其特征在于,其中一个控制代理与多个其它控制代理通信。
5.权利要求4的实时控制系统,其特征在于,其中所述控制代理按分级方式被连接。
6.权利要求3的实时控制系统,其特征在于,其中所述多个控制代理的各个控制代理都封装详细的控制逻辑,以及提取所述封装的、详细的控制逻辑,供其它控制代理使用。
7.权利要求1的实时控制系统,其特征在于,其中所述至少一个控制代理包括用于控制在所述分布式通信网中的多个资源的装置。
8.权利要求7的实时控制系统,其特征在于,其中由所述至少一个控制代理产生的控制信号取决于测量数据和所述测量数据的确定性因子。
9.权利要求7的实时控制系统,其特征在于,其中用于控制多个资源的控制信号在整个所述分布式通信网中被同步。
10.权利要求1的实时控制系统,其特征在于,其中所述至少一个控制代理包括用于存储与要被所述至少一个控制代理执行的至少一个控制应用有关的信息的装置;用于存储与所述分布式通信网有关的配置、状态和性能信息的装置;用于产生在所述分布式通信网中进行性能测量时使用的预订信息和接收与所述分布式通信网有关的实时性能事件信息的装置;以及被耦合到所述用于存储、产生和接收的装置的、用于调度至少一个功能以便满足至少一个定时限制的装置。
11.权利要求1的实时控制系统,其特征在于,其中所述分布式通信网包括蜂窝网。
12.权利要求1的实时控制系统,其特征在于,其中所述分布式通信网包括数据通信网。
13.权利要求1的实时控制系统,其特征在于,其中所述分布式通信网包括互联网。
14.权利要求13的实时控制系统,其特征在于,其中所述至少一个控制代理包括用于控制由所述互联网中的路由器管理的多个资源的装置。
15.权利要求1的实时控制系统,其特征在于,其中所述分布式通信网包括电信网。
16.权利要求7的实时控制系统,其特征在于,其中所述多个资源包括由基站控制器管理的多个资源。
17.权利要求7的实时控制系统,其特征在于,其中所述多个资源包括由交换系统管理的多个资源。
18.权利要求16的实时控制系统,其特征在于,其中由所述基站控制器管理的所述多个资源已经经历过载。
19.权利要求18的实时控制系统,其特征在于,其中所述至少一个控制代理包括用于控制所述多个被管理资源的所述性能以便消除所述过载的装置。
20.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括基站收发信台往返行程延时的测量值。
21.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括基站控制器中央处理器CPU负载的测量值。
22.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括基站控制器中央处理器队列长度的测量值。
23.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括在基站控制器处接收的接入请求数目的测量值。
24.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括收发信机处理器队列长度的测量值。
25.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括在收发信机处理器处接收的接入请求数目的测量值。
26.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括基站收发信台队列长度的测量值。
27.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括多个基站收发信台往返行程延时测量值的平均值。
28.权利要求19的实时控制系统,其特征在于,其中所述多个被管理资源的所述性能包括在基站收发信台处接收的接入请求数目的测量值。
29.用于控制分布式通信网的性能的控制代理,包括预订和事件处理器,用于产生在所述分布式通信网中进行性能测量时使用的预订信息,和用于接收与所述分布式通信网有关的实时性能事件信息;知识库,用于存储与要被所述至少一个控制代理执行的至少一个控制应用有关的信息;对象库,用于存储与所述分布式通信网有关的配置、状态和性能信息;以及调度器,被耦合到所述预订和事件处理器、所述知识库、和所述对象库,用于调度至少一个功能以便满足至少一个定时限制。
30.权利要求29的控制代理,其特征在于,其中所述实时性能事件信息从至少一个性能代理被接收。
31.权利要求30的控制代理,其特征在于,其中所述实时性能事件信息包括基站收发信台往返行程延时测量信息。
32.分布式通信网管理和控制系统,包括实时性能管理系统,所述实时性能管理系统包括至少一个性能代理,该性能代理包括用于处理、分析和提取从业务设备获取的实时性能数据的装置;以及实时控制系统,所述实时控制系统包括至少一个控制代理,该控制代理包括用于接收来自所述至少一个性能代理的所述实时性能数据和根据所述接收的实时性能数据控制所述分布式通信网的性能的装置。
33.用于实时控制分布式通信网的性能的方法,包括以下步骤控制代理接收和分析与所述分布式通信网有关的实时性能数据;以及所述控制代理输出至少一个控制命令,用于根据所述接收的实时性能数据控制所述分布式通信网的性能。
34.权利要求33的方法,其特征在于,还包括以下步骤接收与所述分布式通信网的长期性能有关的控制命令;以及所述控制代理输出至少一个控制命令,用于根据所述接收的长期控制命令控制所述分布式通信网的性能。
35.权利要求33的方法,其特征在于,还包括以下步骤存储与要被所述至少一个控制代理执行的至少一个控制应用有关的信息;存储与所述分布式通信网有关的配置、状态信息和实时性能数据;产生在所述分布式通信网中进行性能测量时使用的预订信息;以及调度至少其中一个存储和产生步骤,以便满足至少一个定时限制。
36.用于消除分布式通信网中的过载的方法,包括以下步骤检测在所述分布式通信网中的被管理资源的过载;命令减小对于所述被管理资源的负载;监视在所述被管理资源中的所述负载;以及如果所述过载在预定的时间间隔内被处理,则允许增加所述负载。
37.权利要求36的方法,其特征在于,其中所述分布式通信网包括蜂窝网。
38.用于消除蜂窝网中的过载的方法,包括以下步骤检测在所述蜂窝网中的被管理资源的过载;命令对于所述被管理资源禁止移动接入类别;监视在所述被管理资源中的所述负载;以及如果所述过载在预定的时间间隔内被处理,则命令解除禁止所述移动接入类别。
39.权利要求38的方法,其特征在于,其中所述移动接入类别包括请求接入到所述蜂窝网的多个移动台。
40.权利要求38的方法,其特征在于,其中所述被管理资源包括由至少一个基站收发信台规定的至少一个小区。
41.权利要求40的方法,其特征在于,其中所述步骤由过载保护控制器执行。
42.权利要求38的方法,其特征在于,其中在所述禁止步骤和所述解除禁止步骤之间的振荡通过以下步骤被衰减引入滞后;以及协调所述移动接入类别的所述解除禁止。
全文摘要
揭示了分布式通信网管理和控制系统(10),它包括由多个控制代理(100)组成的实时控制系统(14)。控制代理(100)从多个性能代理接收与分布式通信网(200)有关的实时性能信息,分析该实时性能信息,以及在适当的时间,输出控制命令,该控制命令根据所接收的实时性能数据控制分布式通信网(200)的性能。
文档编号H04B17/00GK1367987SQ9981235
公开日2002年9月4日 申请日期1999年9月3日 优先权日1998年9月4日
发明者P·林德斯科, A·纽坎贝 申请人:艾利森电话股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1