用于云部署中的网络元件的网络过程的分布式追踪的制作方法

文档序号:11637088阅读:146来源:国知局
用于云部署中的网络元件的网络过程的分布式追踪的制造方法与工艺
本发明涉及关于用于云部署中的网络元件的网络过程的分布式追踪的装置、方法、系统、计算机程序、计算机程序产品和计算机可读介质。
背景技术
:任何复杂系统的追踪都由于生成的追踪数据的量而成为艰难的任务。目前已知的解决方案——实现追踪级别和日志记录级别——不能解决问题的根本原因,而是提供缓和方法。大多数时候,系统具有低级别的追踪/日志记录(生产(production)模式),因此,在严重问题的情况下,系统切换到“深入追踪模式”。然而,这导致了如下的情况:其中当在系统中出现问题的初始迹象时,不会正确日志记录(由于低级别的追踪),然后,当系统进入“深入级别的追踪”时,有问题的事件可能不出现。另一个副作用是“深入日志记录之下的系统”的生产率明显低于正常的系统的生产率。在分布式系统的情况下,情况变得甚至更坏且复杂。系统组件之间的通信信道非常大地影响追踪活动,并且因此追踪数据和日志的同步成为艰难的任务。另一个问题是将追踪数据从系统传送到实际上执行对所收集的数据的分析的所谓的追踪收集实体(tce)(例如,网络管理系统(nms))中的问题。下面的表1给出了一些评估参数的效率/影响与追踪级别之间的权衡的概述。追踪级别评估参数影响高级别:深入级别的追踪,例如消息、过程内容和结果ne的性能在深度级别的追踪的情况下,ne的性能急剧下降。通常,ne将在深入追踪在它上激活时缺乏生产服务所收集的数据的量非常大量的所生产的数据通信信道的负载到ne和追踪收集实体之间的通信通道的所生成的高负载网络元件的稳定性稳定性可能受影响,因为深入追踪可能影响针对在ne上执行的一些过程的响应定时所提供的追踪信息的完整性所提供信息的完整性和完备性足以做出可靠的根本原因分析低级别:低级别的追踪,例如,仅严重故障ne的性能在低级别的追踪的情况下,ne的性能保持在可接受的级别上所收集的数据的量合理的所生成的数据的量通信信道的负载到ne和追踪收集实体之间的通信通道的所生成的合理负载网络元件的稳定性稳定性将不受影响所提供的追踪信息的完整性所提供信息的完整性和完备性不足以做出可靠的根本原因分析表1。图1示出了在独立网络元件(ne)的情况下的问题。在如图1所示的用于追踪独立网络元件的标准过程中,内部日志和数据直接从网络元件收集(经由命令行接口,如原始数据文件从本地硬盘驱动器等那样)。此处,不可能标识网络过程(并且因此不能做出任何根本原因分析),因为仅部分原始数据得到用于根本原因分析的相关输入,所述部分原始数据需要与来自在网络过程执行中涉及的其他网络元件的其他部分数据同步。因此,该方法用于手动根本原因分析,而不能自动化。图2图示了演进分组系统(eps)的情况。在图2中,示出了如在3gppts(技术规范)32.422中规定的用于追踪复杂系统的标准过程。此处的关键区别是限定追踪过程(追踪重新编码会话),其解决从网络元件收集初始数据的问题。在追踪过程的上下文中,针对根本原因分析而标识、收集、重新排序和准备初始数据。该方法的主要缺点是它的较低的容量和可扩展性。因此,可以同时发起仅少数追踪过程。该方法的主要缺点是追踪过程必须在可能的问题之前发起。换句话说,如果在网络过程执行的最后步骤中识别出问题,则理论上无法收集过程执行的早期阶段的背景(pre-history)。仅有的选项是发起追踪过程,然后再次重复网络过程以收集针对根本原因分析的相关数据。因此,该方法具有非常有限的针对根本原因分析自动化的能力。图3图示了云部署中eps的情况。此处的主要区别是,如果网络过程跨几个云执行,则网络元件本身也可能部署为云中的功能块。例如,移动性管理实体(mme)可以被分解并部署到云中的几个计算单元,云没有共同的硬盘驱动器(因此传统的向文件中日志记录从性能观点在那里变得非常有问题)。阻止在云部署中高效追踪的主要问题是网络过程可能在云的少数组件中执行,因此所有这些云的组件应具有等价级别的追踪深度。在其他情况下,追踪信息的重要部分将丢失,因为一些组件使用低级别的追踪(启用传统的高级别追踪在整个网络之上不可能,如上所解释的)。换句话说,运营商无法预测“哪个”网络过程将故障,并且它将在云中“在哪里”故障。此外,在网络过程故障之后(因此此时故障的位置变为已知),如果云元件处于低级别追踪模式,则不可能重新获得高级别追踪信息——因此追踪数据的重要部分对于特定的网络过程永远丢失。另一个问题是如何高效地标识跨几个云的网络过程以及部署到其中的许多网络元件。如在上述eps的情况中所示,标准追踪过程(如在3gppts32.422中所限定)不足以追踪来自大量的追踪过程的信息,因此它不能高效地扩展到(多个)云部署。目前,在文档3gppts32.422中规定了“订户和设备追踪”特征。该追踪方法面向追踪订户(通过订户身份imsi(国际移动订户身份)或imei(国际移动设备身份)或msisdn(移动订户(isdn(综合业务数字网络)号码))或预限定网络元件(enb(增强nodeb)、mme(移动性管理实体)、sgw(服务网关)和pgw(分组网络数据网关))。根据该文档,追踪功能可以是基于管理和基于信令的。在基于管理的追踪功能的情况下,运营商规定用户id类型/值(例如imsi)和网络元件(例如pgw)。然后,由pgw将所有用户的细节(如例如apn(接入点名称)、rat(无线电接入技术)、qos(服务质量))发送到追踪收集实体。在基于信令的追踪功能的情况下,这在针对特定ue的hss(归属订户服务器)处启用。在ue附接的情况下,hss使得能够在更新位置应答消息中追踪,然后mme将创建会话请求传播到sgw和pgw。在被传播时,ne开始向追踪收集实体报告ue追踪细节。如上所述,在文档3gppts32.422中,追踪被考虑为特定网络过程。这就是为什么追踪具有有限能力(实际上可以同时追踪仅少数订户)并且需要提前实现的原因。此处的追踪过程的主要目的是基于订户的请求的网络性能优化和根本原因分析。在本文档中描述的这样的特征并不意图用于所谓的“内置的、总是开启的、在整个网络之上的”解决方案。提供操作安全性和订户的隐私是其他重要的点,在其中现有追踪方法具有明显问题。如上所述,现有的追踪方法使用订户身份(imsi或imei或msisdn)之一。组合追踪数据的该方式影响订户隐私,并可能被一些国家的立法禁止。主要要求是在日常操作期间不将订户的身份以可读格式置于日志中,或以由当局的批准决策(如法院决策)之外的其他方式收集它。这是将订户的身份(imsi或imei或msisdn)用于数据收集的方法在数据保护和维护订户的隐私方面较弱的主要原因。用于根本原因分析的另一种实用方式是从网络元件手动收集日志(或多或少形式化的),从网络元件收集关于错误代码和计数器的原始数据(如经由traffica、netact),从网络接口收集数据(经由网络分析器工具、“网络的嗅探器”),然后执行逆向工程来恢复原始的网络过程流。然而,这样的方法也不意图用于“内置的、总是开启的、在整个网络之上的”解决方案。技术实现要素:因此,本发明的目的是克服上述问题并提供关于用于云部署中的网络元件的网络过程的分布式追踪的装置、方法、系统、计算机程序、计算机程序产品和计算机可读介质。根据本发明的一方面,提供了一种方法,包括:在收集实体处收集来自网络中的多个网络元件的用于多个网络过程的追踪信息元素,所述追踪信息元素包括追踪序列标识符和索引,所述追踪序列标识符标识特定网络过程,并且所述索引标识所述网络过程内的特定事件,基于所述追踪序列标识符和所述索引按照用于每个网络过程的后续(subsequent)次序布置所收集的追踪信息元素,以及基于所收集和布置的用于网络过程的追踪信息元素来恢复网络过程的流。根据本发明的另一方面,提供了一种方法,包括:通过网络元件将追踪序列标识符分配给通信系统中的特定网络过程,以及通过网络元件将索引分配给所述特定网络过程内的特定事件,所述追踪序列标识符对于通信系统中的每个网络过程是唯一的,并且在所述网络过程的开始时被创建。根据本发明的另一方面,提供了一种用于在收集实体中使用的装置,包括:至少一个处理器,以及用于存储由处理器执行的指令的至少一个存储器,其中所述至少一个存储器和所述指令被配置为利用所述至少一个处理器使得所述装置至少执行:在收集实体处收集来自网络中的多个网络元件的用于多个网络过程的追踪信息元素,所述追踪信息元素包括追踪序列标识符和索引,所述追踪序列标识符标识特定网络过程,并且所述索引标识所述网络过程内的特定事件,基于所述追踪序列标识符和所述索引按照用于每个网络过程的后续次序布置所收集的追踪信息元素,以及基于所收集和布置的用于网络过程的追踪信息元素来恢复网络过程的流。根据本发明的另一方面,提供了一种用于在网络元件中使用的装置,包括:至少一个处理器,以及用于存储由处理器执行的指令的至少一个存储器,其中所述至少一个存储器和所述指令被配置为利用所述至少一个处理器使得所述装置至少执行:通过网络元件将追踪序列标识符分配给通信系统中的特定网络过程,以及通过网络元件将索引分配给所述特定网络过程内的特定事件,所述追踪序列标识符对于通信系统中的每个网络过程是唯一的,并且在所述网络过程的开始时被创建。根据本发明的另一方面,提供了一种装置,包括:用于在收集实体处收集来自网络中的多个网络元件的用于多个网络过程的追踪信息元素的部件,所述追踪信息元素包括追踪序列标识符和索引,所述追踪序列标识符标识特定网络过程,并且所述索引标识所述网络过程内的特定事件,用于基于所述追踪序列标识符和所述索引按照用于每个网络过程的后续次序布置所收集的追踪信息元素的部件,以及用于基于所收集和布置的用于网络过程的追踪信息元素来恢复网络过程的流的部件。根据本发明的另一方面,提供了一种装置,包括:用于通过网络元件将追踪序列标识符分配给通信系统中的特定网络过程的部件,以及用于通过网络元件将索引分配给所述特定网络过程内的特定事件的部件,所述追踪序列标识符对于通信系统中的每个网络过程是唯一的,并且在所述网络过程的开始时被创建。根据本发明的另一方面,提供了一种包括代码部件的计算机程序产品,所述代码部件适于在被加载到计算机的存储器中时产生如上所述的方法中的任何一个的步骤。根据本发明的又另一方面,提供了一种如上所限定的计算机程序产品,其中所述计算机程序产品包括在其上存储有软件代码部分的计算机可读介质。根据本发明的又另一方面,提供了一种如上所限定的计算机程序产品,其中所述程序可直接加载到所述处理设备的内部存储器中。附图说明这些和其他目的、特征、细节和优点将从以下结合附图进行的本发明的方面/实施例的详细描述变得更加充分地显而易见,其中:图1是图示独立网络元件的追踪的示例的图;图2是图示在演进分组系统的情况下的复杂系统的追踪的示例的图;图3是图示在云部署中的复杂系统的追踪的示例的图;图4是图示根据本发明的一些示例版本的跨网络的标签事件的分布的示例的图;图5是图示根据本发明的一些示例版本的存储在本地存储器中的追踪信息元素的示例的图;图6是图示根据本发明的一些示例版本的在整个网络之上跨网络元件收集用于给定网络过程的追踪信息元素的示例的图;图7是图示根据本发明的一些示例版本的网络过程的反向(backward)追踪的动态弹性的示例的图;图8是图示根据本发明的一些示例版本的用于独立网络元件的追踪功能的典型实现的图;图9是图示根据本发明的一些示例版本的使用用于云部署的不可扩展追踪方法时的可能瓶颈的图;图10是图示根据本发明的一些示例版本的容量估计的示例的图;图11是图示根据本发明的示例版本的方法的示例的流程图;图12是图示根据本发明的示例版本的另一方法的示例的流程图;图13是图示根据本发明的示例版本的装置的示例的框图。具体实施方式在下文中,参考附图描述本发明的实施例和公开的一些示例版本。为了说明本发明,将结合以基于3gpp的通信系统(例如基于lte/lte-a的系统)为基础的蜂窝通信网络来描述示例和实施例。然而,应当注意,本发明不限于使用这样的类型的通信系统或通信网络的应用,而且可应用于其他类型的通信系统或通信网络等中。以下示例版本和实施例仅被理解为说明性的示例。尽管本说明书可以在若干位置中引用“一”、“一个”或“一些”示例版本或实施例,但并不一定意味着每个这样的引用是相同的示例版本或实施例,或者该特征仅应用于单个示例版本或实施例。不同实施例的单个特征也可以被组合以提供其他实施例。此外,词语“包括”和“包含”应被理解为不将所描述的实施例限制为仅包括已经提到的那些特征,并且这样的示例版本和实施例还可以包含未具体提到的特征、结构、单元、模块等。其中本发明的实施例的示例可应用的通信网络的基本系统架构可以包括包括有线或无线接入网络子系统和核心网络的一个或多个通信系统的公知架构。这样的架构可以包括一个或多个通信网络控制元件、接入网络元件、无线电接入网络元件、接入服务网络网关或诸如基站(bs)、接入点或enb的基站收发器,其控制相应覆盖区域或小区并且利用其一个或多个通信元件或终端设备(诸如ue或具有类似功能的另一设备,诸如调制解调器芯片组、芯片、模块等,其也可以是ue的一部分或作为单独的元件附接到ue等)能够经由一个或多个信道进行通信以用于发送若干类型的数据。此外,可以包括诸如网关网络元件、策略和计费控制网络元件、移动性管理实体、操作与维护元件等之类的核心网络元件。也取决于实际的网络类型的所描述的元件的一般功能和互连是本领域技术人员已知的并且在对应的规范中描述,使得此处省略其详细描述。然而,应当注意,除了下文详细描述的那些之外,可以将若干附加的网络元件和信令链接用于向或从通信元件或如ue的终端设备和如无线电网络控制器的通信网络控制元件的通信。通信网络还能够与诸如公共交换电话网络或因特网之类的其他网络进行通信。通信网络还可以能够支持云服务的使用。应当理解,bs和/或enb或其功能可以通过使用适合于这样的使用的任何节点、主机、服务器或接入节点等来实现。此外,所描述的网络元件和通信设备(诸如如ue的终端设备或用户设备、如bs或enb的小区的通信网络控制元件、如ap的接入网络元件等)以及对应功能(如本所所描述)可以通过软件(例如通过用于计算机的计算机程序产品)和/或通过硬件实现。在任何情况下,为了执行它们各自的功能,对应地使用的设备、节点或网络元件可以包括控制、处理和/或通信/信令功能所需的若干部件、模块、单元、组件等(未示出)。这样的部件、模块、单元和组件可以包括例如包括用于执行指令和/或程序和/或用于处理数据的一个或多个处理部分的一个或多个处理器或处理器单元、用于存储指令、程序和/或数据的用于用作处理器或处理部分等的工作区域的存储或存储器单元或部件(例如rom、ram、eeprom等)、用于通过软件输入数据和指令的输入或接口部件(例如软盘、cd-rom、eeprom等)、用于向用户提供监视和操纵可能性的用户接口(例如,屏幕、键盘等)、用于在处理器单元或部分的控制下建立链接和/或连接的其他接口或部件(例如有线和无线接口部件、包括例如天线单元等的无线电接口部件、用于形成无线电通信部分的部件等)等,其中形成接口的相应部件(诸如无线电通信部分)也可以位于远程站点(例如,无线电头端或无线电台等)上。应当注意,在本说明书中,处理部分不应仅被认为表示一个或多个处理器的物理部分,而是也可以被认为由一个或多个处理器执行的所引用的处理任务的逻辑划分。根据本发明的某些方面,提出了一种标识、收集和最终构成在云部署中的高负载的分布式网络元件上执行的网络过程的追踪数据的方法。根据本发明的某些方面,提供了解决追踪到高负载的分布式系统的主要矛盾的方式:1.性能开销与追踪细节的深度之间的矛盾(追踪级别);2.追踪信息搜集的量与在分布式组件和追踪收集实体(例如nms)之间的通信信道的容量之间的矛盾。3.故障位置的随机性质和针对追踪级别的预限定设置之间的矛盾,如上所述4.搜集网络过程的非常详细信息的要求与提供订户的隐私和匿名的要求之间的矛盾。因此,本发明的某些方面旨在提供用于自动标识、收集和构成追踪数据的高效方法,其可以用于云部署的网络管理系统中的自动根本原因分析。此外,本发明的某些方面旨在解决以下问题:-云中的网络过程的高效标识的问题;-用于网络过程的追踪数据的高效收集的问题;-当需要从在网络的过程故障的点之前的步骤恢复完整的追踪数据时的“反向追踪”的问题。事件的标签首先,根据本发明的某些方面,提出了将“唯一标记物”(下文也称为“标签”)分配给进入系统的每个事件并且每次当“标记”事件进入新实体时使计数器递增。在这样的情况下,每个标签跨系统是唯一的,使得每个网络过程可以被呈现为标签事件的收集。因此,网络过程得到跨网络唯一的标识。在下文中,将更详细地描述根据本发明的某些方面的事件的标签。根据本发明的某些方面,描述了在云部署中标识在网络元件(或ne的群组)中生成的事件的方法。该方法提供了解决针对任何事件的追踪和根本原因分析而出现的两个主要问题的方式,即:-事件的相对顺序是什么,例如事件从时间线的角度来看如何彼此相关,哪一个是先前的,并且哪一个是后续的一个;-事件彼此“偶然链接”吗,例如它们属于相同的网络过程还是它们彼此独立。因此,本发明的一个目的是提供可以用于云部署的网络管理系统中的自动根本原因分析的事件的高效自动收集方法。收集原始数据(日志、接口的追踪、计数器和警报)的完整集合对于及时的情况解决和根本原因分析非常重要。这些活动包括以下步骤:-由ne收集计数器和警报提供(以标识问题的主要范围);-从连接到网络的网络分析器收集日志,以从网络接口得到初始数据;-收集由ne的程序块所生成的现有日志和其他诊断记录(通过使用专有日志查看器,如ida工具或其他框架);-如果ne的日志的详细程度不足以进行分析(其是最常见的情况,因为在生产模式下,ne不会生成任何详细日志),则当要提供更多细节时ne切换到更详细的日志级别;-比较来自不同源的日志和追踪,以过滤出相关事件(日志实体、消息追踪、分组解码等);-将事件重新排序为长期(chronically)序列;-逆向工程,以恢复关于消息流如何发起的全貌以及ne和网络对应物的输入/输出是什么;-做出关于问题的根本原因的结论,并提出解决的建议。上述过程的主要问题是跨许多源(ne、网络接口)搜集信息片和手动过滤相关块和消息(如通过使用唯一订户的标识(如imsi、guti(全球唯一临时标识符)等),比较时间戳,比较消息序列号等)。作为底线,应当注意,这种活动未形式化;需要人员的大量手动工作和高资格。因此,意图提供由一个或几个网络元件所生成的事件的完全自动和形式化的序列,所述序列按时间排序并偶然链接——仅该序列意图用于完全自动根本原因分析。为了更好地理解以下描述的目的,提供了在下文中使用的术语的一些限定。然而,应当注意,这些限定仅意图促进理解本发明,而不意图将相应的术语限制于本文提供的限定。网络过程:网络过程是由网络元件一致地执行(例如,在云环境中,而不限于此)的操作的有限序列。这样的操作序列可以在若干实体中执行,如但不限于ue、enb、mme、gw、ims、pcrf等)。网络过程具有初始和最终状态;其具有发起网络过程执行的初始事件(如,例如但不限于用户或网络活动事件、定时器期满事件等)。用于网络过程的追踪的问题是恢复针对在网络过程执行中涉及的每个网络元件的每个后续操作的确切序列和相关参数。事件:其中ne应对输入数据并提供输出以用于进一步处理的决策点。网络中的典型事件的示例如下所述。-(1)通过在ne中发起新的网络过程来应对传入消息(如,例如由mme响应于来自移动终端的附接_请求消息而发起的附接过程);-(2)应对请求消息并提供发送具有一些原因代码(如由mme向hss关于订户的凭证的创建请求)的新消息的响应;以及-(3)应对具有错误原因代码的响应的请求消息(如由mme利用拒绝“订阅不允许漫游”终止附接过程)。事件序列:唯一排序的事件序列,其彼此偶然链接。网络中的事件的序列的示例如下。-从上述事件示例,事件序列(1)->(2)->(3)是事件的序列;-从上述事件示例,事件序列(1)->(3)->(2)不是事件的序列;-从上述事件示例,事件序列(1)->(2”)->(3)不是事件的序列,其中事件(2”)属于某个其他事务/订户。因此,本发明的某些方面限定了如何从在一个或许多网络元件上执行的网络过程导出事件的序列的过程。当事件的追踪开始时,每个发源的过程都通过唯一索引进行标签,该索引是通过表2中所示的以下算法来创建和更新的。信息元素类型描述追踪序列id十六进制循环唯一序列,在过程开始时创建递增跳(hop)十六进制线性递增,每次当ne在网络过程期间执行任何动作时更新表2。在下文中,将参照图4解释标签的示例。如图4所示,在enb1处开始以实线箭头表示的一个附接过程,并在hss响应之后终止,并且在enb2处开始以虚线箭头表示的另一个附接过程,并在hss响应之后继续朝向sgw。enb1从ue/订户1接收到附接请求,并用9e105b8e-000自动标签事件,其中9e105b8e是唯一追踪序列id,并且000是该序列内的跳。此外,enb2从ue/订户2接收到附接请求,并用9e105b8f-000自动标签事件,其中9e105b8f是唯一追踪序列id,并且000是该序列内的跳。唯一追踪序列id可以基于跨网络系统预先约定的任何算法导出。例如,它可以是(开始网络过程的网络元件的任何网络接口的)mac(媒体访问控制)地址加上循环序列中的接下来的整数之和。唯一追踪序列id的长度是循环的,并且取决于应当追踪的事件的循环的量。例如,在追踪网络中的10亿个事件之后,可以再次重新输入相同的序列。当更新事件的追踪时,对于执行的每个操作,ne更新标签的“递增跳”部分,并保留唯一追踪序列id。操作前的标签的第一示例是9e105b8e-000,其中9e105b8e是唯一追踪序列id,并且000是该序列内的跳。然后,mme向hss发送用于订户1的更新位置请求,并自动更新标签事件中的跳。然后,hss返回错误代码“不允许漫游”。操作后的标签的示例为9e105b8e-001,其中9e105b8e是唯一追踪序列id,并且001是该序列内的接下来的跳。此时,可以标识错误条件,并在检索标记有标签9e105b8e的所有事件时标识所有的前提条件。操作前的标签的第二示例是9e105b8f-000,其中9e105b8f是唯一追踪序列id,并且000是该序列内的跳。然后,mme向hss发送用于订户2的更新位置请求,并自动更新标签事件中的跳。然后,hss返回原因代码“ok(好)”。操作后的标签的示例是9e105b8f-001,其中9e105b8f是唯一追踪序列id,并且001是该序列内的接下来的跳。接下来,跨网络收集事件的追踪。为了追踪任何网络过程,算法从具有给定的追踪序列id的所有网络元件收集事件的序列,并按递增跳值重新排序事件。因此,可以区分两个过程,并标识针对它们之一的故障的确切根本原因,如表3中所示。追踪序列id跳根本原因9e105b8e000enb/---9e105b8e001hss/不允许漫游——网络过程终止9e105b8f000enb’/---9e105b8f001hss/ok9e105b8f002mme/...9e105b8f003sgw/...表3。应当注意,表3仅是示例,并且网络过程通常包含多于两个事件和多于两个网络元件,因此典型的表将更长,并且将包含导致特定故障的所有前提条件。作为接下来的步骤,执行针对故障的网络过程的反向追踪。应当注意,根据本发明的某些方面,反向追踪总是可能的,因为在默认情况下特征是“在整个网络之上总是开启的”。在其中网络过程“在中间”故障并且期望对引起故障的场景进行重新策划的情况下,那么过滤出具有适当的唯一追踪序列id的标签,并且跳在该选择内重新排序——其立即呈现恢复的场景。鉴于上述情况,根据本发明的某些方面,提供了用于复杂网络(特别是在云部署中)的“内置的、总是开启的、在整个网络之上的”可追踪性,并且非常适合于网络管理自动化,而同时实现针对事件标识和事件的追踪的标准和高效的方式。因此,总而言之,将唯一标记物分配给进入系统的每个事件,并且每次当标记事件进入新实体时计数器递增。每个标签跨系统是唯一的,使得每个网络过程可以被呈现为标签事件的收集。因此,网络过程得到跨网络的唯一标识。存储用于每个标签事件的追踪信息元素作为接下来的步骤,存储用于每个标签事件的追踪信息元素。当在网络元件上执行网络过程时,信息(其与给定的网络过程相关)的追踪被存储在本地存储器(例如,网络元件的追踪缓冲器)中。“追踪信息元素”是针对网络过程/标签事件的特定阶段规定的必要追踪信息,如例如过程调用的参数、消息的(多个)信息元素、处理的结果等。“追踪信息元素”或多或少等于传统地被置于日志细节中的信息。追踪信息元素的细节程度取决于追踪的级别。也就是说,在最深级别处,它可以复制原始网络过程的完整信息元素。系统的每个组件应对它所处理的网络过程的“追踪缓冲器”。追踪缓冲器具有有限的容量,并且被组织为队列缓冲器,因此新的事件来到缓冲器,并且当超过缓冲器的容量时被一个接一个处置。图5是图示网络元件50的本地存储器(即,追踪缓冲器51)中的追踪信息元素的存储的图。因此,网络元件根据追踪缓冲器的容量存储在各个网络元件上执行的所有网络过程的追踪的信息元素。收集跨网络元件的网络过程的追踪表示在网络元件上执行网络过程后,跟着追踪信息元素和标签事件的设置。如上所述,标签事件通过借助于“唯一追踪序列id(utsid)”来过滤标签事件而选择,并顺着“跳id”重新排序。换句话说,网络过程流序列跨整个网络之上的每个网络元件而恢复。图6是图示在整个网络之上跨网络元件收集用于给定网络过程的追踪信息元素的示例的图。因此,借助于唯一追踪序列id(图6中的“9e105b8e”)所标识的用于给定网络过程的追踪信息元素在整个网络之上借助于跳id(图6中的“000”到“003”)按适当的次序被收集。基于所收集的追踪信息元素反向恢复网络过程的流在这方面,应当注意,追踪的其他方法(如3gppts32.422中所规定的)不提供反向追踪的可能性。即,根据常规方法,如上所述,在将发生潜在问题之前,应激活追踪过程。以相同的方式,在传统的追踪过程中,在可以收集网络过程故障有关的任何追踪信息之前,应激活具有最深程度细节的追踪。如果必须通过收集“过去”的细节信息对故障做出反应,则不可能返回复原。追踪信息元素一跨网络被收集,它们就被适当地排序(按照时间线和“偶然链接”)。取决于选择,针对反向恢复过程选择了一些可用的追踪收集实体。所选择的追踪收集实体将汇集(pool)网络元件并检索特定网络过程有关的相关数据。这保证了服务在容量方面是可扩展的,并且可以根据实际需要部署。图7是图示网络过程的反向追踪的动态弹性的图。因此,(以预限定程度的细节而收集的)追踪信息可用于自动根本原因分析。用于云部署的分布式追踪的弹性根据本发明的某些方面的方法特别地作为特征用于云部署,因为在云部署中,网络元件功能可以跨物理上彼此分离的分离的计算单元(计算机)而分布。在该部署中,它们可能不具有用于传统的日志记录过程(如通过ftp将日志存储和传递到nms)的常见存储设备,如硬盘。此外,在云部署中,网络元件的数量可能相当高,使得显然存在针对单个追踪收集实体(nms)的加载的限制。因此,用于云部署的任何方法都将提供按比例放大和缩小的可能性,这取决于实际负载。图8是图示用于独立网络元件的追踪功能的典型实现的图。如图8所示,预先限定了o&m接口到nms的吞吐容量。图9是图示当使用用于云部署的不可扩展追踪方法时的可能瓶颈的图。如图9所示,到nms的接口的吞吐容量可能变化,并且因此可能是针对传送原始数据的瓶颈。不管现有的追踪实现(例如,订户追踪)(其假定发起特别是针对追踪目的的特殊网络过程)如何,根据本发明的某些方面的所提出的方法被设计为“内置的、总是开启的、在整个网络之上的”特征,其对于设备、订户标识和网络配置是透明的。本发明的上述方面的实现可以通过将一个信息元素(例如,称为“事件的标签”)添加到信令消息来在现有的产品(如enb、mme和/或网关)中实现。不需要其他深入的重新策划。根据本发明的某些方面的所提出的标记事件的方法具有以下优点:-非常低容量开销(仅一个标签的标注标识事务和事件);-非常良好的可扩展性,因为标签的信息元素(十六进制值)可以非常高效地排序,这与日志文件的传统文本搜索相矛盾;-存在在第三方系统和网络之上追踪事务的理论能力,如果它们可以保留或忽略标签信息的话;此外,根据本发明的某些方面的所提出的方法特别适合于网络元件的基于云的部署,因为:-存在可用于处理追踪和存储结果的空闲的计算和存储器资源;-当所有日志以集中的方式存储在网络元件的永久存储驱动器上时,云中的配置网络元件(分布式和虚拟化单元)可能偏离传统设计;-由于网络的更大的容量和复杂度而存在针对网络管理自动化和网络故障排除的附加要求。在实现的情况下,存在以实时模式透明地追踪从无线电装置到核心网络的事务的可能性。所提出的方法的使用的重要情况是具有自动化能力的网络管理系统,其提供用于针对网络故障的根本原因分析的功能。表4示出了根据本发明的某些方面的如3gppts432.422中规定的当前订户和设备追踪与“标签事件的追踪”之间的比较。参数如3gppts32.422中规定的“订户和设备追踪”特征“标签事件的追踪”容量低——仅有限量的追踪可以同时针对少数订户发起;高——潜在追踪网络中的所有事件;可扩展性低——仅某些元件是可追踪的(mme、sgw、hss、pgw);高——潜在地任何网络元件可以是可追踪的;兼容性低——仅3gpp,如果特征支持的话高——潜在地非3gpp系统可以被追踪,如果系统可以忽视或忽略具有标签的信息元素的话反向追踪否——不可能返回追踪事件,如果特征未被激活是——在如果故障发生的情况下,可以返回追踪事件,因为所有标签被存储直到它们被改写表4。在下文中,给出了用于根据本发明的某些方面的方法的容量估计。然而,应当注意,这仅是示例,并且本发明当然不限于这样的示例。该限制与位于每个网络元件中的“追踪缓冲器”的容量相关。在下文中,评估了针对3追踪模式的情况所需的容量,并估计了“存储器消耗对容量”关系。假设:-轻度的追踪每个事件消耗0.1kb的追踪信息;-中等的追踪每个事件消耗1kb的追踪信息;-完全的追踪每个事件消耗5kb的追踪信息;主要的观察结果在于容量具有对事务速率和追踪深度的线性依赖性。针对最大可能追踪深度(当针对日志记录每个信令消息/事件而预留5kb时),对于以每秒100个事务运行的网络元件,实现了500mb/秒的吞吐量。因此,按每个网络元件为追踪缓冲器分配2gb的存储器,保证了保持4秒的追踪(假设大多数网络过程持续不多于500ms,如典型的imsi附接花费100-200ms到生产网络中)。图10是图示容量估计的图,并且示出了对于中等追踪和轻度追踪,分别可以保证20秒和100秒的追踪。在下文中,关于图11至13进行对本发明的某些实施例的更一般描述。图11是图示根据本发明的示例版本的方法的示例的流程图。根据本发明的示例版本,该方法可以在如例如网络管理实体等的收集实体中实现。该方法包括在步骤s111中,在收集实体处收集来自网络中的多个网络元件的用于多个网络过程的追踪信息元素,追踪信息元素包括追踪序列标识符和索引,追踪序列标识符标识特定网络过程并且索引标识该网络过程内的特定事件;以及在步骤s112中,基于追踪序列标识符和索引按照用于每个网络过程的后续次序布置所收集的追踪信息元素。此外,该方法包括在步骤s113中,基于所收集和布置的用于网络过程的追踪信息元素来恢复网络过程的流。根据本发明的示例版本,追踪序列标识符对于每个网络过程是唯一的,并且在网络过程的开始时被创建。根据本发明的示例版本,索引与相应网络过程的追踪序列标识符相关联,并且在相应网络过程期间在事件发生时线性递增。根据本发明的示例版本,该方法在网络元件的基于云的部署中实现。图12是图示根据本发明的示例版本的方法的另一示例的流程图。根据本发明的示例版本,该方法可以在如例如基站(例如,nb或enb)、移动性管理实体(如mme)或网关(如pgw、sgw)等的网络元件中实现。该方法包括在步骤s121中通过网络元件将追踪序列标识符分配给通信系统中的特定网络过程,以及在步骤s122中通过网络元件将索引分配给特定网络过程内的特定事件。追踪序列标识符对于通信系统中的每个网络过程是唯一的,并且在过程的开始时被创建。根据本发明的示例版本,索引与相应网络过程的追踪序列标识符相关联,并且在相应网络过程期间在特定事件发生时线性递增。根据本发明的示例版本,该方法在网络元件的基于云的部署中实现。图13是示出根据本发明的示例版本的装置的示例的框图。在图13中示出了图示被配置为实现本发明的上述方面的装置130的配置的电路框图。应当注意,图13所示的装置130可以包括除了下文描述的那些元件或功能以外的若干另外的元件或功能,其为了简化起见而在本文省略,因为它们对于理解本发明不是必要的。此外,该装置还可以是具有类似功能的另一设备,诸如芯片组、芯片、模块等,其也可以是装置的一部分或作为单独元件附接到该装置等。装置130可以包括执行由程序等给出的指令的处理功能或处理器131,诸如cpu(中央处理单元)等。处理器131可以包括专用于特定处理的一个或多个处理部分(如下所描述的),或者处理可以在单个处理器中运行。用于执行这样的特定处理的部分也可以作为离散元件提供,或者在一个或另外的处理器或处理部分内提供,例如诸如在如cpu的一个物理处理器中或者在若干物理实体中。附图标记132表示连接到处理器131的收发器或输入/输出(i/o)单元(接口)。i/o单元132可以用于与一个或多个其他网络元件、实体、终端等进行通信。i/o单元132可以是包括朝向若干网络元件的通信设备的组合单元,或者可以包括具有用于不同网络元件的多个不同接口的分布式结构。附图标记133表示可用于例如存储由处理器131执行的数据和程序和/或作为处理器131的工作存储的存储器。处理器131被配置为执行与上述方面相关的处理。特别地,装置130可以在收集实体(如例如网络管理实体等)中实现或者可以是收集实体的一部分,并且可以被配置为执行如结合图11所描述的方法。因此,处理器131被配置为在收集实体处收集来自网络中的多个网络元件的用于多个网络过程的追踪信息元素,所述追踪信息元素包括追踪序列标识符和索引,所述追踪序列标识符标识特定网络过程,并且所述索引标识所述网络过程内的特定事件;以及基于所述追踪序列标识符和所述索引按照用于每个网络过程的后续次序布置所收集的追踪信息元素,以及基于所收集和布置的用于网络过程的追踪信息元素来恢复网络过程的流。根据本发明的其他示例版本,装置130可以被实现在网络元件(如例如基站(例如,nb或enb)、移动性管理实体(如mme)或网关(如pgw、sgw)等)中,或者可以是网络元件的一部分,并且可以被配置为执行如结合图12描述的方法。因此,处理器131被配置为通过网络元件将追踪序列标识符分配给通信系统中的特定网络过程,以及通过网络元件将索引分配给所述特定网络过程内的特定事件。追踪序列标识符对于通信系统中的每个网络过程是唯一的,并且在网络过程的开始时被创建。针对关于装置130的功能的进一步细节,参考如结合图11和12描述的根据本发明的示例版本的方法的描述。因此,应当注意,用于在收集实体中使用的装置和用于在网络元件中使用的装置通常具有相同的结构组件,其中这些组件被配置为分别执行收集实体或网络元件的相应功能,如上所述。在装置的前述示例性描述中,使用功能块仅描述了与理解本发明的原理相关的单元/部件。该装置可以分别包括对于其相应操作所必需的另外的单元/部件。然而,在本说明书中省略对这些单元/部件的描述。装置的功能块的布置不被解释为限制本发明,并且功能可以由一个块执行或进一步分割成子块。当在前述描述中说明装置(或一些其他部件)被配置为执行某个功能时,这要被解释为等同于说明如下的描述:一个(即至少一个)处理器或对应的电路潜在地与存储在相应装置的存储器中的计算机程序代码协作被配置为使得装置至少执行由此提到的功能。此外,这样的功能要被解释为可通过具体配置的用于执行相应功能的电路或部件等同地实现(即,表述“被配置为……的单元”被解释为等同于诸如“用于……的部件”之类的表述)。出于如上文所描述的本发明的目的,应当注意的是-可能被实现为软件代码部分并且在装置(作为设备、装置和/或其模块的示例,或作为包括装置和/或因此模块的实体的示例)处使用处理器运行的方法步骤是软件代码独立的并且可以使用任何已知或未来开发的编程语言来规定,只要保留由方法步骤所限定的功能;-通常,任何方法步骤适合于作为软件或通过硬件实现,而不改变方面/实施例及其在所实现的功能方面的修改的想法;-可能被实现为以上限定的装置处的硬件组件或其任何(多个)模块(例如,执行根据如上所述的方面/实施例的装置的功能的设备)的方法步骤和/或设备、单元或部件是硬件独立的,并且可以使用任何已知或未来开发的硬件技术或这些的任何混合来实现,诸如mos(金属氧化物半导体)、cmos(互补mos)、bimos(双极mos)、bicmos(双极cmos)、ecl(发射极耦合逻辑)、ttl(晶体管-晶体管逻辑)等,其使用例如asic(专用ic(集成电路))组件、fpga(现场可编程门阵列)组件、cpld(复杂可编程逻辑器件)组件或dsp(数字信号处理器)组件;-设备、单元或部件(例如,以上限定的装置或其相应的单元/部件中的任何一个)可以被实现为单独的设备、单元或部件,但这并不排除它们以遍及系统的分布式方式实现,只要保留设备、单元或部件的功能;-装置可以由半导体芯片、芯片组或(硬件)模块表示,包括这样的芯片或芯片组;然而,这并不排除装置或模块的功能被实现为(软件)模块中的软件(诸如包括用于执行/在处理器上运行的可执行软件代码部分的计算机程序或计算机程序产品)而不是被硬件实现的可能性;-设备可以被认为是装置或多于一个装置的组装件,例如,无论是在功能上彼此协作还是在功能上彼此独立但在相同的设备外壳中。一般,应当注意,可以分别通过任何已知的部件以硬件和/或软件实现根据上述方面的相应的功能块或元件,如果其仅适于执行相应部分的所描述功能的话。所提到的方法步骤可以在单独功能块中或通过单独设备实现,或者方法步骤中的一个或多个可以在单个功能块中或通过单个设备实现。通常,任何方法步骤都适合于实现为软件或通过硬件实现,而不改变本发明的想法。设备和部件可以被实现为单独的设备,但这并不排除它们以遍及系统的分布式方式实现,只要保留设备的功能。这样的和类似的原理被认为是本领域技术人员已知的。本描述的意义中的软件包括软件代码,因此,包括用于执行相应功能的代码部件或部分或者计算机程序或计算机程序产品,以及潜在地在其处理期间体现在有形介质上或体现在信号中或芯片中的软件(或计算机程序或计算机程序产品),所述有形介质诸如在其上存储有相应数据结构或代码部件/部分的计算机可读(存储)介质。应当注意,上述的方面/实施例以及一般和具体示例仅出于说明性目的而提供,并绝不意图将本发明限于其。更确切地说,意图是涵盖落入所附权利要求的范围内的所有变化和修改。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1