网元检测方法、装置、网元及计算机可读存储介质与流程

文档序号：31868861发布日期：2022-10-21 17:50阅读：51来源：国知局

1.本技术涉及网络通信领域，特别涉及一种网元检测方法、装置、网元及计算机可读存储介质。

背景技术：

2.随着网络虚拟化技术和软件定义型网络技术的发展，网关设备实现了从传统的带宽网络网关(broadband network gateway，bng)到虚拟化带宽网络网关(virtual broadband network gateway，vbng)的转变，vbng包括控制面(control plane，cp)和用户面(user plane，up)，cp和up为具有不同功能的网元。vbng在进行网络传输的过程中，需要进行cp与up之间的检测，以确定网元是否发生故障，并及时基于故障事件进行处理。相关技术中，采用探测机制实现检测，该探测机制是指：cp和up基于单一的探测路径，互相发送探测报文。
3.在实现本技术的过程中，发明人发现现有技术至少存在以下问题：上述方法中一旦某一网元在几个检测周期内没有接收到对端网元的探测报文，则确定该对端网元发生故障，而对于网元来说，发生故障并不代表网元不能工作，因此，这种检测机制的准确率较低，容易发生误判。

技术实现要素：

4.为了解决现有技术网元检测的准确率较低，容易发生误判的问题，本技术实施例提供了一种网元检测方法、装置、网元及计算机可读存储介质。该技术方案如下：
5.第一方面，提供了一种网元检测方法，该方法由第一网元执行，该第一网元为控制面网元和用户面网元中的一个，第二网元为该控制面网元和该用户面网元中的另一个，该第一网元上具有多个第一状态机组，每个第一状态机组设置在该第一网元的不同类型的物理器件上，该第二网元上具有与该第一网元上各个第一状态机组分别对应的多个第二状态机组，该方法包括：
6.在该第一网元上运行该多个第一状态机组；
7.响应于该多个第一状态机组中存在目标状态机组，则确定该第二网元正常运行，该目标状态机组是指接收到来自对应第二状态机组的检测报文的第一状态机组；
8.响应于该多个第一状态机组均未接收到来自于对应第二状态机组的检测报文，则确定该第二网元发生故障。
9.在本技术实施例中，在第一网元和第二网元的不同类型的物理器件上设置多个状态机组，通过多个第一状态机组接收对应第二状态组发送的检测报文，实现第一网元对第二网元的检测，避免了因第二网元中单一物理器件发生故障，而导致第一网元误判第二网元发生故障的情况，提高了检测的准确率。
10.在本技术实施例中，若该第一网元为cp网元，则第二网元为up网元，在第一网元为up网元的情况下，第二网元为cp网元。
11.在一些实施例中，每个状态机组包括一个处于正常状态的状态机以及至少一个处于异常状态或者初始化状态的状态机。
12.状态机具有三个状态，正常状态、初始化状态以及异常状态。
13.在一些实施例中，该每个状态机组内的状态机分别设置在同一类型的不同物理器件上。例如，在cp网元上设置第一状态机组a和第一状态机组b，其中，第一状态机组a包括2个状态机，该2个状态机分别设置在cp网元的iovm1和iovm2上，第一状态机组b包括2个状态机，该2个状态机分别设置在cp网元的upmng1和upmng2上。
14.在本技术实施例中，由于将状态机设置在同一类型的不同物理器件上，使得在运行时即便同一类型某个物理器件故障，也不影响状态机组的整体运行。
15.在一些实施例中，该方法还包括：
16.响应于运行有处于正常状态的状态机的物理器件发生故障，则将与该状态机属于同一状态机组的任一个状态机从初始化状态切换至正常状态。
17.在一些实施例中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，位于同一网元上的不同状态机组所采用的报文传输协议相同或不同。
18.在一些实施例中，该多个第一状态机组以及对应的多个第二状态机组采用openflow协议，或，该多个第一状态机组以及对应的多个第二状态机组采用双向转发检测协议，或，位于同一网元上的不同状态机组分别采用openflow协议和双向转发检测协议。
19.在一些实施例中，该第一网元为控制面网元，该确定该第二网元发生故障之后，该方法还包括：
20.向该第二网元的备用第二网元发送控制指令，该控制指令用于指示进行主备切换。
21.通过控制面网元对用户面网元的主备切换进行控制，从而能够保障用户面网元能够正常提供服务。
22.第二方面，提供了一种网元检测装置，该装置包括多个功能模块，用于执行如第一方面所提供的网元检测方法中的对应步骤。
23.第三方面，提供了一种网元，该网元包括通信总线、至少一个网络接口、存储器以及至少一个处理器，该通信总线用于在上述组件之间传送信息，该至少一个网络接口用于与其它设备或通信网络通信，该存储器保存有程序代码，该至少一个处理器通过读取并执行该存储器中保存的程序代码实现上述第一方面中网元检测方法的任一步骤。
24.第四方面，提供了一种计算机可读存储介质，当该计算机可读存储介质中的程序代码由网元的处理器执行时，使得网元能够执行上述第一方面中网元检测方法的任一步骤。
附图说明
25.图1是本技术实施例提供的一种网元检测方法的实施环境示意图；
26.图2是本技术实施例提供的一种vbng的结构示意图；
27.图3是本技术实施例提供的一种网元300的结构示意图；
28.图4是本技术实施例提供的一种网元检测方法的步骤流程图；
29.图5是本技术实施例提供的一种网元检测方法的步骤流程图；
30.图6是本技术实施例提供的一种网元检测方法的示意图；
31.图7是本技术实施例提供的一种网元检测方法的步骤流程图；
32.图8是本技术实施例提供的一种网元检测方法的示意图；
33.图9是本技术实施例提供的一种网元检测方法的步骤流程图；
34.图10是本技术实施例提供的一种网元检测方法的示意图；
35.图11是本技术实施例提供的一种网元检测方法的步骤流程图；
36.图12是本技术实施例提供的一种网元检测方法的示意图；
37.图13是本技术实施例提供的一种网元检测方法的步骤流程图；
38.图14是本技术实施例提供的一种用户接入设备访问网站服务器的示意图；
39.图15是本技术实施例提供的一种用户接入设备访问网站服务器的示意图；
40.图16是本技术实施例提供的一种网元检测装置的结构示意图。
具体实施方式
41.为使本技术的目的、技术方案和优点更加清楚，下面将结合附图对本技术实施方式作进一步地详细描述。
42.bng作为传统的宽带接入网关设备，在用户宽带接入场景中用于用户认证、接入控制、流量调度等。随着各种互联网业务的层出不穷，对bng设备的要求不断提高，传统的bng设备基于软件定义型网络技术(software defined network，sdn)和网络虚拟化技术(network functions virtualization，nfv)转变为vbng。vbng实现了cp与up分离，与传统的bng相比在网络传输效率和可靠性上都有了大幅度的提升。
43.以vbng技术涉及到的网元为例，本技术实施例提供了如图1所示的实施环境，该实施环境包括vbng网元100、用户接入设备103和网站服务器104。
44.其中，vbng网元100包括：cp网元101、up网元102。
45.cp网元101为运行在服务器上的(virtual network function，vnf)，该服务器可以是通用的x86服务器，也可以是其他类型的服务器，本技术实施例对此不作限定。cp网元中包括两种虚拟物理器件：虚拟接口板(input output virtual machine，iovm)和用户面管理器件(user plane management，upmng)。
46.其中，cp网元用于控制和管理多个up网元，进行多个up网元之间用户、流量、资源的调度，并提供多种网络服务，参见图2，cp网元所提供的多种网络服务包括但不限于：基于以太网点对点协议(point-to-point protocol over ethernet，pppoe)提供用户接入网络服务，基于远程用户认证协议(remote authentication dial in user service，radius)提供用户接入网络认证服务，提供认证、授权、计费(authentication authorization accounting，aaa)服务。
47.up网元102为运行在服务器上的vnf或者传统的(physical network function，pnf)，该pnf可以是宽带远程接入服务器(broadband remote access server，bras)或者其他具有转发功能的网关设备，本技术实施例对此不作限定。以up网元为pnf为例，up网元中包括两种物理器件：接口板(line interface processing unit，lpu)和主控板(main processing unit，mpu)。
48.up网元用于接收用户接入设备发送的报文并与cp网元进行多种信息交互，同时提
供多种网络服务，up网元所提供的多种网络服务包括但不限于：网络安全机制服务(quality of service，qos)，报文组播，基于访问控制列表(access control lists，acl)对接收到的报文进行过滤，基于多协议标签交换机制(multi-protocol label switch，mpls)进行报文数据高速传输。
49.cp网元101与up网元102通过有线或无线的方式进行直接或间接的连接。可选地，cp网元与up网元之间通过3个接口进行报文的传输，包括：
50.(1)业务接口(service interface，is)：业务接口采用通用协议扩展下的虚拟可扩展局域网(virtual extensible local area network-generic protocol extension，vxlan-gpe)技术对用户发送的报文进行封装，响应于up网元接收到用户端通过用户接入设备发送的用户接入报文，通过该业务接口将该用户接入报文进行封装并发送给cp网元。
51.(2)管理接口(management interface，im)：管理接口采用网络配置协议(network configuration protocol，netconf)对报文进行封装，cp网元通过该管理接口向up网元下发配置，如qos的配置等，up网元通过该管理接口向cp网元上报该up网元的运行状态信息。
52.(3)控制接口(control interface，ic)：控制接口采用控制面用户面分离协议(control plane and user plane separated protocol，cusp)对报文进行封装，cp网元对up网元发送的用户接入报文进行处理，并生成用户转发表，通过该控制接口向up网元下发用户转发表，该用户转发表用于控制up网元对用户流量的负载。
53.用户接入设备103可以是路由器、交换机、主机等，网站服务器104为任一平台的后台服务器。用户接入设备103与up网元102通过有线或无线的方式进行直接或间接的连接，up网元102与网站服务器104通过有线或无线的方式进行直接或间接的连接，本技术实施例对此不作限定。
54.可选地，图1所示的实施环境中可以包括多个cp网元101和多个up网元102，图1中仅以一个cp网元101和一个up网元102为例进行说明。
55.图3是本技术实施例提供的一种网元300的结构示意图。图3所示的网元300用于执行网元检测方法所涉及的操作，该网元300为cp网元或up网元，如图3所示，该网元包括至少一个处理器301、通信总线302、存储器303以及至少一个网络接口304。
56.处理器301例如是通用中央处理器(central processing unit，cpu)、网络处理器(network processer，np)、图形处理器(graphics processing unit，gpu)、神经网络处理器(neural-network processing units，npu)、数据处理单元(data processing unit，dpu)、微处理器或者一个或多个用于实现本技术方案的集成电路。例如，处理器301包括专用集成电路(application-specific integrated circuit，asic)，可编程逻辑器件(programmable logic device，pld)或其组合。pld例如是复杂可编程逻辑器件(complex programmable logic device，cpld)、现场可编程逻辑门阵列(field-programmable gate array，fpga)、通用阵列逻辑(generic array logic，gal)或其任意组合。
57.通信总线302用于在上述组件之间传送信息。通信总线302可选地分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。
58.存储器303例如是只读存储器(read-only memory，rom)或可存储静态信息和指令的其它类型的静态存储设备，又如是随机存取存储器(random access memory，ram)或者可
存储信息和指令的其它类型的动态存储设备，又如是电可擦可编程只读存储器(electrically erasable programmable read-only memory，eeprom)、只读光盘(compact disc read-only memory，cd-rom)或其它光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其它磁存储设备，或者是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其它介质，但不限于此。存储器303例如是独立存在，并通过通信总线302与处理器301相连接。或者可选地存储器303和处理器301集成在一起。
59.网络接口304使用任何收发器一类的装置，用于与其它设备或通信网络通信。网络接口304包括有线网络接口，可选地还包括无线网络接口。其中，有线网络接口例如为以太网接口。以太网接口例如是光接口、电接口或其组合。无线网络接口例如为无线局域网(wireless local area networks，wlan)接口，蜂窝网络接口或其组合等。
60.在一些实施例中，处理器301包括一个或多个cpu，如图3中所示的cpu0和cpu1。
61.在一些实施例中，网络设备300可选地包括多个处理器，如图3中所示的处理器301和处理器305。这些处理器中的每一个例如是一个单核处理器，又如是一个多核处理器。这里的处理器可选地指一个或多个设备、电路、和/或用于处理数据(如计算机程序指令)的处理核。
62.可选地，处理器301通过读取存储器303中保存的程序代码310实现下述实施例中的方法，或者，处理器301通过内部存储的程序代码实现下述实施例中的方法。在处理器301通过读取存储器303中保存的程序代码310实现下述实施例中的方法的情况下，存储器303中保存实现本技术实施例提供的网元检测方法的程序代码。
63.处理器301实现上述功能的更多细节请参考下面各个方法实施例中的描述，在这里不再重复。
64.本技术实施例还提供了一种包括程序代码的计算机可读存储介质，例如包括程序代码的存储器303，上述程序代码可由网元300的处理器301执行以完成网元检测方法。可选地，计算机可读存储介质可以是只读内存(read-only memory，rom)、随机存取存储器(random access memory，ram)、只读光盘(compact-disc read-only memory，cd-rom)、磁带、软盘和光数据存储设备等。
65.图4是本技术实施例提供的一种网元检测方法的步骤流程图，该方法由第一网元执行，若该第一网元为cp网元，则第二网元为up网元，在第一网元为up网元的情况下，第二网元为cp网元，该第一网元上具有多个第一状态机组，每个第一状态机组设置在该第一网元的不同类型的物理器件上，该第二网元上具有与该第一网元上各个第一状态机组分别对应的多个第二状态机组。其中，任一状态机组中的任一状态机能够通过上述的3个接口中的任一接口，向对端网元对应的状态机组发送检测报文，并接收对端网元对应状态机组所发送的检测报文，该状态机包括三个状态：初始化状态、正常状态和异常状态。其中，初始化状态表示该状态机处于未生效状态，即该状态机没有开始发送检测报文，正常状态表示该状态机正在生效，且该状态机所对应的物理器件正常运行，异常状态表示该状态机停止发送检测报文，且该状态机所对应的物理器件发生故障。每个状态机组包括一个处于正常状态的状态机，以及至少一个处于异常状态或者初始化状态的状态机。响应于运行有处于正常状态的状态机的物理器件发生故障，则将与该状态机属于同一状态机组的任一个状态机从
初始化状态切换至正常状态。
66.如图4所示，该网元检测方法包括以下步骤：
67.步骤401，在该第一网元上运行该多个第一状态机组。
68.在一些实施例中，在该第一网元上运行多个第一状态机组，该多个第一状态机组独立的进行检测报文的接收，互不影响。以一组第一状态机组为例，该第一状态机组对应于第二网元上的一个第二状态机组，而该第一状态机组用于接收第二网元上对应的该第二状态机组所发送的检测报文，而不会接收其他第二状态机组所发送的检测报文。
69.步骤402，响应于在预设周期内，该多个第一状态机组中存在目标状态机组，则该第一网元确定该第二网元正常运行，该目标状态机组是指接收到来自对应第二状态机组的检测报文的第一状态机组。
70.该多个第一状态机组中存在目标状态机组，意味着第二网元上还有正常运行的状态机组，也即是，第二网元并未发生整体故障，仍能够运行。
71.其中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，位于同一网元上的不同状态机组所采用的报文传输协议的方式包括下述中的任一种：
72.一种可能的实现方式中，响应于位于同一网元上的不同状态机组所采用的报文传输协议相同，则该多个第一状态机组以及对应的多个第二状态机组采用openflow协议，或，该多个第一状态机组以及对应的多个第二状态机组采用双向转发检测协议(bidirectional forwarding detection，bfd)。
73.另一种可能的实现方式中，响应于位于同一网元上的不同状态机组所采用的报文传输协议相同，则位于同一网元上的不同状态机组分别采用openflow协议和bfd协议。
74.步骤403，响应于在预设周期内，该多个第一状态机组均未接收到来自于对应第二状态机组的检测报文，则该第一网元确定该第二网元发生故障。
75.该多个第一状态机组均未接收到来自于对应第二状态机组的检测报文，意味着第二网元上没有正常运行的状态机组，也即是，第二网元发生了整体故障，无法保持运行状态。
76.若该第一网元为cp网元，在确定该第二网元发生故障之后，该第一网元向该第二网元的备用第二网元发送控制指令，该控制指令用于指示进行主备切换。
77.本技术实施例所提供的网元检测方法，在第一网元和第二网元的不同类型的物理器件上设置多个状态机组，通过多个第一状态机组接收对应第二状态组发送的检测报文，实现第一网元对第二网元的检测，避免了因第二网元中单一物理器件发生故障，而导致第一网元误判第二网元发生故障的情况，提高了检测的准确率。
78.需要说明的是，在本发明所提出的技术方案中，预设周期即为第一网元检测到第二网元发生故障需要的时间，由于该技术方案在第一网元和第二网元上布置了多个状态机组，任一状态机组中的状态机变为异常状态，不会影响其余状态机组发送检测报文，因此在预设周期设置较短的情况下不会发生第一网元误判第二网元发生故障。通过实验验证，基于本发明所提出的技术方案，预设周期的设置从分钟级缩减至秒级，即第一网元检测到第二网元故障所用的时间从分钟级缩减至秒级。而在第二网元发生故障的场景下，重新建立网络连接所需的时间为，第一网元检测到第二网元故障所需时间与备用第二网元进行主备切换所需时间的总和，因此该技术方案能够缩短网络重新连接的时间，提升了网络的恢复
效率，使用户无法感知到网络连接的中断，从而提升了用户的使用体验。
79.基于上述图4所对应的实施例中描述的方法，下面以第一网元为cp网元，第二网元为up网元为例进行说明，也即是，本技术实施例是以cp网元对up网元进行检测、且up网元中单一lpu发生故障的场景为例来说明。图5是本技术实施例提供的一种网元检测方法的步骤流程图，图6是本技术实施例提供的一种网元检测方法的示意图，参见图5和图6，该网元检测方法的流程包括：
80.501、在cp网元上运行第一状态机组a和第一状态机组b。
81.在本技术实施例中，该第一状态机组a和第一状态机组b独立的进行检测报文的接收和发送，互不影响。其中，第一状态机组a包括2个状态机，该2个状态机分别设置在cp网元的iovm1和iovm2上，第一状态机组b包括2个状态机，该2个状态机分别设置在cp网元的upmng1和upmng2上。
82.上述up网元上具有与该cp网元上的第一状态机组a和第一状态机组b分别对应的2个第二状态机组，该2个第二状态机组为第二状态机组a’和第二状态机组b’。其中，第二状态机组a’与第一状态机组a相对应，也即是，第一状态机组a用于接收来自该第二状态机组a’的检测报文，可选地，该第一状态机组a用于向该第二状态机组a’发送检测报文，该第二状态机组a’包括2个状态机，该2个状态机分别设置在up网元的mpu1和mpu2上，第二状态机组b’与第一状态机组b相对应，也即是，第一状态机组b用于接收来自该第二状态机组b’的检测报文，可选地，该第一状态机组b用于向该第二状态机组b’发送检测报文，该第二状态机组b’包括2个状态机，该2个状态机分别设置在up网元的lpu1和lpu2上。
83.其中，每个状态机组中的多个状态机是主备关系，也即是，在正常运行过程中，一个状态机组中只包括一个处于正常状态的状态机，其他状态机处于初始化状态或者异常状态，以保证每次仅有一个状态机能够进行检测报文的接收或发送，避免出现报文冲突等现象。
84.502、响应于在预设周期内，第一状态机组a接收到来自对应第二状态机组a’的检测报文，则cp网元确定up网元正常运行。
85.其中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，位于同一网元上的不同状态机组所采用的报文传输协议的方式，与步骤402同理，在此不再赘述。
86.在一些实施例中，响应于第一状态机组a接收到来自对应第二状态机组a’的检测报文，即该第一状态机组a为目标状态机组，则cp网元确定up网元中的mpu均正常运行，且up网元正常运行。
87.503、响应于在预设周期内，第一状态机组b没有接收到来自对应第二状态机组b’的检测报文，则cp网元确定up网元中的任一lpu发生故障且up网元正常运行。
88.在一些实施例中，响应于在预设周期内，第一状态机组b没有接收到来自对应第二状态机组b’的检测报文，则cp网元确定第二状态机组b’中的任一状态机为异常状态，即该状态机所对应的lpu发生故障，且cp网元确定up网元正常运行。
89.在一些实施例中，响应于up网元中任一处于正常状态的状态机的lpu发生故障，则up网元将该状态机从正常状态切换至异常状态，并将第二状态机组b’中的任一状态机从初始化状态切换至正常状态。例如，响应于up网元中处于正常状态的状态机b
’‑
1的lpu1发生
故障，则up网元将该状态机b
’‑
1由正常状态切换至异常状态，并将第二状态机组b’中lpu2所对应的状态机b
’‑
2从初始化状态切换至正常状态。
90.在一些实施例中，cp网元指示up网元对状态机进行状态切换，包括下述任一种方式：
91.一种可能的实现方式中，响应于cp网元确定第二状态机组b’中的任一状态机对应的lpu发生故障，则cp网元向up网元发送第一指示消息，该第一指示消息用于指示up网元对第二状态机组b’中的状态机进行状态切换。响应于up网元接收到该第一指示消息，up网元将发生故障的lpu所对应的状态机从正常状态切换至异常状态，并将第二状态机组b’中的任一状态机从初始化状态切换至正常状态。
92.另一种可能的实现方式中，响应于在多个预设周期内，第一状态机组b均没有接收到来自对应第二状态机组b’的检测报文，则cp网元向up网元发送第一指示消息。响应于up网元接收到该第一指示消息，up网元将发生故障的lpu所对应的状态机从正常状态切换至异常状态，并将第二状态机组b’中的任一状态机从初始化状态切换至正常状态。
93.需要说明的是，在up网元对第二状态机组b’中的状态机进行状态切换的过程中，第二状态机组a’中处于正常状态的状态机依然可以继续发送或接收探测报文。
94.本技术实施例所提供的网元检测方法，对于up网元中单个lpu发生故障的场景，cp网元能够基于所设置的多个第一状态机组接收对应的多个第二状态机组发送的检测报文，确定up网元正常运行，避免了因单个lpu故障而导致cp网元误判up网元发生故障的情况，提高了检测的准确率。
95.基于上述图4所对应的实施例中描述的方法，下面以第一网元为cp网元，第二网元为up网元为例进行说明，也即是，本技术实施例是以cp网元对up网元进行检测、且up网元中单一mpu发生故障的场景为例来说明。图7是本技术实施例提供的一种网元检测方法的步骤流程图，图8是本技术实施例提供的一种网元检测方法的示意图，参见图7和图8，该网元检测方法的流程包括：
96.701、在cp网元上运行第一状态机组a和第一状态机组b。
97.本步骤701与步骤501同理，在此不再赘述。
98.702、响应于在预设周期内，第一状态机组b接收到来自对应第二状态机组b’的检测报文，则cp网元确定up网元正常运行。
99.其中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，位于同一网元上的不同状态机组所采用的报文传输协议的方式，与步骤402同理，在此不再赘述。
100.在一些实施例中，响应于第一状态机组b接收到来自对应第二状态机组b’的检测报文，即该第一状态机组b为目标状态机组，则cp网元确定up网元中的lpu均正常运行，且up网元正常运行。
101.703、响应于在预设周期内，第一状态机组a没有接收到来自对应第二状态机组a’的检测报文，则cp网元确定up网元中的任一mpu发生故障且up网元正常运行。
102.在一些实施例中，响应于在预设周期内，第一状态机组a没有接收到来自对应第二状态机组a的检测报文，则cp网元确定第二状态机组a中的任一状态机为异常状态，即该状态机所对应的mpu发生故障，且cp网元确定up网元正常运行。
103.在一些实施例中，响应于up网元中任一处于正常状态的状态机的mpu发生故障，则up网元将该状态机从正常状态切换至异常状态，并将第二状态机组a’中的任一状态机从初始化状态切换至正常状态。例如，响应于up网元中处于正常状态的状态机a
’‑
1的mpu1发生故障，则up网元将该状态机a
’‑
1由正常状态切换至异常状态，并将第二状态机组a’中mpu2所对应的状态机a
’‑
2从初始化状态切换至正常状态。
104.在一些实施例中，cp网元指示up网元对状态机进行状态切换，包括下述任一种方式：
105.一种可能的实现方式中，响应于cp网元确定第一状态机组a’中的任一状态机对应的mpu发生故障，则cp网元向up网元发送第二指示消息，该第二指示消息用于指示up网元对第二状态机组a’中的状态机进行状态切换。响应于up网元接收到该第二指示消息，up网元将发生故障的mpu所对应的状态机从正常状态切换至异常状态，并将第二状态机组a’中的任一状态机从初始化状态切换至正常状态。
106.另一种可能的实现方式中，响应于在多个预设周期内，第一状态机组a均没有接收到来自对应第二状态机组a’的检测报文，则cp网元向up网元发送第二指示消息。响应于up网元接收到该第二指示消息，up网元将发生故障的mpu所对应的状态机从正常状态切换至异常状态，并将第二状态机组a’中的任一状态机从初始化状态切换至正常状态。
107.需要说明的是，在up网元对第二状态机组a’中的状态机进行状态切换的过程中，第二状态机组b’中处于正常状态的状态机依然可以继续发送或接收探测报文。
108.本技术实施例所提供的网元检测方法，对于up网元中单个mpu发生故障的场景，cp网元能够基于所设置的多个第一状态机组接收对应多个第二状态机组发送的检测报文，确定up网元正常运行，避免了因单个mpu故障而导致cp网元误判up网元发生故障的情况，提高了检测的准确率。
109.基于上述图4所对应的实施例中描述的方法，下面以第一网元为cp网元，第二网元为up网元为例进行说明，也即是，本技术实施例是以cp网元对up网元进行检测、且up网元中所有物理器件均发生故障的场景为例来说明。图9是本技术实施例提供的一种网元检测方法的步骤流程图，图10是本技术实施例提供的一种网元检测方法的示意图，参见图9和图10，该网元检测方法的流程包括：
110.901、在cp网元上运行第一状态机组a和第一状态机组b。
111.本步骤901与步骤501同理，在此不再赘述。
112.902、响应于在预设周期内，第一状态机组a和第一状态机组b均未接收到来自于对应第二状态机组的检测报文，则cp网元确定up网元发生故障。
113.其中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，位于同一网元上的不同状态机组所采用的报文传输协议的方式，与步骤402同理，在此不再赘述。
114.在一些实施例中，响应于第一状态机组a和第一状态机组b均未接收到来自于对应第二状态机组的检测报文，则cp网元确定up网元中所有物理器件均发生故障，即up网元发生故障。
115.需要说明的是，引起上述故障的原因并不一定是up网元所有物理器件均故障，在一种场景下，up网元中存在一个类型的物理器件均发生故障，则此时，该up网元自动重启，
在该up网元重启的过程中，该up网元停止工作，导致该up网元中所有的物理器件均停止工作，从而引起上述故障。例如，若up网元中所有的mpu均发生故障，则在上述流程中cp网元会将该up网元识别为发生故障。
116.903、cp网元向up网元的备用up网元发送控制指令，该控制指令用于指示进行主备切换备，up网元基于该控制指令进行主备切换。
117.在一些实施例中，cp网元向备用up网元发送控制指令，响应于该控制指令，该备用up网元将控制指令所携带的用户接入信息和路由信息进行存储，并基于控制指令所携带的用户转发表进行主备切换。其中，该用户接入信息包括用户上网账户、密码和用户上网权限等信息，该路由信息为访问网站服务器的路由地址。
118.备用up网元进行主备切换的过程包括两个部分：刷新用户接入设备的转发策略，以及，刷新网站服务器的网关路由，具体说明如下。
119.(1)备用up网元基于该用户转发表，刷新用户接入设备的转发策略，该转发策略为用户接入设备中的物理地址(media access control address，mac)表，将用户接入设备发送用户接入报文的目的地址变为备用up网元，从而实现用户的迁移。
120.(2)备用up网元基于该用户转发表，刷新网站服务器的网关路由，将网站服务器发送报文的目的地址变为备用up网元，完成主备切换的过程。
121.本技术实施例所提供的网元检测方法，对于up网元中所有物理器件均发生故障的场景，cp网元能够基于所设置的多个第一状态机组接收对应多个第二状态机组发送的检测报文，准确的检测出up网元发生故障，并针对该故障事件进行相应的处理。
122.基于上述图4所对应的实施例中描述的方法，下面以第一网元为up网元，第二网元为cp网元为例进行说明，也即是，本技术实施例是以up网元对cp网元进行检测、且cp网元中单一upmng发生故障的场景为例来说明。图11是本技术实施例提供的一种网元检测方法的步骤流程图，图12是本技术实施例提供的一种网元检测方法的示意图，参见图11和图12，该网元检测方法的流程包括：
123.1101、在up网元上运行第一状态机组a和第一状态机组b。
124.在本技术实施例中，该第一状态机组a和第一状态机组b独立的进行检测报文的接收，互不影响。其中，第一状态机组a包括2个状态机，该2个状态机分别设置在up网元的mpu1和mpu2上，第一状态机组b包括2个状态机，该2个状态机分别设置在up网元的lpu1和lpu2上。
125.上述cp网元上具有与该up网元的第一状态机组a和第一状态机组b分别对应的2个第二状态机组，该2个第二状态机组为第二状态机组a’和第二状态机组b’。其中，第二状态机组a’与第一状态机组a相对应，也即是，第一状态机组a用于接收来自该第二状态机组a’的检测报文，可选地，该第一状态机组a用于向该第二状态机组a’发送检测报文，该第二状态机组a’包括2个状态机，该2个状态机分别设置在cp网元的iovm1和iovm2上，第二状态机组b与第一状态机组b’相对应，也即是，第一状态机组b用于接收来自该第二状态机组b’的检测报文，可选地，该第一状态机组b用于向该第二状态机组b’发送检测报文，该第二状态机组b’包括2个状态机，该2个状态机分别设置在cp网元的upmng1和upmng2上。
126.其中，每个状态机组中的多个状态机是主备关系，也即是，在正常运行过程中，一个状态机组中只包括一个处于正常状态的状态机，其他状态机处于初始化状态或者异常状
态，以保证每次仅有一个状态机能够进行检测报文的接收或发送，避免出现报文冲突等现象。
127.1102、响应于在预设周期内，第一状态机组a接收到来自对应第二状态机组a’的检测报文，则up网元确定cp网元正常运行。
128.其中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，位于同一网元上的不同状态机组所采用的报文传输协议的方式，与步骤402同理，在此不再赘述。
129.在一些实施例中，响应于第一状态机组a接收到来自对应第二状态机组a的检测报文，即该第一状态机组a为目标状态机组，则up网元确定cp网元正常运行。
130.1103、响应于在预设周期内，第一状态机组b没有接收到来自对应第二状态机组b’的检测报文，则up网元确定cp网元中的任一upmng发生故障且cp网元正常运行。
131.在一些实施例中，响应于在预设周期内，第一状态机组b没有接收到来自对应第二状态机组b的检测报文，则up网元确定第二状态机组b’中的任一状态机为异常状态，即该状态机所对应的upmng发生故障，且up网元确定cp网元正常运行。
132.在一些实施例中，响应于cp网元中任一处于正常状态的状态机的upmng发生故障，则cp网元将该状态机从正常状态切换至异常状态，并将第二状态机组b’中的任一状态机从初始化状态切换至正常状态。例如，响应于cp网元中处于正常状态的状态机b
’‑
1的upmng1发生故障，则cp网元将该状态机b
’‑
1由正常状态切换至异常状态，并将第二状态机组b中upmng2所对应的状态机b
’‑
2从初始化状态切换至正常状态。
133.在一些实施例中，up网元指示cp网元对状态机进行状态切换，包括下述任一种方式：
134.一种可能的实现方式中，响应于up网元确定第二状态机组b’中的任一状态机对应的upmng发生故障，则up网元向cp网元发送第三指示消息，该第三指示消息用于指示cp网元对第二状态机组b’中的状态机进行状态切换。响应于cp网元接收到该第三指示消息，cp网元将发生故障的upmng所对应的状态机从正常状态切换至异常状态，并将第二状态机组b’中的任一状态机从初始化状态切换至正常状态。
135.另一种可能的实现方式中，响应于在多个预设周期内，第一状态机组b均没有接收到来自对应第二状态机组b’的检测报文，则up网元向cp网元发送第三指示消息。响应于cp网元接收到该第三指示消息，cp网元将发生故障的upmng所对应的状态机从正常状态切换至异常状态，并将第二状态机组b’中的任一状态机从初始化状态切换至正常状态。
136.需要说明的是，在cp网元对第二状态机组b’中的状态机进行状态切换的过程中，第二态机组a’中处于正常状态的状态机依然可以继续发送或接收探测报文。
137.本技术实施例所提供的网元检测方法，对于cp网元中单个upmng发生故障的场景，up网元能够基于所设置的多个第一状态机组接收对应第二状态组发送的检测报文，确定cp网元正常运行，避免了因单个upmng故障而导致up网元误判cp网元发生故障的情况，提高了检测的准确率。
138.需要说明的是，对于cp网元中单一iovm故障的场景，up网元基于图7与图8所对应的实施例中同理的方法对cp网元进行检测，对于cp网元中所有物理器件均发生故障的场景，up网元基于图9与图10所对应的实施例中同理的方法对cp网元进行检测，在此不再赘
述。
139.基于上述图4所对应的实施例中描述的方法，下面以第一网元为cp网元，第二网元为up网元为例进行说明，也即是，本技术实施例是以cp网元对up网元进行检测为例来说明。图13是本技术实施例提供的一种网元检测方法的步骤流程图，如图13所示，该网元检测方法的流程包括：
140.1301、在cp网元上运行2个第一状态机组。
141.本步骤1301与步骤501同理，在此不再赘述。
142.1302、用户接入设备通过up网元访问网站服务器。
143.其中，该up网元为预设的主用设备，该up网元中存储着用户接入信息和路由信息。
144.在一些实施例中，用户接入设备访问网站服务器的路径如图14用较粗的线条标出的部分所示，响应于用户接入设备接收到用户访问请求，用户接入设备生成相应的请求报文，并将该请求报文发送给该up网元，该up网元将该请求报文转发给网站服务器，并将网站服务器发送的报文转发给用户接入设备，实现用户接入设备对网站服务器的访问。
145.1303、响应于在预设周期内，2个第一状态机组中存在目标状态机组，则cp网元确定up网元正常运行，该目标状态机组是指接收到来自对应第二状态机组的检测报文的第一状态机组。
146.其中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，可选地，第一状态机组a与对应的第二状态机组a’采用openflow协议，第一状态机组b与对应的第二状态机组b’采用bfd协议。
147.在一些实施例中，响应于在预设周期内，2个第一状态机组中存在目标状态机组，则cp网元确定up网元正常运行，包括下述任一项：
148.一种可能的实现方式中，响应于在预设周期内，2个第一状态机组均接收到来自对应第二状态机组的检测报文，即第一状态机组a和第一状态机组b均为目标状态机组，则cp网元确定up网元正常运行。
149.另一种可能的实现方式中，响应于在预设周期内，2个第一状态机组中的任一第一状态机组接收到来自对应第二状态机组的检测报文，即第一状态机组a或第一状态机组b为目标状态机组，则cp网元基于步骤502或步骤702同理的方法确定up网元正常运行，up网元基于步骤503或步骤703同理的方法进行相应状态机的状态切换。
150.需要说明的是，在上述过程中，用户接入设备持续通过该up网元访问网站服务器。
151.1304、响应于在预设周期内，2个第一状态机组均未接收到来自于对应第二状态机组的检测报文，则cp网元确定up网元发生故障。
152.在一些实施例中，本步骤1304与步骤902同理，在此不再赘述。
153.1305、cp网元向up网元的备用up网元发送控制指令，该控制指令用于指示进行主备切换，up网元基于该控制指令进行主备切换。
154.在一些实施例中，本步骤1305与步骤903同理，在此不再赘述。
155.需要说明的是，在上述步骤1304至步骤1305中，用户接入设备中断对网站服务器的访问。
156.需要说明的是，在up网元对cp网元进行检测的场景中，cp网元进行主备切换的过程为：存在至少一个与该cp网元对应的备用cp网元，cp网元实时的将cp网元内存储的数据
复制到该至少一个备用cp网元中，响应于cp网元发生故障，则该至少一个备用cp网元中的任一备用cp网元自动切换为主用设备，进行相关的网络传输任务。
157.1306、用户接入设备通过已完成主备切换的备用up网元访问网站服务器。
158.在一些实施例中，用户接入设备访问网站服务器的路径如图15中用较粗的线条标出的部分所示，响应于用户接入设备接收到用户访问请求，用户接入设备生成相应的请求报文，并将该请求报文发送给已完成主备切换的备用up网元，该备用up网元将该请求报文转发给网站服务器，并将网站服务器发送的报文转发给用户接入设备，实现用户接入设备对网站服务器的访问。
159.本技术实施例所提供的网元检测方法，在cp网元和up网元的不同类型的物理器件上设置多个状态机组，通过多个第一状态机组接收对应第二状态组发送的检测报文，实现cp网元对up网元的检测，避免了因up网元中单一物理器件发生故障，而导致cp网元误判up网元发生故障的情况，提高了检测的准确率。
160.需要说明的是，上述图5至图13所对应的申请实施例，是以cp网元为vnf，up网元为pnf为例进行说明，因此up网元中各个物理器件与设置在该各个物理器件上的状态机，均为真实的物理设备，cp网元中的各个物理器件与设置在该各个物理器件上的状态机，均为通过软件方式构建的虚拟机，任一通过软件方式构建的虚拟机与其对应的真实物理设备的功能相同。
161.图16是本技术实施例提供的一种网元检测装置的结构示意图，该网元检测装置用于执行上述网元检测方法执行时的步骤，参见图16，该网元检测装置包括：运行模块1601和确定模块1602。
162.运行模块1601，用于在第一网元上运行多个第一状态机组；
163.确定模块1602，用于响应于多个第一状态机组中存在目标状态机组，则确定第二网元正常运行，该目标状态机组是指接收到来自对应第二状态机组的检测报文的第一状态机组；
164.该确定模块1602，用于响应于该多个第一状态机组均未接收到来自于对应第二状态机组的检测报文，则确定该第二网元发生故障。
165.在一些实施例中，每个状态机组包括一个处于正常状态的状态机以及至少一个处于异常状态或者初始化状态的状态机。
166.在一些实施例中，该每个状态机组内的状态机分别设置在同一类型的不同物理器件上。
167.在一些实施例中，该装置还包括：
168.切换模块，用于响应于运行有处于正常状态的状态机的物理器件发生故障，则将与该状态机属于同一状态机组的任一个状态机从初始化状态切换至正常状态。
169.在一些实施例中，该第一状态机组以及对应的第二状态机组采用相同的报文传输协议，位于同一网元上的不同状态机组所采用的报文传输协议相同或不同。
170.在一些实施例中，该多个第一状态机组以及对应的多个第二状态机组采用openflow协议，或，该多个第一状态机组以及对应的多个第二状态机组采用双向转发检测协议，或，位于同一网元上的不同状态机组分别采用openflow协议和双向转发检测协议。
171.在一些实施例中，该装置还包括：
172.发送模块，用于向该第二网元的备用第二网元发送控制指令，该控制指令用于指示进行主备切换。
173.本技术实施例所提供的网元检测装置，在第一网元和第二网元的不同类型的物理器件上设置多个状态机组，通过多个第一状态机组接收对应第二状态组发送的检测报文，实现第一网元对第二网元的检测，避免了因第二网元中单一物理器件发生故障，而导致第一网元误判第二网元发生故障的情况，提高了检测的准确率。
174.需要说明的是：上述实施例提供的网元检测装置在网元检测时，仅以上述各功能模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能模块完成，即将装置的内部结构划分成不同的功能模块，以完成以上描述的全部或者部分功能。另外，上述实施例提供的网元检测装置与网元检测方法实施例属于同一构思，其具体实现过程详见方法实施例，这里不再赘述。
175.本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成，也可以通过程序来指令相关的硬件完成，所述的程序可以存储于一种计算机可读存储介质中，上述提到的存储介质可以是只读存储器，磁盘或光盘等。
176.以上所述仅为本技术的可选实施例，并不用以限制本技术，凡在本技术的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本技术的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何智峰史慧荣彭涛
技术所有人：北京华为数字技术有限公司
我是此专利的发明人

上一篇：基于服务器使移动终端进入驾驶模式的方法、系统与流程
上一篇：一种报文处理的方法及相关装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。