一种高可靠性分布式冗余环网的实现方法

文档序号:7656116阅读:443来源:国知局
专利名称:一种高可靠性分布式冗余环网的实现方法
技术领域
本发明涉及建立一种分布式高可靠性工业通信网络的方法,引入精密时间 后,可以对网络故障,进行屏蔽、记录、分析、自维护等。从而提高网络的可靠性、安全性。
背景技术
当前,我国化工、煤炭、石油天然气等工业领域安全事故频繁发生,这不 仅给企业带来了巨大的经济损失,而且给人身、设备、环境造成了极大威胁, 己经成为制约我国经济发展与和谐社会建设的重要因素。同时,随着我国经济的快速发展和工业制造水平不断提高,工业生产所需 的机器设备越来越先进,生产过程的自动化程度大幅度提高,这就使得生产工 艺和设备变得复杂,因而设备的安全性也变得极为重要,安全控制系统能够有 效避免工作人员在操作中发生人机事故,保障人员的生命安全和设备安全。网络冗余技术是提高工业控制系统可靠性的重要手段,网络冗余技术就是 对网络通信链路进行冗余备份以确保信息传输的可靠性和稳定性。工业控制系 统中的控制网络按照拓扑结构可以分为环型网络、总线型网络和网状网络。对 于不同网络拓扑,所采用网络冗余方式和故障恢复策略不同的。如ABB公司针 对环形网络提出了环网冗余协议(Media Redundancy Protocol, MRP);西门子 公司针对总线型网络提出了并行冗余协议(Parallel Redundancy Protocol, PRP); FF针对网状网络提出了网状冗余协议(Cross-network RedundancyProtocol, CRP)。我司提出分布式冗余协议(Distributed Redundancy Protocol, DRP),并由我司负责实现和验证该协议,目前,IEC的TC65工作组正在制定关 于网络冗余的国际标准IEC62439。在网络冗余技术方面,我国提出的DRP协议, 已经提交到国际电工委员会的TC65相关工作组,也正在积极开展研究,以期在 国际标准的制定与发展过程中占有一席之地。以上几种方法只实现了链路中断的网络冗余保护的方法,不能对网络中的 接点故障进行准确的判定、分析、记录、定位等。一种分布式冗余环网的实现方法,不仅实现网络的快速冗余倒换,而且还 可以对网络中发生的事件进行准确的记录、分析、定位和维护。即可以判定, 网络是是为工业现场提供高可靠性网络提供了一种可操作的方法。发明内容本发明解决的问题本发明是一种分布式冗余环网的实现方法,其主要解决工业网络可靠性的以下 几个问题*具体实施解决各种故障下的系统的稳定性1、 网络中某个交换机全部损坏。2、 网络中交换机,交换芯片的正常,CPU芯片或程序不工作。3、 链路连接不正常 环行网络中,解决单一固定根节点故障时出现网络风暴 *精确定位网络故障类型、记录、分析。*提高网络的冗余时间 发明内容要点*环行网络中,网络中没有固定的根节点,网络的维护是每个网元在预先组态 的时间域中完成网络的维护,在下一个时间域内由另外的网元对环行网络进 行维护。*在工业交换机中引入精密同步时钟的概念,交换机可以接受外部时钟源或本 机的实时时钟作为网络的主时钟。网络中的其他网元节点同步网络中的高级 别的时钟。*网络中发生链路中断时,网络失去同步平衡,故障节点发送链路中断的PDU 报文,迅速上报链路中断的故障,网络中原来处于Blocked状态的端口迁移 到Forwarding状态。并刷新相关的FDB表。网络进行倒换。故障的网络节 点的链路端口由原来的Forwarding状态迁移到Blocked状态。*记录网络中发生的事件,并上传。參当网络链路恢复后,网络重新进行同步,同步正常后,开始进入时间域内的分布维护;此时网络不做倒换。端口状态不做迁移。 參在网络正常状态下,精密同步时钟信息在1秒内发送一次,实现的网元接点的时间同步。*精密时钟是逐级传送,当上级发送的带Sync信息的PDU报文三次以上,相 临的接点没有回应含Delay Request信息的PDU报文,可以认为该网元接点 的CPU故障,网络出现状态开始迁移,网络由环闭进入环开的状态。网络中 原来处于Blocked状态的端口迁移到Forwarding状态,故障交换机的相临的 两个网元将与故障交换机相连的端口由原来的Forwarding状态迁移到Blocked状态。同时网络的各个网元节点刷新FDB表。改变网络路由。记录、并网络中发生的事件,并上传。*本发明中的报文类型同步信息SYNC PDU报文(含网络根接点ID)回应Delay—Req信息的PDU报文Follow up PDU报文Delay—Resp PDU报文链路中断故障信息PDU报文链路中断故障恢复信息PDU报文 网络周期性维护检测PDU报文


图1流程2环开网络拓扑3故障判定流程图具体实施方式
1.1网络初始化过程1. l.l网络自由竞争根节点 网络初始化的过程中,釆用竞争的机制;竞争条件下是所有设备的端 口处于BLOCKED状态。*所有环上的节点的两个环端口都处于BLOCKED状态。*每个设备在启动后向相邻的每个设备发送检测PDU报文。參所有网元节点等待最长的三个预置最长宏周期,检测网上是否有周期性报文,如果没有收到周期性报文,进入竞争主站状态。 *每个设备向相邻的每个节点发送检测PDU报文,选举主站节点。MAC地址最小的节点为首个主站。 *首个主站节点在确认自己为主站时,将自己的首环端口由Blocked状态迁移到Fbrwarding状态,次环端口仍然处于由Blocked。 參当环中的其他节点判定自己不是主站时,将自己的两个环端口由Blocked状态迁移到Forwarding状态。如图11. L2时钟同步过程争网络中的根接点选举结束后,进入时钟同步过程。
Master clock开始发送FTP报文 *从节点与上级时钟交互PTP报文。
从节点与上级时钟同步 时钟在环行网络的的两个离Master clock最远点的链路形成passive端 口。1.2链路故陣检测1.2.1环行网络正常工作*系统精密同步时钟完毕后,网络中的所有网元,根据预先组态的各自时间域的顺序,轮流发送网络维护测试报文。 *网络正常时,每个网元节点在自己的时间域内发送网络周期性维护检测报文,并将自己的状态写入该报文中,当每个网元收到自己发送的维护测试报文后,将该报文终结。 *网络中其它网元节点,收到上级发送的维护测试报文后,将自己的状态写入该报文末端,并进行转发。1.2.1环闭合--开启*当网络中周期性报文发送的过程中,网络中的环网链路发生中断,此时链路 中断相邻的两个网元上报链路故障报文。该报文优先级最高。*网络中的其他网元在接收到该链路故障报文后,将原来的Blocked状态的端 口迁移到Forwarding状态,同时刷新各个网元节点的FDB表。*网络链路中断的节点,将自己中断的链路端口由原来的Forwarding状态迁移 到Blocked状态。*链路故障的交换机记录根据UNK-DONWE事件,链路故障的事件和故障的 时间。*网络中其他网元收到上报故障报文后,记录某个网元故障的事件和收到该信 息的时间。如图2.*网络处于平静后,仍然根据时间域发送周期性报文,如交换机A只能收到其 他交换机发送的报文,而不能收到自己的报文。1.2.2环开启——闭合*网络链路故障恢复后,表现为交换机可以转发其他交换机发送的报文,但此时该端口处于BLOCK状态。 *恢复故障链路的交换机记录LINK-UP的事件。參轮值的交换机此时收到别的交换机发送的周期性报文和自己发送的周期性报文。所有交换机在收到自己发出的保文后记录网络恢复的事件。 攀环网的端开点仍然在原来的故障位置。 *网络不产生任何倒换操作。*当下一次网络出现故障时,目前处于BLOCKED的端口将从BLOCKED状 态迁移到FORWARDING状态。1.3CPU故障检测 1.3.1CPU故障检测故障类型设备LINK正常,能转发业务数据报文,但不能转发业务报文。 故障检测方法在一定时间段内发送精密同步时钟报文,根据收到精密时钟报 文的情况来判定交换机的CPU是否处在故障状态。故障设备相邻的两个网元的直联端口,立即从FORWARDING状态下迁移到 BLOCKED状态。同时向网络发送故障PDU报文。1.3.2CPU故障设备恢复 当故障设备恢复后,重新回到网络中,此时直联的相邻两个交换机 都处于BOLCKED状态,恢复后的设备的两个端口也处于 BLOCKED状态。 新加入的设备和相邻的两个设备,共计三台设备,会启动一个初始化 过程,来决定那台设备将自己的端口 Block,而其他两台设备将所有环端口都转换为Fowording状态。
当故障恢复后,该设备与网络中其它设备进行同步,进行时钟修订,启用自己周期检测。
同步完毕后,在轮到自己的时间域时发送网络维护检测报文。1.4整体设备故障检测与恢复 1.4.1整体设备故障检测故障类型描述 设备掉电 设备linK正常但不能通信 1.4丄1设备掉电设备掉电的情况下,LINK信号不存在,相临的设备端口处于LINK-DONEW的 状态,处理检测机理与1.2中的情况一样。 1.4丄1设备全部故障设备LINK状态正常但不能转发所有数据报文 故障检测方法在一定时间段内发送精密同步时钟报文,根据收到精密时钟报文的情况来判定交换机的CPU是否处在故障状态。或者根据周期性报文来检测网络的故障。
故障设备相邻的两个网元的直联端口,立即从FORWARDING状态下迁移到BLOCKED状态。1.4.2损坏设备恢复 当故障设备恢复后,重新回到网络中,此时直联的相邻两个交换机都处于BOLCKED状态,恢复后的设备的两个端口也处于 BLOCKED状态。 该网元等待最长的两个宏周期,在最长的两个宏周期内收到,网络 周期性报文,自动将自己的根更改成网络中的根,同时将一个主环 端口由BLOCKED状态更改为FORWORDING状态。 相邻的两个网元在两个宏周期内,收到自己发出的周期性报文后将 自己的BLOCKED状态端口 ,由BLOCKED状态更改为 FORWORDING状态。 当故障恢复后首先,该交换机与网络中其它设备进行同步,进行时钟 修订,启用自己周期检测。 同步完毕后,在轮到自己的时间域时发送网络维护检测报文。 其他网元记录收到自己发出的周期性报文的时间,LINK-UP的事件。 端口由BLOCKED迁移到FORWARDING的事件。如图3.1.5历史故障的记录与查询用户可以采用查询命令查询网络历史故障记录。
权利要求
1、一种分布式冗余环网的实现方法,其特征在于网络中网元时间同步的状态下,每个设备根据预先组态的时间域,轮流在自己时域内对网络进行维护,避免了环形网络中主站失效时产生的网络风暴。同时定义了网络发生改变时,故障的上报机制,可定位、上报如下网络故障网络中链路故障、链路正常CPU故障、程序故障。并能对网络的故障进行精确定位,在50台设备组网条件下网络故障时,数据恢复时间小于300ms,网络恢复不产生任何倒换时间.所述的分布式冗余环网的实现方法,其特征在于当网络拓扑改变后,网络的精密同步路径将自动更新到精度最高的时钟源。所述的分布式冗余环网的实现方法,其特征在于网络故障时,网络发生一次倒换,网络恢复时,网络不再产生倒换,提高了网络的安全性和数据传输的可靠性。所述的分布式冗余环网的实现方法,其特征在于能清晰在任意一台设备上获取当前网络拓扑和链接关系。
2、 根据权利要求1,其特征在于系统支持网络精密时钟协议,能自动的接受 外时钟源的时钟信号,并能让网络中的其他网元同步到主时钟源上,同步精 度最高可达到百ns级。
3、 根据权利要求1,其特征在于系统支持网络精密时钟协议,能设置网络中 某个网元的实时时钟为网络中的主时钟,并能让网络中其他网元同步到主时 钟源上。
4、 根据权利要求书1、 2、 3,其特征在于网络中的所有网元都有精密的实时 时钟,每个网元能准确的记录网络中发生的事件。能准确的提供历史记录, 实现故障精确定位。
5、 根据权利要求书1,其特征在于网络中各个网元需要预先配置发送周期性 报文的时间域。
6、 根据权利要求书1、 5,其特征在于每个网元在自己的时间域内,发送网 络维护报文。
7、 根据权利要求书l,其特征在于网络恢复时,不再产生任何倒换时间;网 络故障时,系统倒换时间小于300ms。
8、 根据权利要求书l,其特征在于对网络中任意网元节点产生的上述故障, 都可以清晰定位故障类型和发生故障的网元节点。
9、 根据权利要求书1,其特征在于当系统产生倒换时,网元可以快速重新同 步时间。
10、 根据权利要求1、 2、 3,其特征在于相邻站间每个1秒钟发送一次精密时 钟报文,校对网络上网元的实时时钟,并确认相邻节点的CPU工作状态。
11、 根据权利要求l,其特征在于当网络出现链路中断时,网络进入非周期状 态,允许发送告警的非周期性报文。根据权利要求1、 11,其特征在于网络上各个网元,在收到网络出现故障报告时, 退出周期性检测模式,记录网络事件,并停止发送轮流维护信息。
全文摘要
一种高可靠性分布式冗余环网(Distributed Redundancy Protocol,简称DRP)的实现方法;本发明其特征在于引入精密同步时钟后,组成环形网络的所有设备中,没有主站,每个设备根据预先组态的各自的时间域,轮流维护环形网络的状态。该发明解决了网络中某个交换机全部损坏;某个交换机的交换功能正常,CPU芯片或程序不工作;链路连接不正常等各种问题情况下的网络高可靠性问题。并实现了网络故障精确定位,记录故障发生过程及准确时间,快速恢复的功能。在网络故障恢复时不产生任何倒换时间,提高了工业网络的可靠性。
文档编号H04L1/22GK101252426SQ200710121620
公开日2008年8月27日 申请日期2007年9月11日 优先权日2007年9月11日
发明者张国刚, 张鸿雁, 薛百华, 陈凡民, 马化一 申请人:北京东土科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1