一种面向大尺寸构件的分布式测量系统的智能故障定位方法

文档序号:7641358阅读:183来源:国知局
专利名称:一种面向大尺寸构件的分布式测量系统的智能故障定位方法
技术领域
本发明属于面向大尺寸构件的分布式网络测量技术领域,特别是一种面向大尺寸构件的分布式测量系统的智能故障定位方法。
背景技术
针对构件各项参数的测量系统经历了在零构件上的测量到对大型结构整体测量的发展。目前针对大型结构的整体测量中的方案主要有以下几种,一种是在工业现场环境下常用的基于CAN总线等标准化工业总线的测量架构,基于工业总线的测量方法存在的问题如下,其接线复杂、可靠性较低、标识和排错问题难以解决,同时因为所有引线电缆均需连接到机身下方的测量机柜,而通道数有限测量机柜制约整个系统的可扩展性;在国外,出现了一种能够保证高可靠性的特殊总线技术。该技术通过对线缆的集成降低了外部引线的复杂度,保证了数据传输的可靠性,但代价昂贵,数据采集通道少,在针对大规模节点测量和海量数据处理的测量系统中,由测量设备构成的测量成本就达到千万元人民币以上,因而限制了测量点数目。传统的测量系统是在工业控制机或PC机上安装相应的数据采集设备,就地进行数据采集及测量分析,是一种单机本地化的测量系统。通过上面的分析可知单机本地化的测量系统已不能满足在大尺寸构件上的海量节点大规模测量的需求,需要从集中的孤立的组织结构形式变革为分布式的集成组织结构形式。工业局域网和hternet的出现,使得分布式系统在工业上的应用成为可能。但是分布式测量系统在工业上仍未大量推广,其原因之一是缺乏一套智能化故障定位策略。目前所提出的几项故障定位方法及系统,如基于故障保护器的故障定位系统、基于CAN总线的故障定位系统以及基于专家系统的测量设备故障定位策略。这些方案主要针对较小规模的测量系统,大规模的测量系统中并不适用。

发明内容
本发明技术解决问题克服现有技术的不足,提供一种面向大尺寸构件的分布式测量系统的智能故障定位方法,该方法在分布式测量网络中能够在数百条甚至上千条的多级测量线缆链路中迅速有效地确定测量点及线路的故障点,从而减少故障停机时间,提高了生产效率。本发明的技术解决方案分布式测量系统包括数据采集单元、数据传输单元和中央处理单元,其中数据采集单元包括测量传感器、采集模块和工业控制机,数据传输单元由以太网交换机级联组成,中央处理单元为高性能计算机;数据传输采用多传输链路冗余的策略。本发明将针对该系统上的故障定位方法,将故障类型分为以下五种级别单一节点级别、单一模块级别、单一链路级别、一组链路级别和整个链路级别。针对每一个级别的故障分别有相应的故障判断方法和追踪技术。图2所示为单一节点级别的故障判断方法;某个测量节点(即一个测量传感器) 上所出现故障分为两种类型,一种是测量传感器与采集模块之间的连接线路断开,此时采集点上的数据为连续的极限值(此时相当于链路发生开路,所采集到的电信号为无穷,转化成数字量则为量程的极限值);另外一种是测量传感器处出现虚接的现象,表现为采集点上的数据为正常数据到极限值的不断跳跃。得到该测量节点的异常数据后,采集该节点数据的采集模块会将错误数据传递到工业控制机中,工业控制机进行预处理,分析节点故障类型,并且将故障节点的信息通过数据传输单元传递到中央处理单元。图3给出了单一模块级别的故障判断方法;当某个采集模块出现故障,该采集模块上的数据不能够正常的传到工业控制机上做进一步处理,工业控制机则采集不到该模块上数据,由于各个采集模块都有编号,因此工业控制机可以得到模块的信息,并且将故障模块的信息通过数据传输单元传递到中央处理单元。图4给出了单一链路级别的故障判断方法;当某条链路发生故障时,工业控制机不能够通过数据传输设备将采集并封装好的数据报文发送到中央处理单元,根据图1所示,存在冗余链路,因此工业控制机可以通过冗余传输设备将数据报文发出;对于中央处理单元而言,出现单一链路级别故障时收到的是冗余链路传过来的报文信息,通过对数据报文首部的分析,中央处理单元判断出故障类型。图5所示为一组链路级别的故障判断方法;一组链路级别是指有多个同属于一个交换机的链路上同时出现故障,如图1所示,故障出现的位置为某个底层交换机,或者该底层交换机与顶层交换机的链路。当一组链路发生故障时,该组链路所连接的所有工业控制机均不能够通过正常链路将数据报文发送至中央处理单元,这时中央处理单元接收到这一组工业控制机传递的冗余链路传过来的报文信息。此时,由于通过冗余链路所传递报文的数量较多,为了保证可靠的数据采集,出现一组链路级别故障时,各个工业控制机需要对数据采集策略进行调整,如降低采样率,实施本地存储等措施,从而避免因冗余链路所引起的数据传输失败、资源竞争等问题。整个链路级别是指中央处理单元接收不到任何数据,此时故障分为两种类型一是整个数据采集系统尚未启动,仅仅中央处理单元启动,此时系统中没有任何数据产生;另一种情况则是顶层交换机处发生故障,无论采用正常传输设备还是冗余传输设备,工业控制机上所采集并封装的数据报文均无法正常的发送,这时,整个系统的数据都堆积在工业控制机上,导致整个测量系统崩溃。所以,当整个链路级别发生故障时,尤其是第二种情况, 中央处理单元不但发出最高级的警告信息,并且在数据采集单元中进行本地数据存储,并降低数据的采样率,尽可能使数据的损失程度降至最小。本智能故障定位方法分为数据采集单元故障定位阶段和中央处理单元对整个系统故障定位阶段两个阶段。图6所示是整个系统各种故障方法判断的整体方案。数据采集单元负责判断单一节点级别和单一模块级别两种级别的故障定位;中央处理单元负责判断单一链路级别、一组链路级别和整个链路级别三种级别的故障定位,并且负责提示工作人员全部五种级别故障的类型和位置。1.数据采集单元故障定位阶段首先将连接在工业控制机上的采集模块和采集模块上的AD采集通道进行编号,如果工业控制机能够识别采集模块,则将采集模块所采集到的数据存放在工业控制机中。识别采集模块成功后,分析从采集模块上所采集到的各个通道数据,若采集模块的量程为-5V至5V,则5V和-5V称为极限值;判断该数据是否存在为量程的极限值的数据, 如果存在量程为极限值的数据,则表明出现故障节点,接下来判断该故障类型是接线断开, 还是接线头发生虚接现象;假设出现第k个节点发生故障,如果该节点所对应的采集通道数据始终处于极限值状态,则出现接线断开现象,若该节点所对应的采集通道数据在极限值与正常值之间波动,则出现虚接现象;记录该节点发生节点级别故障,并同时记录所属采集AD采集通道和采集模块编号。单一模块级别故障没有出现,说明该模块能够正常读取数据,查看是否存在单一节点级别的故障,若不存在,则直接将数据报文连同模块的编号统一封装为以太网报文;否则采集将数据、故障节点编号以及故障类型封装为以太网报文;如果工业控制机无法识别某个采集模块,那么采集模块上所采集的数据无法正常传送到工业控制机中,记录该采集模块出现单一模块级别的故障现象,并同时记录该故障模块的编号。并且封装该故障模块的编号至以太网报文,注明发生单一模块级别故障,准备发送;以太网封装完成以后,准备通过数据传输单元发送至中央处理单元,首先检测是否能够通过正常链路连接到中央处理单元,若可以则进行报文发送,并准备接收下一个采集模块发送至工业控制机的数据;否则监测是否能够通过冗余传输设备正常的连接到中央处理单元,若可以则通过冗余链路进行发送,并且监测中央处理单元的组链路故障反馈,若收到该反馈信息,则出现一组链路级别的故障,需要更改采集策略;如果冗余链路也不能正常工作,则将数据进行本地存储。2.中央处理单元对整个系统故障定位阶段首先中央处理单元监听数据采集单元所发送过来的数据,在5000ms内没有任何数据接收,则认为数据采集单元没有启动或者出现整个链路级别的故障。如果能够接收到数据,分析数据采集单元发送过来的数据报文,首先读取报文中封装的错误类型,分析是否出现单一节点级别或者单一模块级别的故障,如果出现单一节点级别的故障,则记录节点编号,该节点所属模块编号;如果出现单一模块级别的故障,则记录该模块编号。如果单一节点级别故障别及单一模块级别故障均未发生,则分析该报文的首部, 提取出报文源地址,以此来分析该报文是通过正常链路还是冗余链路传送,如果通过正常链路传送,则该工控机所在的链路无任何故障发生,如果通过冗余链路传送,则认为该正常传输链路出现故障;提取正常链路出现故障的源地址,找到与该地址同属一个交换机的所有地址,查询是否有至少一条的链路能够得到正常发送,共同连接一个交换机的所有工业控制机中,只要有一个能够正常的链路发送,说明并未出现一组链路级别的故障,如果连接一个交换机的所有工业控制机全部通过冗余链路传送,说明出现了一组链路级别的故障。中央处理单元查看出现链路故障类型,如果数据采集单元没有启动或者出现整个链路级别的故障,则中央处理单元发出警报,通知工作人员及时查看顶级交换机的链路连接情况;如果出现一组链路级别的故障,中央处理单元根据收到冗余链路所传递的报文,得到该组链路故障的发生位置,并且通知工作人员及时查看该底层交换机链路连接情况,与此同时,中央处理单元将一组链路级别的故障反馈给工业控制机,工业控制机收到冗余链路传回的反馈后,对数据采集策略进行调整;如果出现了单一链路级别的故障,则将提取出该工业控制机的信息,并且通知工作人员查看该工业控制机的链路连接情况。若系统的正常链路均无故障工作,系统则判断是否出现单一节点级别或者单一模块级别的故障,并且根据故障节点编号或者故障模块编号,将出现节点以及模块级别故障的位置通知工作人员,然后记录并展示正常数据。上述工作完成后,中央处理单元则等待数据采集单元所发送过来的下一条数据。本发明与现有技术相比的优点在于;针对海量节点的分布式网络测量中查找故障位置比较费时,不能及时排除故障的问题,在包括数据采集单元、数据传输单元和中央处理单元的多层次分布式测量网络结构下,本发明创造性的提出了一套智能故障定位方法, 在数百条甚至上千条的多级测量线缆链路中,实现了迅速有效地确定测量点及线路的故障点,并采取有效措施,从而减少故障停机时间,提高生产效率。


图1为本发明分布式测量网络系统硬件拓扑结构示意图;图2为本发明单一节点级别的故障判断流程图;图3为本发明单一模块级别的故障判断流程图;图4为本发明单一链路级别的故障判断流程图;图5为本发明一组链路级别的故障判断流程图;图6为本发明整个系统各种故障方法判断的整体流程图。
具体实施例方式本发明适用于包括数据采集单元、数据传输单元和中央处理单元的多层次分布式测量网络结构。在分布式测量网络中应用此方法能够在数百条甚至上千条的多级测量线缆链路中迅速有效地确定测量点及线路的故障点,并采取有效措施,从而减少故障停机时间, 提高生产效率。图1所示的是一个应用智能故障定位方法的分布式测量网络硬件架构,该分布式测量系统包括数据采集单元、数据传输单元和中央处理单元。数据采集单元采用测量传感器、多路数据采集板以及工业控制机三部分组成;数据传输单元采用多路交换机级联组成; 中央处理单元是一台性能高、计算能力强的计算机组成。为保证数据传输的可靠,增加冗余的传输模块安装在工业控制机上,每一台工业控制机均需要扩展冗余传输模块,,保证该工业控制机所属的正常链路出现故障时,数据能够通过冗余链路发送至中央处理单元处。系统分为以下两个部分,数据采集单元软件和中央处理单元软件。运行在数据采集单元上的软件负责从数据采集板中采集数据,并进行预处理,封装数据,并通过以太网发送到中央处理单元;运行在中央处理单元上的软件负责汇集并解析报文、重组数据,并生成展示图和分析结果。本发明分别在这两个软件上进行实现。数据采集单元软件的智能故障定位主要针对节点级别和模块级别两个级别的故障进行判断、定位,并将该信息发送到中央处理单元软件;中央处理单元软件的智能故障定位主要是对不同链路级别的故障进行判断和定位,同时针对整个系统各个级别的故障对工作人员进行提示。
图2所示的是单一节点级别的故障判断流程图,单一节点级别故障是由某一测量传感器因接线不良或测量传感器内部故障引起的,外在表现为采集到的数据不是正常范围内的数据、采集到的数据在极限值与正常值之间不断波动等等。为了验证本发明针对单一节点级别故障的可靠性,我们人为的制造单一节点级别的故障,将某一节点的接线断开。当工业控制机监测到单一节点级别故障,会立即发送报文至中央处理单元,在中央处理单元处有相应的故障提示。图3所示的是单一模块级别的故障判断流程图,单一模块级别故障是由某一测量采集模块因与工业控制机接线不良或测量模块内部故障引起的,外在表现在工业控制机无法启动该测量模块,或者启动该模块后无数据传输。为了验证本发明针对单一模块级别故障的可靠性,我们人为的制造单一模块级别的故障,将某一模块从工业控制机中拔出,使其断开连接。当工业控制机监测到单一模块级别故障,会立即发送报文至中央处理单元,在中央处理单元处有相应的故障提示。图4所示的是单一链路级别的故障判断流程图,单一链路级别故障是由工业控制机的正常数据传输设备出现故障、该工业控制机与底层交换机接线故障或者底层交换机连接该工业控制机的网口出现故障等引起,在工业控制机处的外在表现为无法启用正常链路与中央处理单元连接,而是采用冗余链路;在中央处理单元处的外在表现为接收到报文是经过冗余传输设备所发送的数据。为了验证本发明针对单一链路级别故障的可靠性,进行了试验,人为的制造单一链路级别的故障,将通过正常链路传输的某一工业控制机的正常数据传输设备停用,使其断开连接。当中央处理单元监测到单一链路级别故障,会立即有相应的故障提示。图5所示的是一组链路级别的故障判断流程图,一组链路级别故障是由某一底层交换机内部故障或者底层交换机与其连接的顶层交换机之间的链路故障引起的,在工业控制机处的外在表现为所有连接到该交换机的工业控制机均无法启用正常链路与中央处理单元连接,而是采用冗余链路;在中央处理单元处的外在表现为接收到报文有大量是经过冗余传输设备所发送的数据,所有经由冗余传输设备发送的工业控制机同属一组链路且该组链路没有一台工业控制机经过正常链路发送。为了验证本发明针对一组链路级别故障的可靠性,进行了试验,人为的制造一组链路级别的故障,将某一底层交换机断电,使其停止工作。当中央处理单元监测到一组链路故障,会立即有相应的故障提示,并且发送反馈信息至数据采集单元,数据采集单元的工业控制机会对采集策略做调整,避免因冗余链路引起的数据传输失败、资源竞争等问题。整个链路级别故障是由顶层交换机故障、中央处理单元网卡故障或者中央处理单元软件故障引起的,在工业控制机处的外在表现为所有的工业控制机中的正常链路和冗余链路均无法启用;在中央处理单元处的外在表现为不能接收到任何数据报文。为了验证本发明针对整个链路级别故障的可靠性,进行了试验,人为的制造整个链路级别的故障,将顶层交换机断电,使其停止工作。当中央处理单元监测到出现整个链路故障后,会立即有紧急的故障提示通知工作人员及时恢复网络。
权利要求
1. 一种面向大尺寸构件的分布式测量系统的智能故障定位方法,其特征在于所述故障分为五种类型单一节点级别故障、单一模块级别故障、单一链路级别故障、一组链路级故障别和整个链路级别故障;所述单一节点级别故障是指某个测量节点,即一个测量传感器上所出现故障,它分为两种类型,一种是测量传感器与采集模块之间的连接线路断开,此时采集点上的数据为连续的极限值;另外一种是测量传感器处出现虚接的现象,表现为采集点上的数据为正常数据到极限值的不断跳跃;所述单一模块级别故障是指当某个采集模块出现故障,该采集模块上的数据不能够正常的传到工业控制机上做进一步处理;所述单一链路级别故障是指当某条链路发生故障时,工业控制机不能够通过数据传输设备将采集并封装好的数据报文发送到中央处理单元;所述一组链路级别故障是指一组链路级别是指有多个同属于一个交换机的链路上同时出现故障,或者该底层交换机与顶层交换机的链路出现故障;当一组链路发生故障时,该组链路所连接的所有工业控制机均不能够通过正常链路将数据报文发送至中央处理单元, 这时中央处理单元接收到这一组工业控制机传递的冗余链路传过来的报文信息;所述整个链路级别故障是指中央处理单元接收不到任何数据,此时故障分为两种类型一是整个数据采集系统尚未启动,仅仅中央处理单元启动,此时系统中没有任何数据产生;另一种情况则是顶层交换机处发生故障,无论采用正常传输设备还是冗余传输设备,工业控制机上所采集并封装的数据报文均无法正常的发送,这时,整个系统的数据都堆积在工业控制机上,导致整个测量系统崩溃;所述故障定位方法是针对所述五种故障进行,实现过程包括数据采集单元故障定位阶段和中央处理单元对整个系统故障定位阶段;数据采集单元故障定位是在数据采集单元上的初步故障定位,仅负责判断单一节点级别和单一模块级别的故障,并将这两个级别的故障发送至中央处理单元;中央处理单元则不再进行定位单一节点级别和单一模块级别故障,而是直接采用接收到的数据采集单元故障定位信息,并且负责定位三种链路级别的故障,即单一链路级别故障、一组链路级故障别和整个链路级别故障; 所述数据采集单元故障定位阶段实现步骤为步骤1. 1 将连接在工业控制机上的采集模块和采集模块上的AD采集通道进行编号, 如果工业控制机能够识别采集模块,则将采集模块所采集到的数据存放在工业控制机中, 否则转至步骤1. 4 ;步骤1. 2 分析从采集模块上所采集到的各个通道数据,若采集模块的量程为-5V至 5V,则5V和-5V称为极限值;判断该数据是否存在为量程的极限值的数据,若否,则转至步骤 1. 5 ;步骤1. 3 如果存在量程为极限值的数据,则表明出现故障节点,接下来判断该故障类型是接线断开,还是接线头发生虚接现象;假设出现第k个节点发生故障,如果该节点所对应的采集通道数据始终处于极限值状态,则出现接线断开现象,若该节点所对应的采集通道数据在极限值与正常值之间波动,则出现虚接现象;记录该节点发生节点级别故障,并同时记录所属采集AD采集通道和采集模块编号;然后转到步骤1. 5 ;步骤1. 4 如果工业控制机无法识别某个采集模块,那么采集模块上所采集的数据无法正常传送到工业控制机中,记录该采集模块出现单一模块级别的故障现象,并同时记录该故障模块的编号;步骤1.5 首先查看是否出现单一模块级别的故障,如果没有,则转至步骤1.6,否则, 封装该故障模块的编号至以太网报文,注明发生单一模块级别故障,然后转到步骤1. 7,准备发送;步骤1. 6 单一模块级别故障没有出现,说明该模块能够正常读取数据,查看是否存在单一节点级别的故障,若不存在,则直接将数据报文连同模块的编号统一封装为以太网报文;否则采集将数据、故障节点编号以及故障类型封装为以太网报文;步骤1. 7 以太网封装完成以后,准备通过数据传输单元发送至中央处理单元,首先检测是否能够通过正常链路连接到中央处理单元,若可以则进行报文发送,并且转到步骤 1. 1,准备接收下一个采集模块发送至工业控制机的数据;否则监测是否能够通过冗余传输设备正常的连接到中央处理单元,若可以则通过冗余链路进行发送,并且监测中央处理单元的组链路故障反馈,若收到该反馈信息,则出现一组链路级别的故障,需要更改采集策略;如果冗余链路也不能正常工作,则将数据进行本地存储;上述分支完成后,转入步骤·1.1,准备接收下一个采集模块发送至工业控制机的数据;所述的中央处理单元对整个系统故障定位阶段实现步骤为步骤2. 1 中央处理单元监听数据采集单元所发送过来的数据,在5000ms内没有任何数据接收,则认为数据采集单元没有启动或者出现整个链路级别的故障,并转至步骤2. 5 ; 步骤2. 2 分析数据采集单元发送过来的数据报文,首先读取报文中封装的错误类型, 分析是否出现单一节点级别或者单一模块级别的故障,如果没有出现故障,则转至步骤·2.3,如果出现单一节点级别的故障,则记录节点编号,该节点所属模块编号;如果出现单一模块级别的故障,则记录该模块编号;步骤2. 3 如果单一节点级别故障别及单一模块级别故障均未发生,则分析该报文的首部,提取出报文源地址,以此来分析该报文是通过正常链路还是冗余链路传送,如果通过正常链路传送,则该工控机所在的链路无任何故障发生,并转至步骤2. 6,如果通过冗余链路传送,则认为该正常传输链路出现故障;步骤2. 4 提取正常链路出现故障的源地址,找到与该地址同属一个交换机的所有地址,查询是否有至少一条的链路能够得到正常发送,共同连接一个交换机的所有工业控制机中,只要有一个能够正常的链路发送,说明并未出现一组链路级别的故障,如果连接一个交换机的所有工业控制机全部通过冗余链路传送,说明出现了一组链路级别的故障;步骤2.5 中央处理单元查看出现链路故障类型,如果数据采集单元没有启动或者出现整个链路级别的故障,则中央处理单元发出警报,通知工作人员及时查看顶级交换机的链路连接情况;如果出现一组链路级别的故障,中央处理单元根据收到冗余链路所传递的报文,得到该组链路故障的发生位置,并且通知工作人员及时查看该底层交换机链路连接情况,与此同时,中央处理单元将一组链路级别的故障反馈给工业控制机,工业控制机收到冗余链路传回的反馈后,对数据采集策略进行调整;如果出现了单一链路级别的故障,则将提取出该工业控制机的信息,并且通知工作人员查看该工业控制机的链路连接情况;提示链路级别上的故障后,转到步骤2. 1,等待数据采集单元所发送过来的下一条数据;步骤2. 6 ;若系统的正常链路均无故障工作,系统则判断是否出现单一节点级别或者单一模块级别的故障,并且根据故障节点编号或者故障模块编号,将出现节点以及模块级别故障的位置通知工作人员,然后记录并展示正常数据;若整个系统无故障出现,转到步骤 2. 1,等待数据采集单元所发送过来的下一条数据。
全文摘要
一种面向大尺寸构件的分布式测量系统的智能故障定位方法,适用于包括数据采集单元、数据传输单元和中央处理单元的多层次分布式测量网络结构,以解决海量节点的分布式网络测量中查找故障位置比较费时,不能及时排除故障的问题。本智能故障定位方法分为数据采集单元故障定位和中央处理单元对整个系统故障定位两个阶段组成。数据采集单元故障定位针对节点级别和模块级别的故障进行预处理,并通过网络传输通知中央处理单元故障类型并定位;中央处理单元对整个系统故障定位除了获知节点级别和模块级别故障之外,还针对各级链路故障进行定位,能够统筹全局故障定位和故障精确警报。在分布式测量网络中应用此方法能够在数百条甚至上千条的多级测量线缆链路中迅速有效地确定测量点及线路的故障点,并采取有效措施,从而减少故障停机时间,提高生产效率。
文档编号H04L12/24GK102170368SQ20111009664
公开日2011年8月31日 申请日期2011年4月18日 优先权日2011年4月18日
发明者丁嵘, 张聚甫, 李晓光, 诸彤宇, 钟镇撼 申请人:北京航空航天大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1