基于关联规则的无线传感网络报文挖掘系统和挖掘方法

文档序号:7782858阅读:179来源:国知局
基于关联规则的无线传感网络报文挖掘系统和挖掘方法
【专利摘要】本发明公开了一种基于关联规则的无线传感网络报文挖掘系统和挖掘方法,本发明的挖掘系统包括工控计算机、无线传感网络监听器和无线传感器节点网络,所述无线传感网络监听器与工控计算机网络连接,所述无线传感网络监听器位于无线传感器节点网络中;本发明中的报文挖掘方法解决在分布式网络中,各节点间的复杂交互而产生的非频繁发生的错误,这些错误难以定位。本发明利用改进的基于关联规则的数据挖掘方法找到报文序列中存在的问题序列,帮助找到无线传感器网络调试中难以找到的错误。本发明对于无线传感网络的协议改进、调试都有很好的借鉴作用,具有广泛的应用价值。
【专利说明】基于关联规则的无线传感网络报文挖掘系统和挖掘方法
【技术领域】
[0001]本发明属于无线传感网络【技术领域】,特别涉及一种基于关联规则的无线传感网络报文挖掘系统和挖掘方法。
【背景技术】
[0002]随着嵌入式计算技术、无线通信技术、微处理器技术和微传感器技术的飞速发展和日益成熟,具有感知能力、计算能力和无线通信能力的微型传感节点开始出现。由微型传感节点以自组织方式组成的无线传感网络引起了人们的极大关注,这种新型网络结合了传感器技术、嵌入式计算技术、分布式信息处理技术和无线通信技术,能够协作地实时监测、感知和采集网络布置区域内的环境信息或监测外来目标的信息,并对这些信息进行处理,获得详尽而准确的结果,最终传送至需要这些信息的用户。
[0003]众所周知,由于资源的限制,开发无线传感网络应用程序不像开发PC应用程序一样方便;同样的,调试无线传感网络应用程序也有诸多困难。为了实现无线传感网络应用程序的调试功能,代码级调试是现在传感器网络应用程序中使用的比较普遍的方法,代码级调试是指可以允许开发人员以语句或者代码块执行程序并同时可观察程序运行状态的调试。现在国内外也出现了许多的针对传感器网络应用程序的代码级调试工具,这些工具通过在运行状态下提供更多可见性因素使得定位错误更容易,这在故障排除过程中提供了相当大的便利作用。
[0004]不幸的是,对于无线传感网络来说,应用错误的产生往往不是由于单个点的编码错误产生的,而是不同传感器节点间的不正确的交互所造成的。造成这种类型的交互可能的原因包括:1.无线传感网络协议的设计缺陷(丢失了对一些边界事件的处理,使得协议不能够正确地处理这些事件)2.不可预见的人为的节点交互事件。同时,这些交互性的错误是不可重复性的,这是因为重复相同的实验步骤不一定能够进入相同的边界条件。同时由于无线传感网络中Ad-hoc的多跳的工作结构,外部很难观察无线传感网络内在的交互和结构,对于这样的错误,代码级调试下对于错误的定位及排除就显的比较困难。

【发明内容】

[0005]本发明的目的在于克服现有技术的缺点与不足,提供了一种基于关联规则的无线传感网络报文挖掘系统。
[0006]本发明的另一目的在于,提供了一种基于关联规则的无线传感网络报文挖掘方法,通过这种方法,解决无线传感网络中在表面上看起来是各个独立的传感器节点间由于交互作用而产生的错误问题。
[0007]为了达到上述第一目的,本发明采用以下技术方案:
[0008]基于关联规则的无线传感网络报文挖掘系统,包括工控计算机、无线传感网络监听器以及无线传感器节点网络,所述无线传感网络监听器与工控计算机网络连接,所述无线传感网络监听器位于无线传感器节点网络中;[0009]所述无线传感器节点网络包括多个无线传感器节点,无线传感器节点网络使用无线传感网络通讯协议来进行通信,无线传感器节点接收来自网络中其它传感器节点的信息,并向网络中其它传感器节点发送返回信息及网络信息;
[0010]无线传感网络监听器,用于监听无线传感器节点网络中的命令,并将监听到的命令信息传递给工控计算机;
[0011]工控计算机,用于接收无线传感网络监听器监听到的返回信息并对该返回信息进行分析处理。
[0012]优选的,所述无线传感器节点网络使用的组网类型包括星型网络、带状网络、树形网络、环形网络及网状网络。
[0013]优选的,无线传感器节点包括用于接收读写器发送的能量来完成内部存储信息的收发模块、用于对应信息数据的写入和存储的存储模块以及天线,收发模块和存储模块信号连接。
[0014]优选的,所述无线传感网络监听器包括能够监听无线信号的监听模块和数据上传模块,其通过以太网网络上传数据,无线传感网络监听器的监听范围覆盖整个无线传感网络。
[0015]为了达到上述第二目的,本发明采用以下技术方案:
[0016]基于关联规则的无线传感网络报文挖掘系统的挖掘方法,包括下述步骤:
[0017](I)数据采集:无线传感网络由任意个无线传感器节点组成,通过位于无线传感器节点网络中的无线传感网络监听器收集各传感器节点的通信信息并传送给工控计算机;
[0018](2)数据预处理:在进行报文挖掘前,首先对采集到的通信报文数据进行预处理;
[0019](3)报文分析:对预处理后的报文数据通过候选序列产生、数据分段、频繁序列产生、问题序列产生步骤得到问题序列的产生。
[0020]优选的,步骤(2 )具体为:
[0021]2.1)删除不需要的应答报文和广播报文,广播报文为周期性报文,是某一节点对网络中其它节点的信息的传递,其它节点收到时并不对其做出回应,应答报文和广播报文不是报文序列的组成成分;
[0022]2.2)选取在同一网络ID的报文,由于监听到的报文不止一个网络ID,但在同一个网络ID的通信报文,才是完整的各节点间的通信;
[0023]2.3)删除冗余报文,在通信过程中,有可能存在节点重复发送同一条报文的现象,为此要删除冗余报文,即将同步帧序列号值重复的报文删除;
[0024]2.4)报文序列化,将各报文用特定的字母数字符号来表示,在以上两步处理之后所得的数据为各节点间通信的数据型报文。
[0025]优选的,步骤(3)具体为:
[0026]3.1)候选序列产生,采用基于序列模式的候选序列生成方式来生成候选序列;
[0027]3.2)数据分段,为了准确找出所出现的报文序列,每一次候选项计数时,以每个候选序列的第一个元素对已经序列化的报文进行分段;
[0028]3.3)频繁序列的产生,在进行候选序列计数过程中,为了确保找到正确的序列,需要对找到的序列识别,删除干扰序列,防止错误计数,对于每个小段中如果存在寻找的报文序列则查找的到的数量加1,即可得到候选序列c发生的次数σ &),当σ (c)大于设定的值m时,把其加入到频繁序列中;
[0029]3.4)问题序列产生,在给每一项序列计数后,将计数所得值进行比较,以发现丢包现象,对于一个k-Ι序列,可能被多个k序列包含,对于一 k-Ι子序列,频繁项计数为σ(Ch),包含此子序列的频繁序列的计数,计数分别为O1 (ck)、o2 (Ck)...ση (ck),将所有
包含该子序列的频繁序列计数相加,得到
【权利要求】
1.基于关联规则的无线传感网络报文挖掘系统,其特征在于,包括工控计算机、无线传感网络监听器以及无线传感器节点网络,所述无线传感网络监听器与工控计算机网络连接,所述无线传感网络监听器位于无线传感器节点网络中; 所述无线传感器节点网络包括多个无线传感器节点,无线传感器节点网络使用无线传感网络通讯协议来进行通信,无线传感器节点接收来自网络中其它传感器节点的信息,并向网络中其它传感器节点发送返回信息及网络信息; 无线传感网络监听器,用于监听无线传感器节点网络中的命令,并将监听到的命令信息传递给工控计算机; 工控计算机,用于接收无线传感网络监听器监听到的返回信息并对该返回信息进行分析处理。
2.根据权利要求1所述基于关联规则的无线传感网络报文挖掘系统,其特征在于,所述无线传感器节点网络使用的组网类型包括星型网络、带状网络、树形网络、环形网络及网状网络。
3.根据权利要求1所述基于关联规则的无线传感网络报文挖掘系统,其特征在于,无线传感器节点包括用于接收读写器发送的能量来完成内部存储信息的收发模块、用于对应信息数据的写入和存储的存储模块以及天线,收发模块和存储模块信号连接。
4.根据权利要求1所述基于关联规则的无线传感网络报文挖掘系统,其特征在于,所述无线传感网络监听器包括能够监听无线信号的监听模块和数据上传模块,其通过以太网网络上传数据,无线传感 网络监听器的监听范围覆盖整个无线传感网络。
5.根据权利要求1-4中任一项所述基于关联规则的无线传感网络报文挖掘系统的挖掘方法,其特征在于,包括下述步骤: (1)数据采集:无线传感网络由任意个无线传感器节点组成,通过位于无线传感器节点网络中的无线传感网络监听器收集各传感器节点的通信信息并传送给工控计算机; (2)数据预处理:在进行报文挖掘前,首先对采集到的通信报文数据进行预处理; (3)报文分析:对预处理后的报文数据通过候选序列产生、数据分段、频繁序列产生、问题序列产生步骤得到问题序列的产生。
6.根据权利要求5所述基于关联规则的无线传感网络报文挖掘系统的挖掘方法,其特征在于,步骤(2)具体为: 2.1)删除不需要的应答报文和广播报文,广播报文为周期性报文,是某一节点对网络中其它节点的信息的传递,其它节点收到时并不对其做出回应,应答报文和广播报文不是报文序列的组成成分; 2.2)选取在同一网络ID的报文,由于监听到的报文不止一个网络ID,但在同一个网络ID的通信报文,才是完整的各节点间的通信; 2.3)删除冗余报文,在通信过程中,有可能存在节点重复发送同一条报文的现象,为此要删除冗余报文,即将同步帧序列号值重复的报文删除; 2.4)报文序列化,将各报文用特定的字母数字符号来表示,在以上两步处理之后所得的数据为各节点间通信的数据型报文。
7.根据权利要求5所述基于关联规则的无线传感网络报文挖掘系统的挖掘方法,其特征在于,步骤(3)具体为:.3.1)候选序列产生,采用基于序列模式的候选序列生成方式来生成候选序列; .3.2)数据分段,为了准确找出所出现的报文序列,每一次候选项计数时,以每个候选序列的第一个元素对已经序列化的报文进行分段; .3.3)频繁序列的产生,在进行候选序列计数过程中,为了确保找到正确的序列,需要对找到的序列识别,删除干扰序列,防止错误计数,对于每个小段中如果存在寻找的报文序列则查找的到的数量加1,即可得到候选序列c发生的次数σ (C),当σ (c)大于设定的值m时,把其加入到频繁序列中; .3.4)问题序列产生,在给每一项序列计数后,将计数所得值进行比较,以发现丢包现象,对于一个k-Ι序列,可能被多个k序列包含,对于一 k-Ι子序列,频繁项计数为σ ((V1),包含此子序列的频繁序列的计数,计数分别为Oi (Ck)、O 2 (Ck)...0 n (Ck),将所有包含该子序列的频繁序列计数相加,得到
8.根据权利要求7所述基于关联规则的无线传感网络报文挖掘系统的挖掘方法,其特征在于,无线传感网络监听到的报文格式包括:报文长度、同步帧控制域、同步帧序列号、个域网标志符、目标地址、源地址、链路层报文说明、有效载荷、校验位;整条的报文是通过特点的字母数字符号来表示,其最终结构为:(gl, g2, g3, g4, el, elgl, g2, g3, g4, el, g2, g3,g4, gl, el, g2, g3, g4, gl, el, gl, g2, g3, g4…),其中g, e分别代表不同类型的数据报文,1,2,3,4代表特定的不同节点间的通信,并得知报文有5种种类gl,g2, g3, g4, el,各种项集计数,找出可能的问题序列。
9.根据权利要求7所述基于关联规则的无线传感网络报文挖掘系统的挖掘方法,其特征在于,候选序列产生方法如下:通过一对频繁(k-Ι)-序列合并,产生候选k-序列,对于(k-Ι)-序列S(1)和S(2),仅当从S(1)中去掉第一个事件得到的子序列与从S(2)中去掉最后一个事件得到的子序列相同,结果候选是序列S(1)与S(2)的最后一个事件的连接,得到的结果候选序列中,如果候选k-序列的(k-Ι) -序列至少有一个是非频繁的,那么这个候选k-序列将被移除。
10.根据权利要求7所述基于关联规则的无线传感网络报文挖掘系统的挖掘方法,其特征在于,频繁序列产生过程中,删除干扰序列的方法如下: 在需要进行处理的报文序列S中,在以某单个数据单元将报文分成各片段后,在得到的某个片段中查找某候选序列时,读取到的候选序列中的某个数据单元为下一个单独报文序列中的元素,对此现象,判断所获取的序列在片段中的长度,设置一参数h,任一挖掘所得的序列长度不得超过h ,一旦超过h,则该序列被删除。
【文档编号】H04W24/04GK103716824SQ201310743725
【公开日】2014年4月9日 申请日期:2013年12月27日 优先权日:2013年12月27日
【发明者】肖金超, 曾鹏, 魏三喜 申请人:广州中国科学院沈阳自动化研究所分所, 中国科学院沈阳自动化研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1