一种基于信息内涵度的数据分析及预警方法与流程

文档序号:11155317阅读:644来源:国知局
一种基于信息内涵度的数据分析及预警方法与制造工艺

本发明涉及一种信息分析方法,尤其是涉及一种一种基于信息内涵度的数据分析及预警方法。



背景技术:

通信信息的研究起步较早,上世纪中叶香农提出的信息理论,提供给通信领域一个较为完整的信息概念,也为通信奠定了理论基础。

香农首先指出信息是可度量的,并给出了信息量的明确定义。他认为信息量H与消息出现的概率p(x)的关系应反映如下规律:

H=loga[1/p(x)]=-loga p(x) a=2,H单位为比特

这一理论揭示了信息的属性定义,并且明确了信息可度量的先见,在其通信模型学说中,又提到信息通常可利用电信信号传输,当p(x)=1/4时,I=2bit,需用2位二进制脉冲传送。可见当消息的信息量用比特表示时,可以用最少二进制脉冲数来表示。在此,信息就转换成电信号的比特流了。信息的采集、传输、处理、存储、加工、显示,即通信系统的工作过程。

在香农提出的通信理论的第二定理中,C=B·log2(1+S/N),其中C为信道容量,B为带宽,S/N为信噪比。

由此得出:当信道的信息传输率小于信道容量时,采用合适的信道编码方法可以实现任意高的传输可靠性(或误差率接近0),反之也然;若在信道容量一定的条件下,要增加通信带宽,则必须减少信噪强度,反之也然。

香农提出的通信系统模型,如附图1,明确定义了从信源到信宿的模块功能及系统组成,成为通信理论的经典学说和基础知识。然而随着现代信息数据爆炸式的增长,相应的模块功能内涵也有了极大变化。从早先点对点的通信模式,已演进为单点对多点,多点(群)对多点(群),多点对单点的信息交互模式;信源和信宿也已发展成为全双工的兼有收发功能或含原单工的单元模块;从通信量有限的单信道的传输已变成为网络交换的海量信息传递交互。现代信息通信的理论研究已经落后于时代的状况和社会的需求,尤其是信息内涵及度量成为了大数据通信应用的主要瓶颈,多媒体通信、移动互动应用、社交平台、位置服务等新型应用的推进,使信息内涵确定、预知信息发生可能趋势,以及使用信息内涵进行分析、预测、预警等成为需要解决的问题。



技术实现要素:

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种能够从海量信息中提取事物特征的基于信息内涵度的数据分析及预警方法。

本发明的目的可以通过以下技术方案来实现:

一种基于信息内涵度的数据分析方法,包括以下步骤:

S1,采集一段时间内的信息数据,所述的信息数据为待分析事物的信源点在不同时间点依次发送的数据。

S2,对信息数据进行处理、存储,并计算每个信息数据的信息内涵度,对于某信息数据,其信息内涵度计算式为:

其中,I为信息内涵度,m为信息数据的信息量,单位为bit,t为采集本信息数据到采集下个信息数据之间的时间间隔,单位为s(秒),μ为信息安全因子,p为事物信息的出现概率;

上述计算式理论依据包括以下:

1)基于信息是被反映的物质属性原理以及事物信息可用最小单位bit表述,而事物的消息m(massage)是由许多bit组成,由此显见,m随bit的增加而增大,即m与bit成正比关系。

2)事物的信息I(information)是由许多事物消息m而形成,当m增加,则I也会增加,即I与m成正比关系。

3)由香农理论可知,事物的信息与其发生的概率为反向关系,即发生概率越小的事件,一当真正发生,其信息量是非常巨大,即信息I与其事件发生的概率p成反比关系。

4)由信息论学说可知,事物的信息更新周期越快(时间t越短),即此事物的信息量则越大,反之则越小,故推导出I与t成反比。

5)事物的(若干或许多)消息只有安全地被信宿所接收和存储,才能更全面地表述该事物的属性,由此产生出事物信息的安全因子μ,信息安全因子越高,事物信息越全,即演绎出事物信息I与μ成正比关系。

由上述多维度考虑和结合,从而设计推导出,信息内涵度量公式如上(1)。它能更加全面反映信息是客观事物普遍属性的表征。

S3,根据步骤S2的结果进行数据统计分析,得到信息内涵度I的统计趋势,作为信息数据所反映的事物特征。

所述的步骤S2中,所述的事物信息出现的概率p符合香农信息理论:H=-log2 p。其中H为信息量。

所述的信息安全因子μ根据国际信息安全等级的规则确定。

一种基于信息内涵度的预警方法,包括以下步骤:

S1,采集待分析事物的信源的当前信息数据,所述的信息数据为当前一段时间内不同时间点由信源依次发送的数据;

S2,对信息数据进行处理、存储,并计算每个信息数据的信息内涵度,对于某个信息数据,所述的信息内涵度计算式为:

其中,I为信息内涵度,m为数据的信息量,单位为bit,t为采集本数据到采集下个数据之间的时间间隔,单位为s(秒),μ为信息安全因子,p为信息出现概率;

S3,将步骤S2的结果与根据历史信息数据得到的信息内涵度统计趋势进行对比,若当前一段时间内的信息内涵度变化趋势与历史数据信息差异超过设定范围,一般前后两次数据差异>20%时,就认为差异较大,发出预警。

所述的步骤S2中,所述的p符合香农信息理论。

所述的信息安全因子μ根据国际信息安全等级的规则确定。

与现有技术相比,本发明具有以下优点:

(1)首次提出的信息归集定义和表达式,即:信息是客观事物普遍属性的表征;信息是被反映的物质属性;信息出现的几率越低,其信息内涵值就越高;信息内涵随着信息的安全越高而增长。其信息内涵归集表达式为:I::={Mc,Mt,Mq,Ms}。而Mc、Mt、Mq、Ms分别表示为信息的内容、信息的传递对象、信息的几率、信息的安全。由此归集定义更能反映出信息多维度的特征。

(2)采用信息内涵度计算结果及其统计分析得到的统计趋势,全面地表示了现代信息通信时代的信息内涵特征,该特征考虑了信息量、出现概率等因素,准确反映出事物的特征及变化规律,使信息具体化、数字化、可视化。

(3)对香农信息理论中的信息量加以利用,具有良好的理论基础。

(4)信息安全因子μ根据国际信息安全等级的规则确定,符合信息化时代数据安全的量定。

(5)首次提出的信息内涵度量技术,用数学语言简洁明了给出了信息内涵值与信息量、出现几率、出现时间及安全因子之间的关系,直观、易用。

附图说明

图1为香农提出的通信系统模型;

图2为本实施例1道路交通拥塞信息管理系统布置图;

图3为本实施例1道路交通拥塞信息管理系统A道区在8时前后数据趋势;

图4为本实施例1道路交通拥塞信息管理系统A道区在14时前后数据趋势;

图5为本实施例2山体及桥梁信息监测报警系统布置图;

图6为本发明预警方法流程图。

附图标记:1为数据采集器;2为图像采集器;3为集中转发器;4为山体;5为桥梁。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。

实施例1

如图2所示,在道路交通拥塞信息管理系统中,设定在某一主要道路口四条道路上,各距道口50米范围,每条路上在相隔10米处,安置线圈感应传感器,每当车辆经过这些传感器时,获得电磁感应信号,表示通过的车辆数,在一个传感器上,车辆经过的时间间隔越大,则车速越慢,反之亦然。此感应信号通过网络传至交通管理中心,加以分析比较,进行实时交通管理。

采用流程如图6所示的预警方法,对道路交通拥塞进行预警,包括以下步骤:

S1,采集信息数据,信息数据为针对待分析事物依次采集的数据,传感器将经过其的车辆信息数据经网络回传至管理中心。

S2,对信息数据进行处理、存储,并计算每个信息数据的信息内涵度,对于收到的车辆信息数据,由电脑通过信息内涵度量公式做运算,公式如下:

其中,I为信息内涵度,m为数据的信息量,单位为bit,在此,每个传感器回传数据设定为500bit;t为采集本数据到采集下个数据之间的时间间隔,单位为秒s,在此设定两个时段作为样本信息分析运算:7时到9时、13时到15时;μ为信息安全因子,根据信息安全标准设置为C2级,取值为3;p为信息的出现概率,根据交通拥塞业务特性为高几率事件,p取0.8。由此得到运算结果如下:

S2.1,A道区在8时前后,从各点传感器传出的信号时间间隔而得到对应的In值分别为:31.25,20.83,15.63,12.50,10.42。In值趋小,车辆速度减慢,拥塞趋势增加。数据趋势如图3所示,其中纵轴为In值,横轴为信号回传间隔(单位:秒)。

S2.2,A道区在14时前后,从各点传感器传出的信号时间间隔而得到对应的In值分别为:20.83;25.00;31.25;37.50;46.88。In值趋大,车辆速度增加,路况趋势正常。如图4所示。

S2.3,此上为简单起见,均采集两整点予以运算分析。同理可得到8点(或14点)前后十分钟,二十分钟,三十分钟等等的相关In值。

S2.4,同样,可获得B道区,C道区,D道区的各In值,得知道路拥塞与否的情况。

S3,根据步骤S2的结果进行数据统计分析,得到信息内涵度I的统计趋势,作为信息数据所反映的事物特征。I值通过μ、p、t和m的四个维度考量,较全面反映事物特征;考虑事件出现的概率,这一特性更结合实际应用的行业不同属性。通过I趋势值可判断,及与历史数据比较,可预知事件趋势性方向。

S3.1,交通信息管理中心计算机通过长期的存储In值数据比较分析,得到相应A道区的拥塞状况统计规律,即7时到9时和下午16时到18时为拥塞严重时段。

S3.2,同样,得到B,C和D道区的相应数据统计规律。

S3.3,如将四个道区的历史数据作比较,在同样时段均为In值为低值,说明整个区域交通拥塞情况严重;反之亦然。

由此可见,一个交通拥塞的社会现象,通过信息传递和运算,变成一个数字现象;又经过I数据库的比较、分析,变成一个信息特征现象;得到事物的规律性内涵。所以信息内涵度量对于物联网大数据时代的应用具有非常大的现实意义。

实施例2

将本发明的预警方法运用于山体及桥梁信息监测报警系统中,此山情包括塌方,地震,泥石流等及桥梁受力等情况。

山体桥梁信息监测报警系统包括依次连接的四个单元,A单元:信源接入部分/前端子系统;B单元:交互通信网络;C单元:信宿接入部分;D单元:信息监测中心。

如图5所示,现设定在山体4相应重要部位安置数据采集器1(即压力传感器)十个,用于监测各点受力状况信息,同样桥梁5各关键位置安置八个数据采集器1,观测各支点和节点的受力信息。为对山体4和桥梁5重要部位的裂缝加以监测,设置共十个图像采集器2(即图像传感器)于相应部位。并在此区域安置一集中转发器3,由此构成山情桥梁信息传输及监测系统的前端子系统。

在整个信息监测报警系统中,A单元的信源接入部分主要用于前端数据及图像的采集和发送,并通过集中转发器将所有信息传输到B单元交互通信网络,经过网络传输,信息进入C单元的信宿接入部分,然后,所有信息传输到D单元信息监测中心,将数据图像分离,并作信息分析和度量计算,在屏幕上显示数据、图像、统计趋势,以管理山体桥梁信息,达到安全预防和运行的目的。考虑到信息安全地传输至中心,而且根据数据流量和图像流量的大小和差异性,设计十八路数据信息通过通信网中的无线网如GPRS传输至后端子系统,而图像信息则通过通信网中的互联网传输至后端子系统,双网备份,增加信息通信可靠性。

具体实施步骤:

S1,安置各带有编号的采集器于相应重要位置,各路数据和图像采集器将变化的信息传输到集中器。

S2,集中器对数据和图像信息进行相应编码和调制技术处理,并作分离后,传至通信网中的GPRS网和互联网。

S3,通信网再将此技术处理后的信号传输交换至后端子系统。

S4,后端子系统经过对收到的信号作解调和解码,传到信息监测中心。数据信息传至m类电脑,图像信息至n类电脑。

S5,电脑对收到的信息进行度量技术作运算,例如受力大小、裂缝长度、宽度计算等,并作分析统计,显示监测的信息和趋势。

在此案例中,山体桥梁实际情况为十年内无发生重大灾情,二十年内则有一次发生的背景,信息监测中心根据此应用业务,设定信息几率系数p为低类,取系数值为0.3;根据业务性质和国际信息安全规则,设定安全因子μ为B1级,取值为4;时间t为二次上传的间隔长度,即显示时长,此设定为三天,即通常三天采集传输一次数据,但遇到数据变化较大时,如5-10%变化,即刻回传变化的数据。通常此可由传感器灵敏度调节设置。每条信息m设定为数据为10Kb,图像为500Kb。由此计算机根据上述信息内涵度量公式进行相应计算,得出度量值并作分析对比。具体实施步骤如下:

S5.1,计算机将收到的数据信息存储,并根据I公式,计算出该采集点的I1d值约为5.1。对该点做出受力变化判断。

S5.2,同理,计算机对收到的其他采集点作运算,得出相应Imd值。作出各点受力变化判断。

S5.3,计算机将收到的图像信息存储,并根据I公式,计算出该采集点的I1p值约为257.2。对该点做出裂缝变化判断。

S5.4,同理,计算机对收到的其他采集点作运算,得出相应Inp值。对各点做出裂缝变化判断。

S5.5,同样,计算机对该次收到的所有采集点作统计,得出总的Imd值,对整个山体桥梁受力作出判断。

S5.6,同样,计算机对该次收到的所有采集点作统计,得出总的Inp值,对整个山体桥梁作出裂缝判断。

S5.7,如表1所示,I1d点的值在二天内和24小时内分别跳变到7.8和15.5,电脑则可判断该点会发生事故,发出黄色警示标记,提醒现场处置。由下表可见,传感器回传间隔由大至小,说明该点山体活动越频繁,I1d和I1p的压力和裂缝变化越大,发生重大灾害几率越大。

表1 I1d和I1p变化趋势

S5.8,当某时段频繁收到整个区域信息,而且信息变化较大,即可判断整体监测区将会发生重大的灾害,电脑闪烁红色告警,管理人员启动安全预案机制,实施区域安全紧急管理。

由此可见,本专利通过多维度模型,度量计算技术,获得信息内涵值,使事物信息更加反映事物的特征,使信息具体化,数字化,可视化。对于当今信息社会和数字时代,具有极大的应用意义。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1