基于信息熵优选的自适应数据预测编码算法

文档序号：7545120阅读：282来源：国知局

基于信息熵优选的自适应数据预测编码算法
【专利摘要】本发明公开了基于信息熵优选的自适应数据预测编码算法，包括如下步骤：1）采集到N个数据点；2）对N个数据点进行数据熵判别选择最优预测算法；3）通过选择的算法对下一个数据点进行预测；4）判断预测值与实际值是否相差过大；获取一个新的数据点后，计算m阶差分值，与预测的差分值进行比较，看其差值是否超过限值；如果是，则再接收N-1个数据点，与和预测相差过大的一个数据点组合成N点数据，重复步骤2）；否则，进行步骤5）；5）判断是否接收完成所有数据；如果是进行步骤6），否则重复步骤3）；6）后续处理包括对数据二次压缩，压缩完成之后，将数据进行存储或者直接发送出去。
【专利说明】基于信息熵优选的自适应数据预测编码算法
【技术领域】
[0001]本发明涉及预测编码算法领域，具体地说，特别涉及到一种基于信息熵优选的自适应数据预测编码算法。
【背景技术】
[0002]无线传感器网络(WSN)的主要任务是采集多种传感器信号，通过无线的方式将数据发送到空间距离较远的接收端。多个传感器节点产生大量的数据，如果不进行处理直接发送，会消耗大量的能量。而能源问题是限制无线传感器网络长时间运转的一个瓶颈。因此，对数据进行压缩处理，减小传输量，对无线传感器网络具有重要意义。
[0003]预测编码是根据离散信号之间存在着一定关联性的特点，利用前面一个或多个信号预测下一个信号，然后对实际值和预测值的差(预测误差)进行编码。例如，线性预测编码(LPC)是主要用于音频信号处理与语音处理中，根据线性预测模型的信息用压缩形式表示数字语音信号谱包络的工具。
[0004]差分编码是传感器网络数据传输中的常用编码方式。现有技术中，有减少无线传感器网络节点信号冗余的方法(CN101719812B)，对采集的数据进行一阶差分处理，再进行Huffman编码；基于熵判别的最优差分编码的LZW压缩方法(CN102710263A)，计算多次差分之后的数据熵，对数据熵最小的差分阶数进行LZW编码进一步压缩。
[0005]上述方法的缺陷在于:无法通过预测编码结果来自适应调整预测模型。

【发明内容】

[0006]本发明的实际目的在于提供一种基于信息熵优选的自适应数据预测编码算法，通过最优熵判别选择差分编码中最优的`编码方式，并对数据进行预测，根据预测结果自适应调整差分编码方式，实现对变化趋势复杂的传感器数据进行高效率的压缩。
[0007]本发明所解决的技术问题可以采用以下技术方案来实现:
[0008]基于信息熵优选的自适应数据预测编码算法，包括如下步骤:
[0009]I)首先采集N个数据点；
[0010]2)对N个数据点进行数据熵判别选择最优预测算法。
[0011]对N个数据点计算m阶差分值(m〈N,初始m=0),此时N个数据变为m个初始值(O阶初始值、I阶初始值...m-Ι阶初始值)和N-m个差分值。再按照数据熵计算公式计算m阶差分之后，由初始值和差分值组成的N个数据信息熵:
[0012]H (xj = T !?(<(*)) - log 2p(xl (k))

kmi
[0013]其中，Xkm为第m次差分之后的数据中不重复的数据，p(xt)为其概率；再计算m+1
阶差分值以及信息熵H(xm+1)，当满足H(xm+1) > H(Xffl)时，说明进一步差分计算已不能减小信息熵，此时取第m阶差分为N个数据点的最佳压缩算法；否则m增加1，计算下一阶差分，直至满足条件或者m=N-l (此时取N-1阶差分)。将当前差分阶和参数作为关键帧存入数据流。
[0014]3)通过选择的算法对下一个数据点进行预测。
[0015]通过步骤2)，说明当前数据变化趋势通过m阶差分进行压缩效果最佳(即m-Ι阶曲线拟合此N个数据误差最小)，因此用m阶差分给出预测数据。具体的预测方法是:计算N-m个m阶差分数据的平均值，将此平均值作为下一个数据的m阶差分的预测值。
[0016]4)判断预测值与实际值是否相差过大；
[0017]获取一个新的数据点后，计算m阶差分值，与预测的差分值进行比较，看其差值是否超过限值；如果是，则再接收N-1个数据点，与和预测相差过大的一个数据点组合成N点数据，重复步骤2);否则，进行步骤5)；
[0018]5)判断是否接收完成所有数据；如果是进行步骤6)，否则重复步骤3)；
[0019]6)后续处理包括对数据二次压缩，例如Huffman编码、LZW编码等，压缩完成之后，将数据进行存储或者直接发送出去。
[0020]与现有技术相比，本发明的有益效果如下:
[0021]1.通过预测数据与新的数据进行比较，将结果作为反馈，自适应地选择数据压缩算法，使传感器网络不同的变化趋势的数据都能获得较高的压缩率。
[0022]2.通过对数据逐个或者逐帧进行预测、反馈和适应并通过关键帧调整编码方式，只需要固定数量的时间和空间消耗就可以实现压缩和解压，是一种在线算法。
`[0023]3.对差分编码压缩后的数据，适合于LZW等压缩算法，二次压缩友好，配合二次压缩，可得到更高的数据压缩效率。
【专利附图】

【附图说明】
[0024]图1为本发明的算法流程图。
【具体实施方式】
[0025]为使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解，下面结合【具体实施方式】，进一步阐述本发明。
[0026]温度传感器监控冷藏箱温度，在运输过程中由于冷藏箱的打开和关闭，有一个近似线性的上升和下降，后续又保持基本稳定。
[0027]在冷藏箱中，温度基本保持不变，取一阶差分预测能达到最佳的效果。在冷藏箱打开和关闭过程中，温度曲线变化大致为线性，取二阶差分预测效果最佳。温度恢复稳定之后，又采用一阶差分进行预测。
[0028]例如，采集到的一组温度数据如下，先大致为线性变化，后面趋于稳定。
[0029]
【权利要求】
1.基于信息熵优选的自适应数据预测编码算法，其特征在于，包括如下步骤: . 1)采集到N个数据点； . 2)对N个数据点进行数据熵判别选择最优预测算法；对N个数据点计算m阶差分值，此时N个数据变为m个初始值和N_m个差分值；再按照数据熵计算公式计算m阶差分之后，由初始值和差分值组成的N个数据信息熵:
【文档编号】H03M7/30GK103888144SQ201410076886
【公开日】2014年6月25日申请日期:2014年3月4日优先权日:2014年3月4日
【发明者】沈龙强, 黄宏强申请人:上海挚连科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：沈龙强;黄宏强
技术所有人：上海挚连科技有限公司
我是此专利的发明人

上一篇：振动装置、电子设备及主体配件的制作方法
上一篇：功率放大模块的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、田老师：1: 建筑节能绿色建筑能耗的模拟与检测(EnergyPlus)；建筑碳排放和生命周期评价；城市微气候、建筑能耗与太阳能技术的相互影响；地理信息系统(GIS)和空间回归方法用于城市建筑能耗分析；不确定性、敏感性分析和机器学习方法应用于建筑能耗分析(R)；贝叶斯方法用于城市和单体建筑能源分析 2: 过
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、毕老师：机构动力学与控制
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、周老师：1.智能机器人技术 2.智能检测与控制技术 3.机构运动学与动力学 4.机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。