针对传感器采集数据的局部增量式的概率密度估计方法

文档序号:9471772阅读:445来源:国知局
针对传感器采集数据的局部增量式的概率密度估计方法
【技术领域】
[0001] 本发明属于密度估计的技术领域,具体设及一种针对传感器采集数据的局部增量 式的概率密度估计方法。
【背景技术】
[0002] 当传感器在启动后就进入了数据采集的过程,运样采集来的数据送到后台电脑中 进行处理时,往往就要对传送过来采集来的数据进行估计,而生成运些数据的概率密度函 数是一个非常重要的任务。
[0003] 传统概率密度估计方法大致分为两种:非参数式方法和参数式方法,非参数方法 的代表是核概率密度估计方法,它非常灵活,理论上能够收敛到任何光滑的概率概率密度 函数。但是运类方法的问题是运行开销极大,面对规模稍大的问题便无能为力。
[0004] 参数式方法的代表方法是高斯混合模型,它通过预先分配一定数量的高斯分布, 然后通过"期望一最大化"方法和训练数据来得到每个高斯分布的参数和组合系数,最终得 到的概率密度估计来自运些高斯成分的线性组合,运种方法的缺陷在于需要预先确定高斯 成分的数量来取得较好的效果,不合适的数量会导致非常不理想的结果。此外,每次训练需 要访问传感器采集来的所有的数据样本,在数据量非常大或者数据本身W数据流的形式存 在时无法直接应用。 阳0化]特别的,在面对数据流的情况下,还存在"概念漂移"(Concept化ift)的现象:数 据的概率密度函数随时间而变化。此时传统的批处理方法无法解决运类问题。

【发明内容】

[0006] 本发明的目的提供一种针对传感器采集数据的局部增量式的概率密度估计方法, 本方法在不改变传统硬件架构的基础上,综合采用了信道监听、频分、时分、码分技术,并借 鉴超高频RFID识别技术中的询问/应答原理建立了网络的询问/应答机制,解决了运行开 销极大、面对规模稍大的问题便无能为力、不合适的数量会导致非常不理想、在数据量非常 大或者数据本身W数据流的形式存在时无法直接应用W及无法解决"概念漂移"的问题。
[0007] 为了克服现有技术中的不足,本发明提供了一种针对传感器采集数据的局部增量 式的概率密度估计方法的解决方案,具体如下: 一种针对传感器采集数据的局部增量式的概率密度估计方法,步骤如下: 步骤1:首先启动传感器进行数据采集,然后把传感器采集来的数据发送到处理单元 中进行处理,该处理单元设置有存储器,存储器中存有W往的高斯分布集合、预设有用于 初始化高斯分布的协方差矩阵、; 步骤2 :把传感器采集来的数据发送到处理单元中进行处理的方式如下:a.模型初始化过程,其过程具体为当处理单元接收到的传感器采集来的数据为第一个 样本时,把该第一个样本进行向量化表示,把向量化的第一个样本作为均值向量,再结合用 于初始化高斯分布的协方差矩阵,W此根据多元高斯分布的概率密度函数得到传感器采集 来的数据的概率密度的初步估计,接收下一个新的传感器采集来的数据的新的样本,并对 该新的样本进行向量化表示; b.计算邻域集合,其过程具体为如果存储器中的高斯分布集合已有若干高斯分布,每 一个高斯分布都定义了一个如公式(1)所示的接受域:
(1) Vi表示第i个高斯分布的接受域,i为大于等于1的整数,X代表当前正在处理的向量 化的数据样本,Rd表示d维的实数空间,d为大于等于1的整数,X1为用于第i个高斯分布 的协方差矩阵,Ui为第i个高斯分布的均值向量,T1满足如下公式(2)的条件:
(2) P(.)表示概率函数,q为实数,范围在0. 9-0. 95之内; 利用公式(3): Sx=(iI(X-Ux)T>EiT(x_Ux)<Ti2} (3) 找出所有接受域中包含了当前数据样本的那些高斯分布组成的邻域集合5、; C.增量学习,其过程具体为如果当前所求得的邻域集合Sy为空集,使用当前的数据样 本初始化一个新的高斯分布加入到现有的存储器中; d. 局部参数更新,其过程具体为根据公式集合(1)
对所有在邻域集合内的高斯分布,更新它们的参数来拟合当前的数据样本,其它高斯 分布则保持不变,其中表示第t轮时第i个高斯分布的中间参数,t为大于等于2的整 数,第t轮的处理也就是针对第t个样本的处理,CP(.)表示多元高斯分布的概率密度函 数,xt表示传感器采集到的第t个数据样本的向量化表示,0,4。= (r产 E产U),〇严表示针对第t轮时第i个高斯分布的有效数据样本的个数的中间参数,UiW表 示第t轮时第i个高斯分布的均值向量,E产U表示第t轮时第i个高斯分布的协方差矩 阵; e. 去噪处理,其过程具体为每当处理的数据样本达到设定的数量时,就执行一次去噪 处理过程,对所有由噪音产生的高斯成分,接收下一个传感器采集来的数据的新的样本,并 对该新的样本进行向量化表示,返回b中执行。
[0008] 所述的初始化高斯分布的协方差矩阵为对角矩阵。
[0009] 本方法提供了一种针对传感器采集数据的局部增量式的概率密度估计方法,也是 一种在线式的方法,每次迭代只需要传感器采集来的单个数据样本,最终得到一个高斯混 合模型。当传感器采集来的新数据到来时,根据其与当前模型的关系来确定是否要增加高 斯成分,如果不增加则局部地对当前模型进行参数更新。运种增量和局部学习结合的方式 使得算法能够检测出传感器采集来的数据流中概率密度分布的变化,而且对局部复杂的密 度分布更为敏感,最终得到准确的概率密度估计。最后,使用一种去噪方式使得方法稳定性 和抗干扰性能更强。
【具体实施方式】
[0010] 当传感器在启动后就进入了数据采集的过程,运样采集来的数据送到后台电脑中 进行处理时,往往就要对传送过来采集来的数据进行估计,而生成运些数据的概率密度函 数是一个非常重要的任务。另外在许多应用中,估计出传感器采集来的数据的概率密度都 是非常重要的中间步骤。比如分类问题,只要有了不同类别的条件概率密度和先验就能够 通过贝叶斯公式直接算出给定数据下类别的后验概率从而得到理想的贝叶斯分类器;还有 在异常检测任务中,通过为期望的事件及模式建立一个准确的概率密度模型,就可W通过 估计传感器采集来的数据的概率密度来判断它是否来自异常的事件或者模式。总的来说, 密度估计是一个为给定的传感器采集来的数据建立概率模型的一个过程。
[0011] 针对传感器采集数据的局部增量式的概率密度估计方法,步骤如下: 步骤1:首先启动传感器进行数据采集,然后把传感器采集来的数据发送到处理单元 中进行处理,该处理单元设置有存储器,存储器中存有W往的高斯分布集合、预设有用于初 始化高斯分布的协方差矩阵、; 步骤2 :把传感器采集来的数据发送到处理单元中进行处理的方式如下: a. 模型初始化过程,其过程具体为当处理单元接收到的传感器采集来的数据为第一个 样本时,把该第一个样本进行向量化表示,把向量化的第一个样本作为均值向量,再结合用 于初始化高斯分布的协方差矩阵,W此根据多元高斯分布的概率密度函数得到传感器采集 来的数据的概率密度的初步估计,接收下一个新的传感器采集来的数据的新的样本,并对 该新的样本进行向量化表示; b. 计算邻域集合,其过程具体为
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1