无线传感网络中基于多示例多标记学习的区域监测方法_3

文档序号:9891235阅读:来源:国知局
=c〇yWft (11)
[0103] 其中,ft是Nt的Fisher Vector简写,它的维度设为b,Wy是标记y的B维权重向量, 不同的标记拥有不同的权重向量,W是维度为BXb(B<b)的信息提取矩阵,用来对ft降维, 所有的标记都共享一个W,运样不同的标记可W相互帮助构建分类模型。Fy(ft)的值越大,代 表ft拥有标记y的可能性越大,ft对每一个标记都有一个打分值,即{Fi(ft),F2(ft),. . .,Fy (ft),...,F|Y|(ft)},对运些打分值排序,选取打分值较大的若干个标记作为ft的相关标记。
[0104] 基于数据集Dsub,使用随机梯度下降法反复迭代训练预测模型,方法如下:
[0105] 在每一轮迭代,随机抽取一个样本ftW及它的一个相关标记,组成一个二元组(ft, y),然后通过抽样的方法估计ft的无关标记集合? =权"I义二0}中,无关标记的打分值超 过相关标记y的个数V,抽样方法:每次从?中随机抽取一个无关样本7,如果 与>巧(乂) + 1,则歹没有违规,继续下一轮抽样;如果巧(/;) <巧(/;) + 1,则F是一 个违规标记,结束抽样过程,记录抽样操作进行的次数即为V。
[0106] 利用V估计模型的误差,公式如下:
[0107]
(12)
[0108] 利用误差e;r;ro;r(ft,y)构建基于Ξ元组3?,东)的损失函数为:
[0112] 丫为随机梯度下降法的学习速率,控制着参数更新的快慢,更新完所有参数后,进 入下一轮迭代,抽取新的Ξ元组,直到模型训练完成为止。
[0113] 预测模型训练好后,重新收集数据,并根据收集到的数据预测网络状态,并更新预 测模型,如图3所示,步骤如下:
[0114] 第1步:收集任意时刻的传感网络数据,利用Fisher Kernel核函数得到其单示例 数据ft。
[011引第2步:将ft输入到预测模型Yt = Fy(ft)中,估测出网络当前所处状态Yt,根据估测 状态,管理者做出响应动作,同时对Yt进行人工校验、更正,并将(ft, Yt)存入数据集D中。
[0116] 第3步:重复步骤α)、(?),直到收集总共T个时刻的传感网络数据,构成新的数据 集 D={(ft,Yt),t = l,...,T}。
[0117] 第4步:利用MMD的数据集成技术,将数据集D中的冗余数据筛除,重新得到D的子数 据集Dsub。
[011引第5步:根据Dsu通新预测模型Yt = Fy(ft),清空数据集D。
[0119] 如图4所示,由于历史传感数据集过大且冗余信息过多,本发明对原始传感数据进 行两层压缩,在示例层面(传感器节点层面),利用多示例退化算法将多个传感器节点收集 到的数据压缩成单示例数据;在包层面(传感器网络层面),利用MMD在保证信息量丢失不多 的情况下,挑选出一个历史传感数据的子集,对历史不同时刻的传感数据进行压缩,减少训 练量。
[0120] W上实施例仅为说明本发明的技术思想,不能W此限定本发明的保护范围,凡是 按照本发明提出的技术思想,在技术方案基础上所做的任何改动,均落入本发明保护范围 之内。
【主权项】
1. 无线传感网络中基于多示例多标记学习的区域监测方法,其特征在于:包括两个过 程:预测模型构建、网络状态预测与模型更新, 所述模型构建过程如下: (1) 收集T个时刻的传感网络数据,构成数据集D〇={(Nt,Yt),t = l,2,...,T},Nt={st,i, St,2, . . .,St,i,. . .,St,M}表示时刻t时传感器网络收集到的数据,St,i表示时刻t时第i个传感 器收集的数据,M为整个传感器网络的传感器的总数,Yt= .. .,yt,i,. ..,yt,L}表 示时刻t时传感器网络的状态向量,Y巧L种需要监测的状态yt,i,l = l,2,…,L,yt,i的取值 由人为判断,yt, 1取1表示传感器网络正处于1状态,否则yt, 1取O; (2) 利用最大似然估计求解数据集Dd的混合高斯模型; (3) 对Do中的所有Nt,利用基于混合高斯模型的Fisher Kernel核函数,将多示例数据Nt 映射成单示例数据ft,从而得到数据集D= {(ft,Yt),t = 1,2,. . .,T}; (4) 利用MMD数据集成技术,将数据集D中的冗余数据筛除,得到D的子数据集Dsub; (5似Dsub为训练集,训练一个基于快速多示例多标记分类算法的预测模型Yt = Fy(ft), 清空数据集D; 所述模型更新与网络状态预测过程如下: (i) 收集任意时刻的传感网络数据,利用Fisher Kernel核函数得到其单示例数据ft; (ii) 将ft输入到预测模型Yt = Fy(ft)中,估测出网络当前所处状态Yt,根据估测状态,管 理者做出响应动作,同时对Yt进行人工校验、更正,并将(ft, Yt)存入数据集D中; (iii) 重复步骤(i)、(ii),直到收集总共T个时刻的传感网络数据,构成新的数据集D = {(ft,Yt),t = l,. . . ,T}; (iv) 利用MMD数据集成技术,将数据集D中的冗余数据筛除,重新得到D的子数据集Dsub; (V)根据Dsu通新预测模型Yt = Fy(ft),清空数据集D。2. 根据权利要求1所述无线传感网络中基于多示例多标记学习的区域监测方法,其特 征在于,步骤(3)中将多示例数据映射成单示例数据的具体过程如下: 对于某个多示例数据N={si,S2, . . .,Si,. . .,sm},设整个样本集的概率密度函数P为混 合高斯模型,则N取自该混合高斯模型的概率:1 式(1)中,A为在样本集上进行最大似然估计得到混合高斯模型的参数,A= Sk,k = l,...,K},K为混合高斯模型当中包含单高斯模型的个数,COk代表第k个高斯模型占 整个混合高斯模型的权重,且满足:乂^ : % S = 1,化和5:1^分别为第4个高斯模 左二1 型的均值向量和方差向量; 设Pk为第k个高斯模型的概率密度函数,则有:(2) 式(2)中,d为传感器数据Si的维度数目,由贝叶斯定理得到第i个示例取自第k个高斯分 <3) 布的概率: 根据丫 i化)求得N的Fisher向量乂;(4) 〇:3. 根据权利要求1所述无线传感网络中基于多示例多标记学习的区域监测方法,其特 征在于,步骤(4)的具体过程如下: 对于一个数据集D=阳1,化,...,化;I,它的子集Dsub={atNt|NteD,t = l,. . .,T,ate{0, I }},at为样本选择权重,当子集Dsub中包含了Nt时,at取I,否则at取O ; 将数据集D和Dsub之间的最大平均损失平方的最小值作为目标函数:('5) 式(5)中从康示取自子集Dsub的数据包,Ts为Dsub中的样本个数,(Hx)为非线性特征映 射函数; 求出式(5)的局部最优解,并根据人为设定的阔值0,得到Dsub=阳t|at>o}。4. 根据权利要求1所述无线传感网络中基于多示例多标记学习的区域监测方法,其特 征在于,步骤(5)的具体过程: (a)从Dsub中随机抽取一个样本ft和它的一个相关标记y E {yt,i I yt,i EYt, yt, 1 = 1},计算 ft对标记y的打分值Fy(ft) = W yWft,其中,W y是标记y的权重向量,W是信息提取矩阵,用来 对ft降维; (b )从f t的标记集合中随机抽取一个无关标记J 6权,心U €私九;=巧,计算 巧^(乂)=吗:吓/;,如果FfW) <巧又"-1,无关标记灭没有违规,返回步骤(b);如果 巧(乂)> FyK) - 1,: F是一个违规的无关标记,记下当前总共抽样次数V,转到步骤(C); (C)根据抽样次数V估计模型的误差,利用误差对参数CO y,"Vw更新; (d)判断模型是否收敛,如果否,返回步骤(a),如果是,输出最终模型,结束训练。5. 根据权利要求4所述无线传感网络中基于多示例多标记学习的区域监测方法,其特 征在于,步骤(C)中利用随机梯度下降法更新参数COy, ^,W,更新的公式: Oy= Oy+ y *error(ft,y)*Wft w,=妨';-y * w(',r '呼i 妒=W 7 米 e?T〇7' (/,,j')* (/,份f 份) 上式中,丫为随机梯度下降法的学习速率,error(ft,y)为根据抽样次数V估计的模型误 差:
【专利摘要】本发明公开了无线传感网络中基于多示例多标记学习的区域监测方法,利用Fisher?Kernel对同一时刻的多个传感器节点数据压缩。压缩后,某一时刻,整个无线传感器网络对应一个单示例数据而不再是多示例数据。利用MMD对历史包数据压缩,挑选出最具代表性的包数据,构成一个数据子集。利用快速多示例多标记算法完成对压缩数据的训练和监测区域状态的评估。本发明在经过两层压缩后的传感数据集上构建传感器网络状态预测模型,能够实现快速的网络状态预测。
【IPC分类】G06F17/30, G06K9/66, H04L12/24, G06K9/62, H04W84/18
【公开号】CN105656692
【申请号】
【发明人】胡海峰, 唐川, 吴建盛
【申请人】南京邮电大学
【公开日】2016年6月8日
【申请日】2016年3月14日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1