一种基于人机混合智能的电磁数据标注方法及系统与流程

文档序号:33113865发布日期:2023-02-01 02:33阅读:128来源:国知局
一种基于人机混合智能的电磁数据标注方法及系统与流程

1.本发明涉及电磁数据技术领域,具体是一种基于人机混合智能的电磁数据标注方法及系统。


背景技术:

2.具有良好标注信息的电磁数据可用于训练雷通信号的调制识别、型号识别、状态识别、用户意图识别等算法模型,这就使得对包含标注的电磁数据需求成倍扩张,同时电磁数据标注的速度决定了电磁模型开发的迭代速度,提升电磁数据标注的效率和正确率是电磁数据处理的关键问题。
3.近年来,深度学习技术因其优异的性能开始广泛用于视觉、自然语言处理和无人驾驶等领域。对海量数据的标注需求,促进了标注技术的发展,国内外大型人工智能公司甚至配备了成百上千人的数据标注团队。然而这些标注技术都是面向图像、视频、语音和文本数据的,数据格式、数据体量、标注逻辑与电磁数据标注有很大不同。传统的电磁数据标注方法依赖领域专家对标注对象的经验与知识对电磁数据进行逐脉冲的精细数据标注,这些高质量的电磁标注数据全部采用人工标注方式获得,所需人力工时巨大,领域专家需要对海量电磁数据不断进行重复劳动,容易产生疲惫导致数据的一致性很难保证,电磁标注的准确率也很大程度依赖于标注者的专业水平。因此,针对电磁数据特点发展一套智能、高效、友好交互的电磁数据标注方法及其对应装置具有很好的应用前景。


技术实现要素:

4.为克服现有技术的不足,本发明提供了一种基于人机混合智能的电磁数据标注方法及系统,解决现有技术存在的耗费人力大、标注速度慢、标注准确率较低等问题。
5.本发明解决上述问题所采用的技术方案是:
6.一种基于人机混合智能的电磁数据标注方法,利用深度聚类去交错分离方法对电磁数据进行自动分离标注,并计算分离标注后不同类型电磁数据间的相似度矩阵,最后由领域专家根据相似度矩阵、标签置信度,对分离标注后电磁数据的标签进行人工审核,从而实现机器标注为主、专家审核为辅的电磁数据标注。
7.作为一种优选的技术方案,包括以下步骤:
8.s1,电磁数据预处理:首先对电磁数据进行切片形成电磁数据帧,然后逐帧去除电磁数据帧内的异常值,再对电磁数据帧进行标准化处理,输出预处理后的电磁数据帧;
9.s2,深度聚类去交错分离标注:将步骤s1预处理后的电磁数据帧输入深度长短时记忆网络学习度量特征表示,并对学习的度量特征表示进行无监督聚类;然后将聚类结果作为标签,再输送回深度长短时记忆网络进行监督学习;如此循环迭代,直到回深度长短时记忆网络收敛,输出分离标注标签及标签置信度;
10.s3,相似度矩阵计算:根据步骤s2生成的标注标签,计算当前电磁数据帧与历史电磁数据帧中不同类型电磁数据之间的相似度,生成相似度矩阵;其中,历史电磁数据帧指当
前处理时刻以前的所有电磁数据帧;
11.s4,领域专家审核:根据步骤s2生成的标签置信度和步骤s3生成的相似度矩阵,对分离标注后电磁数据的标签进行人工审核校正。
12.作为一种优选的技术方案,步骤s1包括以下步骤:
13.s11,电磁数据帧生成:对原始电磁数据序列使用固定窗口进行切片形成电磁数据帧;其中,固定窗口大小为w,w≥1000;
14.s12,异常值过滤:利用异常值过滤方法去除电磁数据帧中电磁数据的异常值;其中,异常值过滤方法为四分位异常值过滤法、z-score法、密度聚类法或孤立森林等离群值检测法。
15.s13,标准化处理:计算经步骤s12处理后的电磁数据的均值μ和标准差σ,按照i
*
=(i-μ)/σ进行标准化处理;其中,i表示经步骤s12处理后的电磁数据,i
*
表示标准化后的电磁数据;
16.然后,对标准化处理后电磁数据帧内的每一个电磁数据pi,用单边侧历史时间窗以步进为1进行划窗切片,输出电磁数据pi的历史窗表示xi=[p
i-m+1
,...,p
i-1
,pi],前m个电磁数据中,单边侧历史时间窗内电磁数据数目不足m,用0填充;其中,m表示划窗大小,m≥8,i表示电磁数据帧内电磁数据的编号,0≤i≤w-1。
[0017]
作为一种优选的技术方案,步骤s12中,若采用异常值过滤方法进行异常值过滤,则实施以下方式:将步骤s11输出的电磁数据帧按照数值由小到大进行排列,将排列后的电磁数据帧中的电磁数据的第25%位置的数值记为q1,将排列后的电磁数据帧中的电磁数据的第75%的数值记为q3,二者之差记为四分位距iqr=q
3-q1,将小于q
1-3iqr或大于q3+3iqr的电磁数据的特征值判定为异常值并去除。
[0018]
作为一种优选的技术方案,步骤s2包括以下步骤:
[0019]
s21,构建深度长短时记忆网络,深度长短时记忆网络结构为:输入层由步骤s13的划窗大小m及预处理后的电磁数据帧的输入特征数k决定,形状为m
×
k;长短时记忆层层数l,l≥2,每层的单元个数由划窗大小m决定,每个单元的输出空间维度取d,d≥32;输出层为全连接层,全连接层的神经元个数由待学习度量特征表示维数决定;
[0020]
s22,前向传播无监督聚类:将电磁数据帧中电磁数据的历史窗表示xi(0≤i≤w-1)输入至步骤s21设计好的深度长短时记忆网络结构f
θ
,输出学习到的度量特征表示f
θ
(xi),将度量特征表示f
θ
(xi)输入至分类器gc,通过迭代优化目标函数:
[0021][0022]
更新分类器权重c
t
,并预测信号对应的伪标签其中,t表示当前迭代轮数,lf表示分类器损失函数,θ
t
表示当前迭代轮数时深度长短时记忆网络的权重矩阵;
[0023]
s23,反向传播监督度量特征表示学习:将步骤s22输出的伪标签联同电磁数据帧xi,输入至深度长短时记忆网络f
θ
,通过迭代优化目标函数:
[0024][0025]
更新深度长短时记忆网络结构权重矩阵θ
t
;其中,y
t-1
为上一次前向传播的聚类结果标签,lb表示反向传播损失函数;聚类目标函数设置为:
[0026][0027]
其中,xi,xj属于上一轮聚类后的同一类,xk属于xi的最近邻类,α为学习超参数,α代表堆间隔,d
θ
为学习到的度量距离,neighbor(i)为xi所属类中的其它电磁数据;
[0028]
s24,迭代优化:重复步骤s22和步骤s23,直到聚类目标函数趋于收敛或达到设置的迭代轮数,获得最终的深度长短时记忆网络结构权重矩阵θ
*
和分类器权重c
*
,最终输出电磁数据的对应标签和标签置信度g
c*
(f
θ*
(xi)),记pb=g
c*
(f
θ*
(xi));其中,pb的取值范围为0≤pb≤1。
[0029]
作为一种优选的技术方案,步骤s3包括以下步骤:
[0030]
s31,相似距离计算:计算不同电磁数据类型之间的分布距离作为类型之间的相似距离;记电磁标签r对应的电磁数据分布为pr,电磁标签s对应的电磁数据分布为ps,利用信息交叉熵计算两类型之间的相似距离d:
[0031][0032]
其中,z为分布pr的采样值,n为采样值个数;
[0033]
s32,相似度计算:将两类型之间的相似距离按照相似度转化公式:
[0034][0035]
计算得到两类型之间的相似度;
[0036]
其中,d为步骤s31计算得到的相似度距离;
[0037]
s33,相似矩阵计算:重复步骤s31、步骤s32计算所有类型两两之间的相似度,输出相似度矩阵。
[0038]
作为一种优选的技术方案,步骤s4包括以下步骤:
[0039]
s41,专家校正:将步骤s1中输出的电磁数据帧根据步骤s2输出的标签以不同标记可视化展示给领域专家,并在信息栏按照标签置信度由高到低的顺序排列显示当前电磁数据帧内步骤s2给出的机器标注标签;领域专家根据专业知识和经验对机器标注给出的每一类信号模式进行审核,针对存在标注错误的样本使用手工标注工具进行框选和标注标签修正;
[0040]
s42,标签赋值:领域专家根据训练用途将数字标签进一步修改为对应的字符标签;
[0041]
s43,同类合并:根据步骤s3输出的相似度矩阵以电磁相似图谱进行可视化展示,领域专家将相似度高属于同一类型的电磁数据进行合并。
[0042]
作为一种优选的技术方案,步骤s42中,领域专家根据数据集训练用途修改对应类型的字符标签,根据型号识别训练用途修改为对应的设备类型字符标签,根据状态识别训练用途修改为对应的状态字符标签,根据调制类型识别训练用途修改为对应的调制字符标签。
[0043]
作为一种优选的技术方案,还包括以下步骤:
[0044]
s5,重复步骤s2至s4,直至处理完成步骤s1输出的所有电磁数据帧;
[0045]
s6,数据集评分:领域专家对步骤s5完成的电磁数据质量和标注质量进行评分,输
出形成标准格式的训练数据集。
[0046]
一种基于人机混合智能的电磁数据标注系统,用于实现所述的一种基于人机混合智能的电磁数据标注方法,包括依次相连的以下模块:
[0047]
电磁数据预处理模块:用以,首先对电磁数据进行切片形成电磁数据帧,然后逐帧去除电磁数据帧内的异常值,再对电磁数据帧进行标准化处理,输出预处理后的电磁数据帧;
[0048]
去交错分离标注模块:用以,将电磁数据预处理模块预处理后的电磁数据帧输入深度长短时记忆网络学习度量特征表示,并对学习的度量特征表示进行无监督聚类;然后将聚类结果作为标签,再输送回深度长短时记忆网络进行监督学习;如此循环迭代,直到回深度长短时记忆网络收敛,输出分离标注标签及标签置信度;
[0049]
相似度矩阵计算模块:根据去交错分离标注模块生成的标注标签,计算当前电磁数据帧与历史电磁数据帧中不同类型电磁数据之间的相似度,生成相似度矩阵;其中,历史电磁数据帧指当前处理时刻以前的所有电磁数据帧;
[0050]
领域专家审核模块:根据去交错分离标注模块生成的标签置信度和相似度矩阵计算模块生成的相似度矩阵,对分离标注后电磁数据的标签进行人工审核校正。
[0051]
本发明相比于现有技术,具有以下有益效果:
[0052]
本发明利用深度聚类的电磁数据机器标注技术,将无法从传统特征维度区分或无法用统一人工规则区分的电磁目标,在上下文高维特征表示空间中完成自主聚类,提供机器标注为主、专家审核为辅的快速数据标注能力,解决电磁数据自适应精细标注难题,提升电磁数据标注质量和标注效率。
附图说明
[0053]
图1为本发明所述的一种基于人机混合智能的电磁数据标注方法的流程示意图;
[0054]
图2为图1的局部放大图之一;
[0055]
图3为图1的局部放大图之二;
[0056]
图4为本发明所述的一种基于人机混合智能的电磁数据标注系统的结构示意图;
[0057]
图5为图4的局部放大图之一;
[0058]
图6为图4的局部放大图之二。
具体实施方式
[0059]
下面结合实施例及附图,对本发明作进一步的详细说明,但本发明的实施方式不限于此。
[0060]
实施例1
[0061]
如图1至图6所示,本发明的目的是为了节约人力成本,加快标注速度,提高标注质量,公开一种基于人机混合智能的电磁数据标注方法及系统,将电磁标注工作简单化、标准化、智能化,为电磁领域专家尽量减少不必要的简单重复劳动,提升标注效率和标注质量,为智能电磁数据处理的调制识别、型号识别、状态识别、行为意图识别等提供训练支持,提升电磁领域算法模型开发效率。
[0062]
本发明方法首先对待标注的原始电磁数据进行预处理,将预处理后的电磁数据帧
进行去交错分离标注,计算分离后不同信号间的相似度矩阵,最后将分离的电磁数据、对应标签、标注置信度及相似度矩阵推送至人机交互界面,由领域专家进行审核、校正与评分。本发明方法及系统利用深度聚类的电磁数据机器标注技术,将无法从传统特征维度区分或无法用统一人工规则区分的电磁目标,在上下文高维特征表示空间中完成自主聚类,提供机器标注为主、专家审核为辅的快速数据标注能力,解决电磁数据自适应精细标注难题,提升电磁数据标注质量和标注效率。
[0063]
为了实现上述目的,本发明公开一种基于人机混合智能的电磁数据标注方法及系统。一种基于人机混合智能的电磁数据标注方法,首先对待标注的原始电磁数据进行预处理,将预处理后的电磁数据帧进行去交错分离标注,计算分离后不同信号间的相似度矩阵,最后将分离的电磁数据、对应标签、标注置信度及相似度矩阵推送至人机交互界面,由领域专家进行审核、校正与评分。
[0064]
进一步的,具体实施方法为:
[0065]
步骤s1、电磁数据预处理:首先对电磁数据进行等长切片形成电磁数据帧,然后逐帧去除电磁数据帧内的异常值;再对电磁数据帧进行标准化处理,输出预处理后的电磁数据帧。
[0066]
步骤s2、深度聚类去交错分离标注:将步骤s1预处理后的电磁数据帧输入深度长短时记忆网络学习度量特征表示,并对学习的度量特征表示进行无监督聚类;将聚类结果作为标签,再输送回深度长短时记忆网络进行监督学习;如此循环迭代,直到模型收敛,输出分离标注标签及标签置信度。
[0067]
本方法所指的去交错分离标注方法其特征在于能够对电磁特征模式在高维度量特征表示空间中进行聚类分离,有利于领域专家分析电磁信号工作特性和上下文规律。
[0068]
本方法所指的去交错分离标注方法可以是步骤s2提及的深度聚类方法,也可以是电磁信号处理领域中的其它信号分离标注方法,包括但不限于动态关联法、直方图统计法、脉冲重复间隔变换法、k-means聚类分选法和密度聚类分选法等。
[0069]
步骤s3、相似度矩阵计算:根据步骤s2生成的标注标签,计算当前电磁数据帧与历史电磁数据帧中不同类型电磁数据两两之间的相似度,生成相似度矩阵;历史电磁数据帧指当前处理时刻以前的所有电磁数据帧。
[0070]
本方法所指的相似度计算可以是步骤s3提及的利用信息交叉熵计算的分布距离,也可以是利用马氏距离、卡方距离计算的分布距离。
[0071]
步骤s4、领域专家审核:将步骤s2输出的标签置信度、步骤s3输出的相似度矩阵推送至人机交互界面,由领域专家对分离标注后电磁数据的标签进行审核确认与人工校正。
[0072]
步骤s5、重复步骤s2-s4,直至处理完成步骤s1输出的所有电磁数据帧。
[0073]
步骤s6、数据集评分:领域专家对步骤s5完成的电磁数据质量和标注质量进行评分,输出形成标准格式的训练数据集。
[0074]
其中,去交错分离标注指从随机交错的电磁数据中分离出对应信号源的电磁数据序列的搓成;深度聚类指联合深度神经网络和无监督聚类方法对电磁数据进行去交错分离标注;高维度量特征指深度聚类中神经网络学习到的高于电磁数据原特征维度的度量特征;深度长短时记忆网络结构的神经网络层数不低于2层。
[0075]
进一步的,步骤s1的具体方法为:
[0076]
步骤s11、电磁数据帧生成:对原始电磁数据序列使用固定窗口进行切片形成电磁数据帧,其中固定窗口大小为w,w≥1000。将生成的电磁数据帧逐帧输出给下列步骤进行机器标注与专家审核。
[0077]
步骤s11中生成的电磁数据帧长度可以是固定样本数大小,也可以是固定时间长度。
[0078]
步骤s12、异常值过滤:将步骤s11输出的电磁数据帧中的电磁数据按照数值由小到大进行排列,对应第25%的数值(下四分位点)取为q1,对应第75%的数值(上四分位点)取为q3,二者之差记为四分位距iqr=q
3-q1,将满足小于q
1-3iqr或大于q3+3iqr的特征值判定为异常值并去除。
[0079]
步骤s12中异常值过滤方法包括但不限于前面所述的四分位异常值过滤法,也可以是z-score、密度聚类或孤立森林等离群值检测法。
[0080]
步骤s13、标准化处理:计算经步骤s12处理后的电磁数据的均值μ和标准差σ,按照i
*
=(i-μ)/σ进行标准化处理,输出标准化后的电磁数据帧。对标准化处理后电磁数据帧内的每一个电磁数据pi,用单边侧历史时间窗以步进为1进行划窗切片,输出电磁数据pi的历史窗表示为xi=[p
i-m
,...,p
i-1
,pi],前m个电磁数据中,单边侧历史时间窗内电磁数据数目不足m,用0填充。其中,划窗大小为m,m≥8,i表示电磁数据帧内电磁数据的编号,0≤i≤w-1。
[0081]
进一步的,步骤s2的具体方法为:
[0082]
步骤s21、构建深度长短时记忆网络:输入层由划窗大小m及特征向量的输入特征数k决定,形状为m
×
k。长短时记忆层层数l,l≥2,每层的单元个数由划窗大小m决定,每个单元的输出空间维度取d(d≥32)维。输出层为全连接层,全连接层的神经元个数由待学习度量特征表示维数决定,每个神经元激活函数可以是sigmoid函数,也可以是双曲(tanh)、非线性整流(relu)等其它激活函数。
[0083]
步骤s21所指输入特征可以是全脉冲描述字的载频、重频、脉宽、脉幅及方位角等,可以是原始波形信号的相位分量、同相分量、正交分量,也可以是其它从原始波形中提取的专家特征,例如短时傅里叶变换后的时频图像,小波变换后的小波图像。
[0084]
步骤s21中构建的深度长短时记忆网络,也可以是具有时间序列学习能力的一维卷积神经网络、自编码器(autoencoder)等。
[0085]
步骤s22、前向传播无监督聚类:将步骤s13输出的电磁数据帧xi,输入至步骤s21设计好的深度长短时记忆网络结构f
θ
,输出学习到的度量特征表示f
θ
(xi),将度量特征表示f
θ
(xi)输入至分类器gc,通过迭代优化目标函数:
[0086][0087]
更新分类器权重c
t
,并预测信号对应的伪标签分类器的选择包括但不限于k-means空间聚类,层次聚类,密度聚类等。
[0088]
步骤s23、反向传播监督度量特征表示学习:将步骤s22输出的伪标签联同电磁数据帧xi,输入至深度长短时记忆网络f
θ
,通过迭代优化目标函数:
[0089][0090]
更新深度长短时记忆网络结构权重矩阵θ
t
。其中,y
t-1
为上一次前向传播的聚类结果标签。聚类目标函数设置为:
[0091][0092]
其中,xi,xj属于上一轮聚类后的同一类,xk属于xi的最近邻类。α为学习超参数,代表堆间隔。d
θ
为学习到的度量距离。
[0093]
步骤s24、迭代优化:重复步骤s22和步骤s23,直到聚类目标函数趋于收敛或达到设置的迭代轮数,获得最终的深度长短时记忆网络结构权重矩阵θ
*
和分类器权重c
*
。最终输出度量特征表示的对应数字标签和度量特征表示的置信度g
c*
(f
θ*
(xi)),记pb=g
c*
(f
θ*
(xi));其中,pb的取值范围为0≤pb≤1。
[0094]
进一步的,步骤s3的具体方法为:
[0095]
步骤s31、相似距离计算:将电磁标签r对应的电磁数据分布pr与电磁标签s对应的电磁数据分布ps按信息交叉熵公式:
[0096][0097]
计算得到两类型之间的相似距离,其中z为分布pr的采样值,n为采样值个数。
[0098]
步骤s32、相似度计算:将两类型之间的相似距离按照相似度转化公式:
[0099][0100]
计算得到两类型之间的相似度。其中,d为步骤s31计算得到的相似度距离。
[0101]
步骤s33、相似矩阵计算:重复步骤s31、s32计算所有类型两两之间的相似度,输出相似度矩阵。
[0102]
进一步的,步骤s4的具体方法为:
[0103]
步骤s41、专家校正:将步骤s1中输出的电磁数据帧根据步骤s2输出的标签以不同标记可视化展示给领域专家,并在信息栏按照标签置信度由高到低的顺序排列显示当前电磁数据帧内步骤s2给出的机器标注标签。领域专家根据专业知识和经验对机器标注给出的每一类信号模式进行审核,针对存在标注错误的样本使用手工标注工具进行框选和标注标签修正。
[0104]
步骤s42、标签赋值:领域专家根据数据集训练用途和专业知识将数字标签进一步修改为对应类型的字符标签。
[0105]
步骤s42中所指的根据数据集训练用途修改对应类型的字符标签,可以是根据型号识别训练用途修改为对应的设备类型的字符标签;也可以是根据状态识别训练用途修改为对应的搜索、跟踪、边跟边搜、同时索跟等字符标签;也可以是根据调制类型识别训练用途修改为对应的bpsk、qpsk、64qam等字符标签。
[0106]
步骤s43、同类合并:根据步骤s3输出的相似度矩阵以电磁相似图谱进行可视化展示,领域专家将相似度高属于同一类型的电磁数据进行合并。
[0107]
一种基于人机混合智能标注的电磁数据标注装置包括电磁数据预处理模块、去交错标注分离模块、相似度计算模块、领域专家审核模块。
[0108]
电磁数据预处理模块:接收待标注电磁数据,进行电磁数据帧生成、异常值过滤、标准化处理,输出固定窗口大小的电磁数据帧。输出端与去交错标注分离模块连接。
[0109]
去交错标注分离模块:接收电磁数据预处理模块输出的电磁数据帧,对电磁数据帧利用去交错分离算法将电磁数据按照相似性度量和评价准则进行归并分类,发现电磁数据的内在模式结构,形成数字标签,输出数字标签和标签置信度。输出端与相似度计算模块和领域专家审核模块连接。
[0110]
相似度计算模块:接收去交错标注分离模块输出的当前帧机器标注数据和领域专家审核模块输出的历史标注数据,计算不同类型两两之间的相似度,输出相似度矩阵。输入端与去交错标注分离模块和领域专家审核模块连接,输出端与领域专家审核模块连接。相似度计算模块也可以集成类型识别算法,将接收的分离标注数据依次进行类型识别,接收领域专家审核模块输出的已审核历史标注数据进行在线学习更新,输出识别的字符标签。
[0111]
领域专家审核模块:接收去交错标注分离模块输出的当前帧机器标注数据、对应数字标签、标注置信度,及相似度计算模块输出的相似度矩阵,以可视化人机交互形式呈现给领域专家,用于完成对机器标注数据进行专家校正、数字标签赋值、高相似类型人工合并、数据集评分等操作,输出专家审核完成的标准数据集至电磁时序数据库。输入端与去交错标注分离模块和相似度计算模块连接,输出端与电磁时序数据库连接。
[0112]
本发明提供一种基于人机混合智能的电磁数据标注方法与装置,该方法利用深度聚类的电磁数据机器标注技术,将无法从传统特征维度区分或无法用统一人工规则区分的电磁目标,在上下文高维特征表示空间中完成自主聚类,提供机器标注为主、专家审核为辅的快速数据标注能力,解决电磁数据自适应精细标注难题。在相同电磁数据标注任务中,该方法相较于传统人工数据标注方法在保证数据标注质量的同时节省成百上千倍的标注时间,显著提升面向海量电磁数据的标注效率,解决电磁领域算法快速迭代学习所需高质量数据源问题。
[0113]
实施例2
[0114]
如图1至图6所示,作为实施例1的进一步优化,在实施例1的基础上,本实施例还包括以下技术特征:
[0115]
本实施例一种基于人机混合智能的电磁数据标注方法实现流程如图1所示。具体实施步骤如下:
[0116]
s11电磁数据帧生成:对原始电磁数据序列使用固定窗口进行切片形成电磁数据帧,其中固定窗口大小为w,w≥1000。将生成的电磁数据帧逐帧输出给下列步骤进行机器标注与专家审核。
[0117]
s12异常值过滤:将s11输出的电磁数据帧按照数值由小到大进行排列,对应第25%的数值(下四分位点)取为q1,对应第75%的数值(上四分位点)取为q3,二者之差记为四分位距iqr=q
3-q1,将满足小于q
1-3iqr或大于q3+3iqr的特征值判定为异常值并去除。
[0118]
s13标准化处理:计算经s12处理后的电磁数据的均值μ和标准差σ,按照i
*
=(i-μ)/σ进行标准化处理。对标准化处理后电磁数据帧内的每一个电磁数据pi,用单边侧历史时间窗以步进为1进行划窗切片,输出电磁数据pi的历史窗表示为xi=[p
i-m
,...,p
i-1
,pi],
前m个电磁数据中,单边侧历史时间窗内电磁数据数目不足m,用0填充。其中,划窗大小为m,m≥8,i表示电磁数据帧内电磁数据的编号,0≤i≤w-1。
[0119]
s21构建深度长短时记忆网络:本实施例采用信号全脉冲描述字特征,即载频、重频、脉宽、脉幅和到达角作为输入特征。输入层由划窗大小m=64及特征向量的输入特征数k=5决定,形状为64
×
5。本实施例选用2层的长短时记忆网络,2层长短时记忆层的单元输出空间维度均设置为32维。每层长短时记忆层输入前增加一层失活层,失活概率设置为0.5。第一层的所有时刻状态输出作为输入连接至第二层长短时记忆层。第二层长短时记忆层仅最后时刻的状态输出作为下一层全连接的输入。全连接输出层神经元个数根据待学习度量特征表示维度设置为64。激活函数设置为sigmoid函数。
[0120]
s22前向传播无监督聚类:将s13输出的电磁数据帧中电磁数据的历史窗表示xi(0≤i≤w-1),输入至s21设计好的深度长短时记忆网络结构f
θ
,输出学习到的度量特征表示f
θ
(xi)。聚类分类器选择k-means空间聚类。将度量特征表示f
θ
(xi)输入至分类器gc,通过迭代优化目标函数:
[0121][0122]
更新分类器权重c
t
,并最终给出信号xi对应的伪标签其中,c
t
为聚类中心矩阵,k为聚类目标数,d=64为度量特征表示维度。为独热编码表示,满足
[0123]
s23反向传播监督度量特征表示学习:将s22输出的伪标签联同预处理后的信号xi,输入至深度长短时记忆网络f
θ
进行监督学习,通过迭代优化聚类目标函数:
[0124][0125]
更新深度长短时记忆网络结构权重矩阵θ
t
。其中,xi,xj属于上一轮聚类后的同类,xk属于xi的最近邻类。α为超参数,表示堆间隔,取0.2。
[0126]
重复s22和s23,直到聚类目标函数趋于收敛或达到设置的迭代轮数,获得最终的深度长短时记忆网络结构权重矩阵θ
*
和分类器权重c
*
。最终输出和g
c*
(f
θ*
(xi))即为机器标注给出的数字标签和对应标注置信度。
[0127]
s30相似度矩阵计算:按照相似度公式计算相似度矩阵m:
[0128][0129]
其中,m
rs
为相似矩阵m元素,对应电磁数据类型r和s的相似度,r,s∈l,l为当前所有标注标签集合,d
rs
为电磁数据类型r和s的相似距离,由对应电磁数据分布pr与ps按照信息交叉熵公式:
[0130][0131]
计算得到。其中,z为分布pr的采样值,n为采样值个数。
[0132]
s40领域专家审核:将机器标注结果用不同形状标记代表不同电磁类型数据可视化展示给领域专家,并在信息栏按照标注置信度由高到低的顺序排列展示当前帧内机器标注给出的数字标签,由领域专家根据经验和知识对机器标注结果进行审核,针对存在标注错误的样本使用手工标注工具进行框选和修正标注信息;领域专家根据本实施例数据集训练用途为型号识别将数字标签修改为对应类型的字符标签,包括类型a、类型b、类型c等;将相似矩阵以电磁相似图谱的形式展示,领域专家将相似度高属于同一类型的电磁信号通过双击两类型节点之间的边进行同类合并。
[0133]
s50遍历处理电磁数据帧:重复上述步骤直至处理完s11输出的所有电磁数据帧。
[0134]
s60数据集评分:按照1-5星级对输出的数据集标记评分,并输出标准数据集。
[0135]
图4所示为根据本实施例的一种基于人机混合智能的电磁数据标注装置的系统框架图,包括m101电磁数据预处理模块、m102去交错标注分离模块、m103相似度计算模块和m104领域专家审核模块。
[0136]
m101电磁数据预处理模块:根据本实施例从本地电磁时序数据库加载待标注原始电磁数据,生成固定窗口大小为1000的到电磁数据帧,逐帧完成异常值过滤、标准化处理,输出形状为1000
×
64
×
5的电磁数据帧。输出端与m102去交错标注分离模块连接。
[0137]
m102去交错标注分离模块:接收m101电磁数据预处理模块输出的形状为1000
×
64
×
5的电磁数据帧,对数据帧利用深度聚类将电磁数据帧进行去交错分离,并标注数字标签,输出已分离的电磁数据及对应的数字标签和标签信度。输出端与m103相似度计算模块和m104领域专家审核模块连接。
[0138]
m103相似度计算模块:接收m102去交错标注分离模块输出的当前帧机器标注数据和领域专家审核模块输出的历史标注数据,计算不同类型之间的相似度,输出相似度矩阵。输入端与m102去交错标注分离模块和m104领域专家审核模块连接,输出端与m104领域专家审核模块连接。
[0139]
m104领域专家审核模块:接收m102去交错标注分离模块输出的当前帧电磁数据、对应数字标签、标注置信度,及m103相似度计算模块输出的相似度矩阵,以时间序列图、信息列表、电磁相似图谱的形式呈现给领域专家,用于完成对机器标注的电磁数据进行专家校正、数字标签赋值、同类合并、数据集评分等操作,输出专家审核完成的标准数据集至本地电磁时序数据库进行存储。输入端与m102去交错标注分离模块和m103相似度计算模块连接,输出端与m103相似度计算模块和本地电磁时序数据库连接。
[0140]
图1至图6展示了本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。流程图或系统框架图中的每个方框可以代表一个模块、程序段或代码的一部分,上述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,m102模块和m103模块可以并行执行,也可以按相反顺序执行,依所涉及的功能而定。需要注意的是,流程图或系统框架图中的每个方框以及方框组
合,可以用执行规定功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0141]
如上所述,可较好地实现本发明。
[0142]
本说明书中所有实施例公开的所有特征,或隐含公开的所有方法或过程中的步骤,除了互相排斥的特征和/或步骤以外,均可以以任何方式组合和/或扩展、替换。
[0143]
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,依据本发明的技术实质,在本发明的精神和原则之内,对以上实施例所作的任何简单的修改、等同替换与改进等,均仍属于本发明技术方案的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1