信息融合定位系统卫星信号环境的自适应判别方法与流程

文档序号：26001123发布日期：2021-07-23 21:17阅读：来源：国知局

技术特征：

1.一种信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述方法以rnn网络单元为基本结构单元；由于模型中间层存在循环权重，rnn在处理时间序列数据时，能够将前一时刻数据的特征信息传递至下一时刻；本方法实施过程中，在由5个rnn单元组成的自适应判别模型实施的情况下，模型的输入为i，对于5个rnn单元而言，其各自的输入为it-4至it，中间层数据为s，对于5个rnn单元而言，其各自的中间层数据为st-4至st，单组数据的最终输出为o，对于5个rnn单元而言，其各自的最终输出为ot-4至ot；

ik，sk和ok，k＝t-4,t-3,t-2,t-1,t分别是维度为p,q,r的一维向量；模型参数包括u，v以及w；其中，u为rnn网络单元的输入权重，是一个p×q的矩阵，v是rnn网络单元的输出权重，是q×r的矩阵，w是rnn网络单元接受上一时刻中间层输入的权重，是一个q×q的矩阵；自适应判别模型将5个时间帧的输入it-4至it作为一组数据输入模型，并得到当前标志当前卫星信号环境是否良好的标志位ot；

该自适应判别模型在对卫星信号环境状态进行推理之前需要对u，v以及w进行训练；

由此，所述自适应判别方法的训练以及推理包括以下步骤：

步骤1：选取训练样本以及标签；

本步骤选取gps信息中的时间状态、接受状态、系统状态、信号质量、卫星健康标识、用户测距精度以及组合导航数据中的跟踪位置、速度、航向角作为自适应判别模型系统的输入，对应于所述ik，k∈(t-4,t-3,t-2,t-1,t)；

在完成上述训练样本选择后，对模型输出ok对应的标签值进行构造；取k时刻导航卫星信号位置坐标与k-1时刻位置坐标的差δd作为k时刻的标志值并设定一个阈值δ，当δd小于阈值δ时，将k时刻的准标签值设置为1，表征多源信息融合定位系统该时刻获取的导航卫星信号是可信的；否则设置为0，表征系统该时刻导航卫星信号不可信；

按照上述方式，利用无人系统在测试环境中对上述输入量以及导航卫星信号坐标进行数据采集；将5帧连续样本准标签值为1的卫星信号样本片段提取出来，并将其标签值设置为1，表征原型系统能够获取导航卫星信号；对所有准标签值为0的样本同样截取连续5帧的片段进行分析，当其临近的固定帧数样本均为0时，将该片段提取出来，并将该片段的标签值设置为0，表示定位系统无法获取导航卫星信号或获取到的卫星信号不可使用；由于训练样本与标签值要求严格的时间一致性，故上述所有信息的采集必须经过同步处理；

步骤2：对采集到的样本数据进行初步权重计算和批标准化处理；

自适应判别模型中的u，v，w均为权重矩阵，自适应判别模型首先将样本数据利用u进行初步权重计算并进行bn操作；bn操作是指在模型训练步骤中，一次性将多个不同的中间输入进行一定处理后再进行后续计算，这样的操作可以在后续的训练过程中利用矩阵并行计算，加速其训练过程并提高模型判别精度；

具体来讲，设i为自适应判别模型的输入，并令x＝ui，则x表示经历过输入层权重处理，但未进行bn处理的单批数据；

设为bn处理之前的单批数据x在类别维度上的平均值；

其中，xi表示x中的单个类别输入，包括时间状态、接受状态、跟踪位置；m表示同批次输入样本数；

为bn处理之前的单批数据方差，则可对输入做如下变换：

并有：

式中，ε是微小常数，避免出现除零情况的发生，为经过过标准化处理的输入数据，yi是经过变换后的输入数据，bnγ,β(xi)代表bn操作，γ和β是权重参数，这两个参数是在后续反向传播过程中加以确定；

步骤3：批处理操作之后的数据正向传播及误差反向传播；

首先明确自适应判别模型的重要参数；在步骤1中，已经将自适应判别模型的rnn网络单元数目设置为5，单个rnn网络单元的输入i维度设置为30；输出o表征当前时刻的卫星环境状态是否可信，故用o＝1表示可信，o＝0表示不可信，将o的维度设置为1；

模型训练首先进行输入数据的前项传播，设t时刻神经单元的隐藏层数据为st，则该模型的正向传播过程表示为：

st＝sigmoid(uyt+wst-1)(3)

ot＝tanh(vst)(4)

式中，st和ot分别为t时刻的隐藏层数据以及输出数据，yt为步骤1中yi的向量表示形式；sigmoid和tanh分别表示sigmoid函数和tanh函数；通过上述公式可以看到，ot实际上包含了整个五个输入帧的输入特征；

之后通过反向传播对自适应判别模型权重u,w和v进行更新；在反向传播过程中，定义损失函数：

其中，表示t-4至t时刻的总损失，表示代表t-4至t任意值的单一k时刻的输出值与标签值之间的损失,如无特殊说明，e即代指ot为自适应判别模型的输出，为样本标签值,ok,分别代表k时刻模型的暂时输出与准标签值；

由于参数矩阵v与ot具有更为直接的关系，故先对参数矩阵v进行误差反向传播并进行更新；

其中，

该处为sk的转置，×表示矩阵运算，*表示hadamard积，下同；

所以，参数矩阵v的更新方式即为：

其中，a为学习率；

由于自适应判别模型采用rnn网络单元，故其误差在反向传播的过程中涉及到时间以及空间两个维度上的误差积累，为了对参数矩阵u以及w进行更新，首先对自适应判别模型在反向传播过程中的一些中间变量先进行求解；

为方便表示，令有如下等式：

通过上述中间变量，求解u以及w的梯度变化，有如下等式：

所以u和w的更新可以用如下方式表达：

其中b和c分别是学习率；

至此，自适应判别模型的三个权重矩阵即完成了更新；

除此之外，还需对bn操作中的γ和β进行更新；

式(17)，(18)中，p和q同样是学习率；

整个自适应判别模型的权重更新规则如上所述；在实际操作中，将足量的导航卫星信号训练数据制作为满足上述输入输出要求的数据集；并将数据集按8:1:1的比例分割为训练集，验证集以及测试集；选取合适的单批数据量m，依次将训练集各个批次的数据输入自适应判别模型；每次将m组数据输入自适应判别模型后，计算模型输出与标签值的误差，并进行反向传播过程，更新权重矩阵和批处理化参数；设定模型对整个训练集遍历一遍为一个epoch，每次训练完成一个epoch，使用验证集对模型效果进行验证，观察模型准确率变化，防止过拟合现象的发生；

步骤4：对上述训练好的模型利用测试集进行评价，将满足测试集准确度要求的多源信息融合定位系统卫星信号环境的自适应判别方法模型进行保存；在利用自适应模型进行卫星信号环境的判别过程中，将输入数据的单批次输入量m设置为1以保证模型输入维度与真实信息输入维度相匹配；由于m＝1，在批处理化的正向传播中，均值μb和方差不再具有参考性，此时假设实际环境与训练集的数据独立同分布，将推理过程中的μb和设置为整个训练集中输入数据的μb和即可；对于模型的输出ot，其取值范围应在0到1之间，若其值大于0.5，认为当前导航卫星信号环境良好，卫星数据可信，否则认为卫星信号环境质量较差，卫星数据存在较大噪音。

2.如权利要求1所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤2中，所述m的数值根据计算系统内存决定。

3.如权利要求2所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤2中，所述m的数值取64。

4.如权利要求2所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤2中，所述m的数值取128。

5.如权利要求2所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤2中，所述m的数值取256。

6.如权利要求1所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤3中，a取0.01至0.05之间的数值。

7.如权利要求1所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤3中，b取0.01到0.05之间的数值。

8.如权利要求1所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤3中，c取0.01到0.05之间的数值。

9.如权利要求1所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤3中，p取0.05至0.1之间的数值。

10.如权利要求1所述的信息融合定位系统卫星信号环境的自适应判别方法，其特征在于，所述步骤3中，q取0.05至0.1之间的数值。

技术总结
本发明属于导航定位或机器人技术领域，具体涉及一种信息融合定位系统卫星信号环境的自适应判别方法。该方法包括：选取训练样本以及标签；对采集到的样本数据进行初步权重计算和批标准化处理；批处理操作之后的数据正向传播及误差反向传播；对上述训练好的模型利用测试集进行评价；该方法采用基于RNN的多源信息融合定位系统卫星信号环境的自适应判别方法，能够有效对智能系统运行环境的导航卫星信号状态进行特征抽取，根据连续时间段内的卫星信号状态特征输出当前时刻卫星信号状态判别值，实现智能无人系统的信息融合定位系统对卫星信号环境的自适应判别。

技术研发人员：李靖宇;康晓;海丹;靳璐;靳保;吴越;苏波
受保护的技术使用者：中国北方车辆研究所
技术研发日：2021.03.04
技术公布日：2021.07.23

完整全部详细技术资料下载

当前第2页1 2