一种面向联合跟踪和抗干扰的波形优化方法

文档序号:36011981发布日期:2023-11-17 06:28阅读:53来源:国知局
一种面向联合跟踪和抗干扰的波形优化方法

本发明涉及雷达波形优化,具体为一种面向联合跟踪和抗干扰的波形优化方法。


背景技术:

1、基于全自适应架构的认知跟踪雷达(ctr)可以通过动态优化波形实现更好的跟踪性能。然而,受频谱拍卖和频谱重新分配的影响,当前的雷达系统不得不在拥挤的频谱环境中运行,由于与其他带内射频用户(如通信系统)同频共存,ctr的波形捷变跟踪性能会受到日益严重的射频干扰(rfi)的影响。

2、相关研究人员已经开始研究如何通过优化ctr的波形,以提升跟踪性能,同时减轻其他带内射频用户造成的射频干扰。ersin selvi和r.michael buehrer首先使用马尔可夫决策过程(mdp)来描述ctr与通信系统之间的交互过程。该团队进一步扩展了上述工作,考虑了更多类型的通信干扰,并引入了感知与规避(saa)方法进行比较。markkozy引入深度q网络(dqn)进一步降低了计算复杂度。charles e.thornton引入双深度递归q网络(ddrqn)可进一步提高平均信干噪比(sinr)和带宽,并在软件定义雷达(sdradar)上进行试验分析。上述基于mdp的方法进一步提高了频谱拥塞环境下的目标跟踪性能,但由于假定目标的状态转换是固定的,雷达可以直接观测目标状态,而没有对雷达测量过程和状态不确定性进行建模,此举过分简化了目标跟踪过程。同时,仅优化频谱占用以提高sinr和带宽,而没有考虑更多的波形参数(如脉冲宽度)和最终的跟踪性能指标(如状态估计误差)。因此,不能在降低射频干扰的同时提升跟踪性能。

3、以下研究人员已经开始考虑如何改善上述局限性。charles.e.thornton引入上下文赌博机方法(exp3)优化线性调频信号(lfm)的脉冲宽度和调频斜率以提升目标状态估计的均方根误差(rmse)。r.michael buehrer进而使用上下树加权方法(ctw)进一步改善目标跟踪的rmse。kristine bell所提方法可以减轻射频干扰并进一步提升扩展卡尔曼滤波器的距离估计性能。anthony f.martone和charles e.thornton所提出的贝叶斯元学习方法可以进一步提升波形优化的采样效率和在线学习能力。

4、可见,上述相关工作已经开始考虑目标状态转换和噪声量测的不确定性,并优化更多波形参数以提高状态估计性能。然而,这种频谱拥塞环境下的跟踪波形优化问题本质上可以看作面向联合跟踪和抗干扰的波形优化问题为了在降低射频干扰的同时提升跟踪性能,需要根据实时感知信息对认知跟踪雷达的频谱占用(即频段选择)和波形参数进行联合优化,不仅仅要考虑状态的不确定性,还要考虑跟踪和抗干扰之间的耦合相关性,包括可重复使用的信息、相互关联的任务性能,特别是如何平衡两种任务性能的相对重要性,研究这种面向联合跟踪和抗干扰的波形优化方法具有重要意义。


技术实现思路

1、本发明的目的是:针对现有技术中由于假定目标的状态转换是固定的,雷达可以直接观测目标状态,而没有对雷达测量过程和状态不确定性进行建模,此举过分简化了目标跟踪过程。同时,仅优化频谱占用以提高sinr和带宽,而没有考虑更多的波形参数(如脉冲宽度)和最终的跟踪性能指标(如状态估计误差)。因此导致不能在降低射频干扰的同时提升跟踪性能的问题,提出一种面向联合跟踪和抗干扰的波形优化方法。

2、本发明为了解决上述技术问题采取的技术方案是:

3、一种面向联合跟踪和抗干扰的波形优化方法,包括以下步骤:

4、首先获取雷达回波数据,并定义每个雷达置信状态b和每个雷达频段占用动作β,之后初始化动作价值q(b,β)和频段占用策略πβ(β|b),所述雷达置信状态包括目标状态和射频干扰状态,对时间步k依次执行以下步骤,k=1,...,n:

5、步骤一:构建雷达置信状态bk-1,即其中,表示射频干扰状态的估计,表示目标状态的一步预测值的估计,pk|k-1表示目标的预测状态误差协方差,表示正态分布标识符;

6、步骤二:基于雷达置信状态bk-1,采用雷达频段占用策略生成雷达频段占用动作βk,雷达频段占用策略表示为:

7、

8、其中,表示与雷达置信状态bk-1相关的频谱占用动作数量,∈∈(0,1)表示随时间逐渐降低的贪婪率,qk表示动作价值;

9、步骤三:基于雷达频段占用动作βk,生成频谱代价函数cb(θk|βk),并将频谱代价函数cb(θk|βk)作为波形参数优化的实时频谱约束条件;

10、步骤四:基于雷达置信状态bk-1,选择波形优化准则,生成目标跟踪的条件预测贝叶斯风险所述波形优化准则包括最小均方误差准则、最小验证门体积准则以及最大互信息准则;

11、步骤五:基于雷达波形类型和波形参数,构建雷达波形库,其中波形类型包括线性调频信号、功率调频信号、双曲调频信号以及指数调频信号,波形参数包括调频斜率和脉冲宽度;

12、步骤六:基于雷达波形库,随机选取雷达波形类型wtype,并设计雷达波形类型wtype对应的波形代价函数rθ(λ,kr|wtype);

13、步骤七:基于频谱代价函数cb(θk|βk)、条件预测贝叶斯风险和波形代价函数rθ(λ,kr wtype),构建执行处理器代价函数lc,θ,b(θk|z1:k-1;θ1:k-1),并根据执行处理器代价函数lc,θ,b(θk|z1:k-1;θ1:k-1)生成波形选择策略πθ(θk|bk-1,βk);

14、步骤八:基于步骤三中波形参数优化的实时频谱约束条件,之后将执行处理器代价函数lc,θ,b(θk|z1:k-1;θ1:k-1)中的加权函数设置为求和函数,之后通过求解以下等价的约束优化问题,并通过矩形网格搜索,得到最优波形参数

15、

16、

17、其中,tr[·]算子表示相应矩阵的迹,det[·]表示行列式,sk(θk)和pk|k(θk)分别为量测协方差矩阵和后验估计误差协方差矩阵,θk表示待优化的波形参数,θk包括脉冲宽度λ、调频速率kr和波形类型wtype,mmse表示最小均方误差准则,mvgv表示最小验证门体积准则,mmi表示最大互信息准则,和分别表示波形类型wtype对应的脉冲宽度λ的最小值和最大值,和分别表示波形类型wtype对应的调频斜率kr的最小值和最大值,和分别表示脉冲宽度λ和调频斜率kr的步进增量,δb表示一个子频段的频段宽度,bθ(θk)表示θk对应的带宽,bβ(βk)表示频段占用动作βk对应的带宽;

18、步骤九:根据最优波形参数和频段占用动作βk,得到对应的雷达回波信号,并根据对应的雷达回波信号进行匹配滤波和后端雷达数据处理,进而更新雷达置信状态bk,更新后的置信状态bk表示为其中,表示基于目标测量值zk的目标状态估计;

19、步骤十:基于雷达置信状态bk-1、更新后的雷达置信状态bk和频段占用动作βk,生成奖励函数

20、步骤十一:基于奖励函数频段占用动作βk、雷达置信状态bk-1和雷达置信状态bk,更新动作(bk-1,βk),得到更新后的动作价值qk+1(bk-1,β),对其他没有访问到的置信状态动作对,对应的q值保持不变,即

21、

22、其中,αk(bk-1,βk)∈(0,1)表示学习率,δk表示时序差分误差,δk表示为:

23、

24、其中,γ∈(0,1)表示折现因子,qk(bk-1,βk)表示当处于雷达置信状态bk-1时,基于频段占用策略采取频谱占用动作βk时对应的动作价值表示为:

25、

26、其中,表示处于置信状态bk-1时执行频谱占用动作βk到达雷达置信状态bk的预期收益,表示与未来l1步中的未来置信状态相关的预期值,其中表示用于评估频段占用策略的累积多步子奖励函数;

27、步骤十二:基于更新后的动作价值qk+1(bk-1,β),得到雷达频段占用策略

28、步骤十三:重复上述步骤进行迭代,直至收敛,得到最优频谱占用策略和最优波形选择策略

29、进一步的,所述频谱代价函数cb(θk|βk)表示为:

30、

31、其中,δb表示一个子频段的频段宽度,频段占用动作βk对应的带宽表示为θk表示待优化的波形参数,θk包括脉冲宽度λ、调频速率kr和波形类型wtype,即θk=[λ,kr,wtype]t,θk对应的带宽表示为:

32、

33、进一步的,所述条件预测贝叶斯风险表示为:

34、

35、其中,tr[·]算子表示相应矩阵的迹,det[·]表示行列式,sk(θk)和pk|k(θk)分别为量测协方差矩阵和后验估计误差协方差矩阵,sk(θk)和pk|k(θk)分别表示为:

36、

37、其中,pk|k-1表示目标的预测状态误差协方差,hk表示目标量测矩阵,r(θk)表述量测误差协方差,qk-1表示目标运动误差协方差,fk-1表示目标状态转换矩阵。

38、进一步的,所述波形代价函数rθ(λ,kr|wtype)表示为:

39、

40、进一步的,所述波形选择策略πθ(θk|bk-1,βk)表示为:

41、

42、

43、进一步的,所述基于目标测量值zk的目标状态估计表示为:

44、

45、其中,xk|k-1表示目标状态的一步预测值,kk(θk)表示卡尔曼滤波增益。

46、进一步的,所述奖励函数表示为:

47、

48、

49、其中,rsinr(·)表示回波信干噪比对应的奖励,表示回波信号的信干噪比,rb(βk)表示认知跟踪雷达占用子带数量的奖励,rh(βk)表示认知跟踪雷达占用最高子频段的奖励。

50、进一步的,所述用于评估频段占用策略的累积多步子奖励函数表示为:

51、

52、进一步的,所述雷达频段占用策略表示为:

53、

54、其中,表示与置信状态bk-1相关的频谱占用动作空间的大小。

55、进一步的,所述最优频谱占用策略和最优波形选择策略表示为:

56、

57、其中,β*(bk-1)表示在置信状态bk-1下基于策略的最优频段占用动作,表示为:

58、

59、其中,表示基于频谱占用策略下的最优状态价值。

60、本发明的有益效果是:

61、本技术基于所提出面向联合跟踪和抗干扰的多步代价函数,所提出的一种面向联合跟踪和抗干扰的波形优化方法可以同时优化频段占用和波形参数,从而提高抗干扰(即干扰规避)和目标跟踪性能;本技术所提出的混合随机-确定性波形优化方法具有在线学习能力,可以通过从交互经验样本中训练来学习射频干扰的行为和目标状态转换特性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1