一种腔体滤波器智能调谐算法及使用该算法的调谐方法

文档序号:9914120阅读:1083来源:国知局
一种腔体滤波器智能调谐算法及使用该算法的调谐方法
【技术领域】
[0001] 本申请涉及工业机器人和自动化领域,尤其涉及一种腔体滤波器智能调谐算法及 使用该算法的调谐方法。
【背景技术】
[0002] 腔体滤波器是一种无源微波器件,广泛应用于卫星通信、中继通信、雷达、电子对 抗及微波测量仪表中,它的使用对于分离频谱信息、提高通信质量、防止信号串扰有着十分 重要的作用。在腔体滤波器生产过程中,由于工件存在生产误差,需要调整调谐螺杆的位 置,即调整滤波器内的形状,从而使得腔体滤波器符合规格要求一一这一工序简称为"滤波 器调谐工序"。
[0003] 当前,"滤波器调谐工序"主要采用人工操作,即工人使用螺丝刀,观察矢量网络分 析仪显示的散射参数(S参数)波形的变化,根据自己的调谐经验进行判断,逐个手动调谐腔 体滤波器上的调谐螺杆,直到矢量网络分析仪显示的S参数波形符合要求。现有的人工调试 工序极为复杂:一个腔体滤波器由多路谐振腔构成,每路谐振腔均有不同的波形输出的要 求,需要通过几个至十几个调谐杆的高度来调谐。每个调谐杆的高度对整体的波形输出均 有不同的影响,调谐杆的高度的不同组合也会影响输出,且所产生影响的规律难以把握。且 调试工序还没有一套规范固定的程序,能实现快速的调谐,只能通过人工观察S参数波形, 凭借经验,不断循环尝试。据统计,对于一个调谐经验比较丰富的工人,调好一个腔体滤波 器产品,也需要花费30到40分钟,调试效率极低。
[0004] 且由于受到前段生产工艺、机械加工精度、手工作业等的影响,同一款腔体滤波器 产品也存在个体差异。作为一种十分敏感的电子产品,同种腔体滤波器产品的个体差异会 对滤波波形输出产生较大影响,即同一款腔体滤波器产品并不适用同一种调谐方式,同一 款产品中的每个个体均需不一样的调谐方式。

【发明内容】

[0005] 本申请实施例提供一种腔体滤波器智能调谐方法,用以解决现有技术中无法实现 自动化调谐腔体滤波器,人工调谐腔体滤波器效率低下、成本高昂的问题。
[0000]本申请实施例采用下述技术方案:
[0007] -种腔体滤波器智能调谐算法,其特征在于,包括:
[0008] 设定目标数据并获取实际数据,所述目标数据包括待调腔体滤波器的调谐指标、 腔体滤波器的调谐螺杆分布位置、可调位置限制、调谐螺杆数量,所述实际数据包括当前腔 体滤波器的S参数波形;
[0009] 随机采集S参数波形样本数据并获取特征向量;
[0010] 训练获得调谐策略模型,所述调谐策略模型是增强学习模型与神经网络系统的融 合,包括状态、环境、奖励、动作和策略,其中状态为当前S参数波形的降维特征,环境为待调 滤波器,动作为滤波器调谐过程中调谐螺杆的执行动作,策略为"ε_贪婪机制",根据策略挑 选动作、执行动作获得新状态和对应新奖励值以不断优化策略,使奖励值达到最佳。
[0011] 优选地,随机采集S参数波形样本数据并获取特征向量,包括:
[0012] 随机调整腔体滤波器的调谐螺杆的高度,采集若干状态下S参数波形的原始样本 数据,该样本数据包含各种螺杆高度组合对应的S参数波形;
[0013] 计算采集到的样本数据的协方差矩阵;
[0014] 利用奇异值分解求出协方差矩阵的特征向量和特征值,并将特征值按大到小排 序;
[0015] 选取前k个最大的特征值对应的特征向量得到S参数波形的特征向量。
[0016] 优选地,选取前k个最大的特征值对应的特征向量得到S参数波形的特征向量,其 中,所述k为5。
[0017]优选地,训练获得调谐策略模型,包括:
[0018] 初始化调谐策略模型,包括设置待调滤波器的调谐指标、神经网络的各参数、数据 储存空间大小、样本抽取数量、训练周期数、最大调谐步数;
[0019] 从数据空间中随机采样以获取训练样本;每组样本数据包括"原状态(St)、动作 Ut)、新状态(st+1)、该动作的奖励值(rt)"四部分,其中"原状态"为某时刻的S参数波形经数 据降维后的特征,"动作"为某个可执行的调谐螺杆的调谐动作,"新状态"为相对于"原状 态",指在执行"动作"后得到的S参数波形降维后的特征,"该动作的奖励值"为经过以上动 作获取到的奖励值,根据当前S参数波形与调谐目标S参数波形的欧氏距离计算得到;
[0020] 用训练样本数据训练并更新Q网络,其中输入为训练样本数据中的"原状态",输出 目标为各执行动作对应的Q值,依据如下公式计算:
[0021]
[0022] 其中,rt表示第t步的奖励值,w和b为Q网络的参数,即神经网络各层的权值和偏 置,& +1为"新状态",at+A "新状态"下可执行的有效动作,γ为设定的折扣因子;
[0023] 采样待调滤波器的当前状态的S参数波形,输入当前状态S参数波形降维后特征, 经过Q网络预测获得各个执行动作对应的Q值;
[0024] 以"ε-贪婪机制"选取合适的Q值对应的执行动作并作用于调谐螺杆,完成本次的 滤波器调谐动作;
[0025] 采样待调滤波器执行调谐动作后的S参数波形,计算与调谐目标S参数波形的欧氏 距离,计算出本次动作执行的奖励值。
[0026] 对执行调谐动作后获得的S参数波形进行数据降维处理;
[0027] 保存本次执行动作的数据组到数据存储空间,数据组包括原状态(St)、动作(at)、 新状态(s t+1)、该动作的奖励值(rt)。
[0028] 优选地,在保存执行调谐动作的数据组到存储空间后,还包括步骤:
[0029] 判断当前的S参数波形是否达到目标S参数波形:
[0030] 若当前的S参数波形达到目标S参数波形,则退出本周期的训练过程;
[0031] 若当前的S参数波形未达到目标S参数波形,且未超出最大执行步数,则跳转至步 骤"从数据空间中随机采样以获取训练样本"继续优化;
[0032]若当前的S参数波形未达到目标S参数波形,且已超出最大执行步数,则退出本周 期训练过程。
[0033] 优选地,从数据空间中随机采样以获取训练样本,包括:
[0034] 若存储空间中无样本数据,则设置本次的样本数据全为0;
[0035] 若存储空间中样本数据不足预设数量,则进行重复抽取直至达到预设数量。
[0036] 优选地,调谐策略模型的Q网络是通过一个单隐层前向传播神经网络来实现的,即 具有一个输入层、一个输出层,一个中间隐藏层,其中神经网络的隐藏层神经元个数为m个, 输入层为数据存储空间中抽取的样本数据的"原状态",输出层为每个可执行动作对应的Q 值,激活函数为S型函数,神经网络参数的优化方法为随机梯度下降的方法。
[0037] 优选地,定义每根调谐螺杆以某个固定角度顺、逆时针旋转,Q网络输出单元的个 数为调谐螺杆根数的2倍。
[0038] -种使用腔体滤波器智能调谐算法的调谐方法,包括:
[0039] 安装连接调谐系统,所述调谐系统包括工控机系统、连接工控机系统的机械执行 机构、置于所述机械执行机构内的腔体滤波器、连接工控机系统与腔体滤波器的矢量网络 分析仪;
[0040] 采样当前待调腔体滤波器的S参数波形;
[0041 ]将采样的S参数波形降维处理得到该S参数波形的降维特征;
[0042] 将当前S参数波形的降维特征输入预先训练好的调谐策略模型计算出待调腔体滤 波器需执行的调谐动作;选择动作的方式仍然为"ε_贪婪机制",此时ε固定为一个较小的数 值,如0.1;
[0043] 输出计算得到的调谐动作指令并依据所述调谐动作指令调节所述腔体滤波器的 调谐螺杆。
[0044] 优选地,在输出计算得到的调谐动作指令并依据所述调谐动作指令调节所述腔体 滤波器的调谐螺杆之后,还包括步骤:
[0045] 采样执行所述调谐动作后的腔体滤波器的S参数波形并与目
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1