基于哈密顿结构网络的机械系统物理参数求解方法

文档序号:30335026发布日期:2022-06-08 06:35阅读:120来源:国知局
基于哈密顿结构网络的机械系统物理参数求解方法

1.本公开实施例涉及数据处理技术领域,尤其涉及一种基于哈密顿结构网络的机械系统物理参数求解方法。


背景技术:

2.目前,随着工业化进程的加快,工业生产的机械设备或者机械系统管理对于提升工业生产效率或者延长系统寿命都是重要的影响因素,如何管理机械系统则通过实时计算机械系统的物理参数以获取系统运行状态,而现有的机械系统参数求解方法存在需要较多专家知识和机械系统的控制量为动态时无法求解的问题,例如,传统的最小二乘法,卡尔曼滤波等方法,要求专家对机械系统的机理进行分析,选取状态变量和模型结构,再设计输入输出试验,来确定状态变量与输入变量之间的映射关系,从而进行求解。或者,基于ode-net等方法的深度学习求解器,通过最小化机械系统预测状态和真实状态的误差,来进行特定参数求解,求解过程与控制过程分离,只适用控制器的控制量为静态的情况,在控制量为动态时,求解器无法求解。
3.可见,现有的机械系统物理参数求解方法存在适应性和计算效率较差的问题。


技术实现要素:

4.有鉴于此,本公开实施例提供一种基于哈密顿结构网络的机械系统物理参数求解方法,至少部分解决现有技术中存在适应性和计算效率较差的问题。
5.本公开实施例提供了一种基于哈密顿结构网络的机械系统物理参数求解方法,包括:
6.获取样本机械系统的历史运行数据作为时序序列数据集,其中,所述时序序列数据集包括系统状态变量和对应的控制量,所述系统状态变量包括广义坐标和广义动量;
7.将所述时序序列数据集输入哈密顿结构网络进行求导,得到所述广义坐标对应的第一导值和所述广义动量对应的第二导值;
8.根据所述第一导值和所述第二导值计算所述广义坐标和所述广义动量的预测误差;
9.最小化所述广义坐标和所述广义动量的预测误差,得到所述哈密顿结构网络的损失函数;
10.使用预设优化器对所述损失函数进行梯度下降迭代训练,直到所述损失函数收敛至预设条件时,保存本次迭代的哈密顿结构网络作为求解模型;
11.将采集到的目标机械系统的轨迹数据输入所述求解模型,得到所述目标机械系统对应的物理参数。
12.根据本公开实施例的一种具体实现方式,所述获取样本机械系统的历史运行数据作为时序序列数据集的步骤之前,所述方法还包括:
13.在预设时段内,通过控制器的控制动作量与所述样本机械系统进行交互,生成所
述历史运行数据。
14.根据本公开实施例的一种具体实现方式,所述将所述时序序列数据集输入哈密顿结构网络进行求导,得到所述广义坐标对应的第一导值和所述广义动量对应的第二导值的步骤,包括:
15.将所述广义坐标和所述广义动量转换为二维角度量,并根据所述样本机械系统对应的哈密顿力学公式计算所述第一导值和所述第二导值。
16.根据本公开实施例的一种具体实现方式,所述哈密顿结构网络包括惯性矩阵、势能项和输入矩阵。
17.根据本公开实施例的一种具体实现方式,所述将采集到的目标机械系统的轨迹数据输入所述求解模型,得到所述目标机械系统对应的物理参数的步骤,包括:
18.将所述轨迹数据输入所述求解模型,通过所述惯性矩阵、所述势能项和所述输入矩阵分别求解所述目标机械系统的惯性值、势能值和输入值。
19.根据本公开实施例的一种具体实现方式,所述预设优化器为adam优化器。
20.本公开实施例中的基于哈密顿结构网络的机械系统物理参数求解方案,包括:获取样本机械系统的历史运行数据作为时序序列数据集,其中,所述时序序列数据集包括系统状态变量和对应的控制量,所述系统状态变量包括广义坐标和广义动量;将所述时序序列数据集输入哈密顿结构网络进行求导,得到所述广义坐标对应的第一导值和所述广义动量对应的第二导值;根据所述第一导值和所述第二导值计算所述广义坐标和所述广义动量的预测误差;最小化所述广义坐标和所述广义动量的预测误差,得到所述哈密顿结构网络的损失函数;使用预设优化器对所述损失函数进行梯度下降迭代训练,直到所述损失函数收敛至预设条件时,保存本次迭代的哈密顿结构网络作为求解模型;将采集到的目标机械系统的轨迹数据输入所述求解模型,得到所述目标机械系统对应的物理参数。
21.本公开实施例的有益效果为:通过本公开的方案,将哈密顿动力学先验知识以结构化的方式引入深度神经网络中,采用深度神经网络对哈密顿动力学的关键结构进行描述,构建机械系统物理参数求解模型,提高了机械系统物理参数求解的适应性和计算效率。
附图说明
22.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
23.图1为本公开实施例提供的一种基于哈密顿结构网络的机械系统物理参数求解方法的流程示意图;
24.图2为本公开实施例提供的一种单极倒立摆系统示意图;
25.图3为本公开实施例提供的一种哈密顿结构化的参数求解模型示意图;
26.图4为本公开实施例提供的一种pendulum系统哈密顿结构化部分参数求解结果示意图;
27.图5为本公开实施例提供的一种pendulum系统角度量转换下的哈密顿结构化模型求解结果示意图;
28.图6为本公开实施例提供的一种pendulum系统角度量转换下的哈密顿结构化模型
求解误差分析示意图。
具体实施方式
29.下面结合附图对本公开实施例进行详细描述。
30.以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
31.需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
32.还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图式中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
33.另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
34.本公开实施例提供一种基于哈密顿结构网络的机械系统物理参数求解方法,所述方法可以应用于工业场景的机械系统控制流程。
35.参见图1,为本公开实施例提供的一种基于哈密顿结构网络的机械系统物理参数求解方法的流程示意图。如图1所示,所述方法主要包括以下步骤:
36.s101,获取样本机械系统的历史运行数据作为时序序列数据集,其中,所述时序序列数据集包括系统状态变量和对应的控制量,所述系统状态变量包括广义坐标和广义动量;
37.可选的,步骤s101所述的,获取样本机械系统的历史运行数据作为时序序列数据集之前,所述方法还包括:
38.在预设时段内,通过控制器的控制动作量与所述样本机械系统进行交互,生成所述历史运行数据。
39.例如,当需要计算的机械系统为单极倒立摆系统,如图2所示,则可以将一个单极倒立摆系统作为所述样本机械系统,然后在所述预设时段内,例如在30天内,使用drl控制器与倒立摆系统环境进行交互探索,获得运行过程中系统状态变量以及对应控制量的时序序列数据集(x,u)。
40.可以使用哈密顿力学对所述系统状态变量进行描述。哈密顿动力学的主要目的是使用广义动量(也称为共轭动量)取代广义速度。哈密顿动力学跟踪相空间中系统的状态变化,即广义坐标和广义动量提供了对称的正则运动方程。
41.在哈密顿动力学中,哈密顿量h(q,p)与系统的总能量相同,因此可以由式(1)表示:
42.h(q,p)=τ(q,p)+v(q)
ꢀꢀꢀ
(1)
43.其中τ(q,p)为系统的动能项,v(q)为系统的势能项。同样地,对任何机械系统,动能项都可以用式(2)表示:
[0044][0045]
式(2)中的m(q)是对称正定惯性矩阵,其正定性同样保证了所有非零速度能够产生正动能。因此,哈密顿量可以写成式(3)的形式:
[0046][0047]
s102,将所述时序序列数据集输入哈密顿结构网络进行求导,得到所述广义坐标对应的第一导值和所述广义动量对应的第二导值;
[0048]
进一步的,步骤s102所述的,将所述时序序列数据集输入哈密顿结构网络进行求导,得到所述广义坐标对应的第一导值和所述广义动量对应的第二导值,包括:
[0049]
将所述广义坐标和所述广义动量转换为二维角度量,并根据所述样本机械系统对应的哈密顿力学公式计算所述第一导值和所述第二导值。
[0050]
可选的,所述哈密顿结构网络包括惯性矩阵、势能项和输入矩阵。
[0051]
具体实施时,如图3所示,在得到所述时序序列数据集并将所述系统状态变量利用哈密顿量表示后,相应地可以得到式(4)和式(5)的正则方程,两个等式的右边称为哈密顿量的辛梯度,
[0052][0053][0054]
系统的总能量随着系统的运行保持守恒,由式(6)体现
[0055][0056]
同时式(6)也说明哈密顿量沿辛梯度保持常数。对机械系统施加外作用力会影响广义动量,即变成式(7),
[0057][0058]
其中,输入矩阵g(q)满秩时为全驱系统。当外作用力u为零时,则为经典哈密顿动力学,系统与环境进行无耗散能量交换并保持总能量守恒。
[0059]
为更好地将相关动力学先验知识引入倒立摆物理参数求解的方法中,本发明转换角度量以适应物理参数求解所需要的数据形式。转换角度量的具体方式是,将系统中的几何角度广义坐标转换成二维的cos,sin形式,即从广义形式转换成二维角度量形式
[0060]
由于哈密顿动力学中还涉及广义动量,因此也需要对其进行处理,即由于哈密顿动力学中还涉及广义动量,因此也需要对其进行处理,即根据角度值到二维角度量转换的相应关系,可以将x1,x2,x3的导数写成式(8),
[0061][0062]
根据(6)中一般化的哈密顿动力学(公式)形式,在此通过转换后,则由h(q,p)转换为h(x1,x2,p),可以得到所述第一导值如式(9)所示,以及,得到所述第二导值如式(10)所示,
[0063][0064][0065]
s103,根据所述第一导值和所述第二导值计算所述广义坐标和所述广义动量的预测误差;
[0066]
具体实施时,在得到所述第一导值和所述第二导值后,可以进一步的根据根据式(9)和(10)分别计算所述第一导值对应的预测值和所述第二导值对应的预测值然后得到所述广义坐标和所述广义动量的预测误差。
[0067]
s104,最小化所述广义坐标和所述广义动量的预测误差,得到所述哈密顿结构网络的损失函数;
[0068]
具体实施时,在得到所述广义坐标和所述广义动量的预测误差后,根据式(7),通过最小化广义坐标与广义动量的预测误差,可推导获得式(11)中的损失函数,以该损失函数作为所述哈密顿结构网络的损失函数loss。
[0069][0070]
其中,所述哈密顿结构网络输出的h和p为式(12)与(13),
[0071][0072][0073]
s105,使用预设优化器对所述损失函数进行梯度下降迭代训练,直到所述损失函数收敛至预设条件时,保存本次迭代的哈密顿结构网络作为求解模型;
[0074]
可选的,所述预设优化器为adam优化器。
[0075]
具体实施时,在得到所述损失函数后,可以使用adam优化器对所述损失函数进行梯度下降。经过一定回合的训练,损失函数会不断下降并逐渐收敛至一定水平,保存模型后停止训练,将本次迭代的哈密顿结构网络作为求解模型。
[0076]
s106,将采集到的目标机械系统的轨迹数据输入所述求解模型,得到所述目标机械系统对应的物理参数。
[0077]
可选的,步骤s106所述的,将采集到的目标机械系统的轨迹数据输入所述求解模型,得到所述目标机械系统对应的物理参数,包括:
[0078]
将所述轨迹数据输入所述求解模型,通过所述惯性矩阵、所述势能项和所述输入矩阵分别求解所述目标机械系统的惯性值、势能值和输入值。
[0079]
具体实施时,将需要对其他机械系统进行物理参数求解时,则可以先实时采集所述目标机械系统的轨迹数据,然后将所述轨迹数据输入所述求解模型,通过所述求解模型的所述惯性矩阵、所述势能项和所述输入矩阵分别求解所述目标机械系统的惯性值、势能值和输入值。
[0080]
本实施例提供的基于哈密顿结构网络的机械系统物理参数求解方法,通过将哈密顿动力学先验知识以结构化的方式引入深度神经网络中,采用深度神经网络对哈密顿动力学的关键结构进行描述,构建机械系统物理参数求解模型,提高了机械系统物理参数求解
的适应性和计算效率。
[0081]
下面将结合一个具体实施例对本方案进行说明,采用openai公司开源的gym平台中的单极倒立摆系统pendulum作为研究对象,如图2所示,其中,所述倒立摆系统的参数物理含义如表1所示,
[0082][0083][0084]
表1
[0085]
在该单极倒立摆系统中,直接可通过传感器测得的输入变量为杆所旋转的角度θ和角速度ω,系统唯一的控制量为电机作用于杆端点的扭力u。在训练学习的过程中,agent可以在连续动作空间范围内进行探索,为[-2.0,2.0]范围内的值。另外,系统奖励函数为[(θ+π)%(2π)-π]2+0.1ω2+0.001u2,当杆竖直立起且角速度值和扭力很小时(即杆能稳定立起)将获得更大的奖励。
[0086]
在该系统下进行方法有效性验证时,分别使用了系统原始状态(θ,ω)与转换后的系统状态变量(cosθ,sinθ,ω)确定状态方程的状态变量进行参数求解。根据前述的哈密顿正则方程的动力学形式可得pendulum系统的正则方程为式(14),
[0087][0088]
其中哈密顿量为h(q,p)=1.5p2+5(1-cosq),即惯性矩阵m-1
(q)=3,势能项v(q)=5(1-cosq),g(q)=1。
[0089]
(1)原始状态量(θ,ω)作为倒立摆系统状态变量
[0090]
以(θ,ω)作为倒立摆系统状态变量,由于使用的是连续动作空间模型,因此采用ddpg深度强化学习算法与系统进行交互探索以生成轨迹数据,agent的动作值为输入u。以0.05为采样间隔,20为时间步长,重复探索128个回合,构成数据集对系统惯性矩阵m-1
(q),势能项v(q)和输入矩阵g(q)采用网络进行描述,其中为3层网络,2层为300个神经元的tanh非线性网络,1层为线性网络;为3层网络,2层为50个神经元的tanh非线性网络,1层为线性网络;为3层网络,2层为200个神经元的tanh非线性网络,1层为线性网络,总网络参数量为0.13m。
[0091]
当训练至损失函数收敛后,该系统输入矩阵g(q),惯性矩阵m-1
(q)和势能项v(q)的求解结果分别如图4所示,其中,(a)为输入矩阵求解结果,(b)为惯性矩阵求解结果,(c)为势能项求解结果。从图3中可以看出,对于输入矩阵的求解效果最优,对惯性矩阵的求解效果没有达到完全贴合真实值的效果,势能项能够求解出变化趋势。关于势能项的求解问题,由于模型中所使用的是势能项的导数信息,即相对势能,参考的不同选取会导致势能项绝对数值上的差异,因此允许数值上的差异,仅需求解出变化趋势即可。
[0092]
(2)角度量二维转换状态量(cosθ,sinθ,ω)作为状态变量
[0093]
倒立摆状态量选择为(cosθ,sinθ,ω),使用ddpg对其探索生成轨迹数据,其中采样间隔,时间步长和总探索回合与原始状态量情况下一致,因此构成数据集
[0094]
惯性矩阵使用进行描述,其中为3层300个神经元的tanh非线性网络和1层线性网络,势能项和输入矩阵与前述原始状态量中的网络一致,总网络参数量为0.14m。当训练至loss函数收敛后,角度量转换后的系统输入矩阵g(q),惯性矩阵m-1
(q)和势能项v(q)求解结果分别如图5所示,其中(a)为输入矩阵求解结果,(b)为惯性矩阵求解结果,(c)为势能项求解结果。
[0095]
从图5中可以看出,相比于未转换前将原始量作为单极倒立摆pendulum系统状态变量情况下的辨识结果,进行角度量转换后三个参数的求解效果有了明显的提高,对惯性矩阵m-1
(q),势能项v(q)的求解效果明显更优更稳定。图5中对哈密顿动力学结构化模型在角度量转换后的pendulum系统辨识结果进行了对应的误差分布分析。如图6所示,其中,(a)为输入矩阵求解结果的误差分布,(b)为惯性矩阵求解结果的误差分布,(c)为势能项求解结果的误差分布,输入矩阵的相对误差集中在0.0附近,惯性矩阵的相对误差更加集中,哈密顿结构化的模型在这两个量上体现出非常优异的求解性能。在势能项的求解上,绝对误差集中在5.0附近,说明势能项的求解值与真实值之间保持高度跟随趋势。
[0096]
应当理解,本公开的各部分可以用硬件、软件、固件或它们的组合来实现。
[0097]
以上所述,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1