血管介入导丝的自动导航方法、装置、设备及介质与流程

文档序号:31725692发布日期:2022-10-05 00:30阅读:来源:国知局

技术特征:
1.一种血管介入导丝的自动导航方法,其特征在于,所述自动导航方法包括:s1、基于第一造影视频,获取当前帧图像的状态信息,其中,所述状态信息包括导丝的当前起点位置和目标位置;s2、构建深度强化学习网络并进行训练,得到训练好的深度强化学习网络;s3、将所述当前帧图像的状态信息输入到训练好的深度强化学习网络中,得到机器手臂的决策动作;s4、在所述机器手臂执行完所述决策动作之后,重新获取当前帧图像的状态信息,并根据新的状态信息重复执行步骤s3-s4,直至所述导丝到达所述目标位置为止。2.如权利要求1所述的方法,其特征在于,所述构建深度强化学习网络并进行训练,得到训练好的深度强化学习网络,包括:s21、构建深度强化学习网络,并设计机器手臂操作导丝的决策动作和奖励机制;s22、基于第二造影视频,获取第一帧图像的状态信息s,并将所述第一帧图像的状态信息s输入到所述深度强化学习网络中,得到机器手臂的决策动作a;s23、在所述机器手臂执行完所述决策动作a之后,获取第二帧图像的状态信息s’,并基于所述奖励机制得到从状态信息s到状态信息s’的回报值r;s24、将(a,s,r,s')作为一组样本存放入经验池集t中,并在令s=s'之后,重复执行步骤s21-s24,直至导丝到达目标位置为止;s25、从所述经验池集t中随机抽取b组样本,利用梯度下降法将误差反向传播,来更新所述深度强化学习网络的网络参数,得到训练好的深度强化学习网络。3.如权利要求2所述的方法,其特征在于,基于所述奖励机制得到从状态信息s到状态信息s’的回报值r,包括:根据状态信息s和状态信息s’,确定从所述状态信息s到所述状态信息s’的距离;基于所述距离,根据所述奖励机制得到从所述状态信息s到所述状态信息s’的回报值r。4.如权利要求3所述的方法,其特征在于,所述基于所述距离,根据所述奖励机制得到从所述状态信息s到所述状态信息s’的回报值r,包括:判断所述第二帧图像中导丝的当前起点位置是否在血管外面,得到判断结果;基于所述判断结果和所述距离,根据所述奖励机制得到从所述状态信息s到所述状态信息s’的回报值r。5.如权利要求2所述的方法,其特征在于,所述从所述经验池集t中随机抽取b组样本,利用梯度下降法将误差反向传播,来更新所述深度强化学习网络的网络参数,得到训练好的深度强化学习网络,包括:从所述经验池集t中随机抽取b组样本,并分别输入到所述深度强化学习网络中的目标网络和预测网络中,得到所述目标网络的输出价值q(s',a',θ')和所述预测网络的输出价值q(s,a,θ);根据所述目标网络的输出价值q(s',a',θ')和所述预测网络的输出价值q(s,a,θ)来构建损失函数loss;基于所述损失函数loss利用梯度下降法将误差反向传播,来更新所述深度强化学习网络的网络参数,得到训练好的深度强化学习网络。
6.如权利要求5所述的方法,其特征在于,所述根据所述目标网络的输出价值q(s',a',θ')和所述预测网络的输出价值q(s,a,θ)来构建损失函数loss,包括:根据所述目标网络的输出价值q(s',a',θ')和回报值r来确定目标值;根据所述预测网络的输出价值q(s,a,θ)来确定预测值;基于所述目标值和所述预测值来构建损失函数loss。7.如权利要求6所述的方法,其特征在于,所述根据所述目标网络的输出价值q(s',a',θ')和回报值来确定目标值,包括:从所述目标网络的所有输出价值q(s',a',θ')中确定最大的输出价值maxq(s',a',θ');根据所述最大的输出价值maxq(s',a',θ')和回报值r来确定目标值。8.一种血管介入导丝的自动导航装置,其特征在于,所述自动导航装置包括:获取模块,用于基于第一造影视频,获取当前帧图像的状态信息,其中,所述状态信息包括导丝的当前起点位置和目标位置;构建模块,用于构建深度强化学习网络并进行训练,得到训练好的深度强化学习网络;所述获取模块,还用于将所述当前帧图像的状态信息输入到训练好的深度强化学习网络中,得到机器手臂的决策动作;所述获取模块,用于在所述机器手臂执行完所述决策动作之后,重新获取当前帧图像的状态信息。9.一种血管介入导丝的自动导航设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的血管介入导丝的自动导航程序,所述血管介入导丝的自动导航程序配置为实现如权利要求1至7中任一项所述的血管介入导丝的自动导航方法的步骤。10.一种存储介质,其特征在于,所述存储介质上存储有血管介入导丝的自动导航程序,所述血管介入导丝的自动导航程序被处理器执行时实现如权利要求1至7任一项所述的血管介入导丝的自动导航方法的步骤。

技术总结
本发明属于手术导航技术领域,公开了一种血管介入导丝的自动导航方法、装置、设备及介质。该方法包括:基于第一造影视频,获取当前帧图像的状态信息;构建深度强化学习网络并进行训练,得到训练好的深度强化学习网络;将所述当前帧图像的状态信息输入到训练好的深度强化学习网络中,得到机器手臂的决策动作;在所述机器手臂执行完所述决策动作之后,重新获取当前帧图像的状态信息,并输入到训练好的深度强化学习网络中,直至所述导丝到达所述目标位置为止。通过上述方式,通过机器手臂来代替医生手动递送导丝的过程,能够有效减少医生暴露在辐射环境中的时间。在辐射环境中的时间。在辐射环境中的时间。


技术研发人员:王旭 马骏 郑凌霄 兰宏志
受保护的技术使用者:深圳睿心智能医疗科技有限公司
技术研发日:2022.05.31
技术公布日:2022/10/4
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1