手术机器人的自主学习方法、装置、设备和介质

文档序号：32418773发布日期：2022-12-02 22:39阅读：来源：国知局

技术特征：
1.一种手术机器人的自主学习方法，其特征在于，包括以下步骤：获取目标个体的感知数据，并将所述感知数据输入至预先训练的手术机器人智能体，得到所述针对所述目标个体的决策数据，其中，所述手术机器人智能体由虚拟医生模型训练第一目标神经网络得到；判断所述决策数据是否满足当前手术条件；以及若所述决策数据满足所述当前执行手术条件，则控制手术机器人按照所述决策数据执行手术操作，否则基于预设调整策略调整所述决策数据，直至调整后的决策数据满足所述当前执行手术条件的最佳决策参数，并控制所述手术机器人按照所述最佳决策数据执行手术操作。2.根据权利要求1所述的方法，其特征在于，在将所述感知数据输入至所述预先训练的手术机器人智能体之前，还包括：构建初始专家示教数据库，并基于所述初始专家示教数据库中的目标感知数据、目标决策数据和目标分值数据，训练第二目标神经网络，得到所述虚拟医生模型；将所述目标感知数据输入至第一目标神经网络的卷积神经网络层进行特征提取得到第一特征向量，并基于所述虚拟医生模型和所述第一特征向量训练所述第一目标神经网络的全连接神经网络层，直至达到预设的停止训练条件，得到所述预先训练的手术机器人智能体。3.根据权利要求2所述的方法，其特征在于，所述基于所述初始专家示教数据库中的目标感知数据、目标决策数据和目标分值数据，训练第二目标神经网络，得到虚拟医生模型，包括：将所述目标感知数据的输入至所述第二目标神经网络的卷积神经网络层进行特征提取得到第二特征向量；基于所述第二特征向量、所述目标决策数据和所述目标分值数据训练所述第二目标神经网络的全连接神经网络层，得到所述虚拟医生模型。4.根据权利要求3所述的方法，其特征在于，所述构建初始专家示教数据库，包括：获取目标用户的影像数据，将所述影像数据输入至预设的病灶检测模型得到病灶mask，并融合所述病灶mask和所述影像数据得到所述目标感知数据；基于所述目标感知数据生成所述目标用户的目标决策数据；根据所述目标感知数据和所述目标决策数据获取所述目标分值数据；根据所述目标感知数据、所述目标决策数据和所述分值数据构建所述初始专家示教数据库。5.根据权利要求1所述的方法，其特征在于，在调整所述决策数据至满足所述当前执行手术条件的最佳决策参数之后，还包括：根据所述最佳决策参数更新所述初始专家示教数据库；基于更新后的所述初始专家示教数据库中目标感知数据、目标决策数据和目标分值数据，重新训练所述第二目标神经网络，得到新的虚拟医生模型；通过所述新的虚拟医生模型重新训练所述第一目标神经网络，得到新的手术机器人智能体，以通过所述新的手术机器人智能体为新的目标个体规划新的决策数据。6.根据权利要求1所述的方法，其特征在于，所述预设停止训练条件为训练轮次高于设
定值。7.一种手术机器人的自主学习装置，其特征在于，包括：获取模块，用于获取目标个体的感知数据，并将所述感知数据输入至预先训练的手术机器人智能体，得到所述针对所述目标个体的决策数据，其中，所述手术机器人智能体由虚拟医生模型训练第一目标神经网络得到；判断模块，用于判断所述决策数据是否满足当前手术条件；以及控制模块，用于若所述决策数据满足所述当前执行手术条件，则控制手术机器人按照所述决策数据执行手术操作否则基于预设调整策略调整所述决策数据，直至调整后的决策数据满足所述当前执行手术条件的最佳决策参数，并控制所述手术机器人按照所述最佳决策数据执行手术操作。8.根据权利要求7所述的装置，其特征在于，在将所述感知数据输入至所述预先训练的手术机器人智能体之前，所述获取模块，还包括：构建单元，用于构建初始专家示教数据库，并基于所述初始专家示教数据库中的目标感知数据、目标决策数据和目标分值数据，训练第二目标神经网络，得到所述虚拟医生模型；获取单元，用于将所述目标感知数据输入至第一目标神经网络的卷积神经网络层进行特征提取得到第一特征向量，并基于所述虚拟医生模型和所述第一特征向量训练所述第一目标神经网络的全连接神经网络层，直至达到预设的停止训练条件，得到所述预先训练的手术机器人智能体。9.一种电子设备，其特征在于，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述程序，以实现如权利要求1-6任一项所述的手术机器人的自主学习方法。10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行，以用于实现如权利要求1-6任一项所述的手术机器人的自主学习方法。

技术总结
本申请涉及手术机器人技术领域，特别涉及一种手术机器人的自主学习方法、装置、设备和介质，其中，方法包括：获取目标个体的感知数据，并输入至预先训练的手术机器人智能体，得到针对目标个体的决策数据，判断决策数据是否满足当前手术条件，若决策数据满足当前执行手术条件，则控制手术机器人按照决策数据执行手术操作，否则基于预设调整策略调整决策数据，直至满足当前执行手术条件的最佳决策参数，并控制手术机器人按照最佳决策数据执行手术操作。由此，解决了相关技术中的手术机器人的自主性不足，从而导致手术持续时间长、耗费大量精力、人机协同的智能化程度低等问题。人机协同的智能化程度低等问题。人机协同的智能化程度低等问题。

技术研发人员：吴丹李智超任昊张继文
受保护的技术使用者：清华大学
技术研发日：2022.09.01
技术公布日：2022/12/1

完整全部详细技术资料下载

当前第2页1 2