应用于自动驾驶的控制方法、装置、电子设备及介质与流程

文档序号:23720788发布日期:2021-01-24 08:06阅读:来源:国知局

技术特征:
1.一种应用于自动驾驶的控制方法,包括:基于预设轨迹确定当前阶段的轨迹输入;获取当前阶段的环境图像以及车身状态;基于当前阶段的所述轨迹输入、环境图像以及车身状态,生成当前阶段的转向控制动作。2.根据权利要求1所述的方法,其中,所述基于预设轨迹确定当前阶段的轨迹输入包括:获取预设轨迹,所述预设轨迹包括多个循迹点;获取当前位置和航向角;基于所述当前位置和航向角,确定地图区域;基于所述地图区域生成二值矩阵作为当前阶段的轨迹输入,所述二值矩阵中的每个元素的值表示所述地图区域内的对应子区域是否包含所述循迹点。3.根据权利要求2所述的方法,其中,所述基于所述当前位置和航向角,确定地图区域包括:以当前位置为坐标原点,所述航向角的方向为y轴方向,确定地图中(-m,0)、(m,0)、(m,n)、(-m,n)所围成的地图区域,其中,m、n为正数。4.根据权利要求1所述的方法,其中,所述获取当前阶段的环境图像包括:通过摄像头采集原始图像;对所述原始图像降采样至预定尺寸,得到所述环境图像。5.根据权利要求1所述的方法,其中,所述车身状态包括车辆行驶速度和加速度。6.根据权利要求1~5任一项所述的方法,其中,所述基于当前阶段的所述轨迹输入、环境图像以及车身状态,生成当前阶段的转向控制动作包括:将当前阶段的所述轨迹输入、环境图像以及车身状态输入至基于强化学习的预测模型,以获取当前阶段的转向控制动作,其中,所述预测模型包括特征提取层和动作选择层,所述特征提取层用于分别提取所述轨迹输入和所述环境图像的特征,所述动作选择层用于根据所述轨迹输入和所述环境图像的特征,以及所述车身状态生成转向控制动作。7.根据权利要求6所述的方法,其中:所述特征提取层包括步长为1的3*3卷积层、步长为2的3*3最大池化层以及二级残差块,所述动作选择层包括基于双延迟深度确定性策略梯度的强化学习模型。8.根据权利要求7所述的方法,还包括:基于与预设轨迹的偏离程度以及与障碍物之间的距离确定所述强化学习模型的奖励值。9.一种应用于自动驾驶的控制装置,包括:确定模块,被配置为基于预设轨迹确定当前阶段的轨迹输入;获取模块,被配置为获取当前阶段的环境图像以及车身状态;生成模块,被配置为基于当前阶段的所述轨迹输入、环境图像以及车身状态,生成当前阶段的转向控制动作。10.一种电子设备,其特征在于,包括存储器和处理器;其中,所述存储器用于存储一条
或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现权利要求1~8任一项所述的方法步骤。11.一种可读存储介质,其上存储有计算机指令,其特征在于,该计算机指令被处理器执行时实现权利要求1~8任一项所述的方法步骤。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1