一种模型训练的处理方法和装置与流程

文档序号：31801879发布日期：2022-10-14 19:04阅读：103来源：国知局

1.本发明涉及数据处理技术领域，特别涉及一种模型训练的处理方法和装置。

背景技术：

2.预测自车周围动静态环境变化及其他交通参与者的行为演变是自动驾驶车辆实现高等级智能驾驶的必要能力。当前主流的自动驾驶预测算法都是通过深度学习模型实现，该类模型的输入是高精度地图信息及交通参与者的观测信息，输出则是交通参与者未来的运动轨迹信息，lanegcn就是这类模型中的一种。
3.lanegcn模型的结构由论文《learning lane graph representations for motion forecasting》可知包括：参与者网络模块(actornet)、地图网络模块(mapnet)、融合网络模块(fusionnet)和预测头网络模块(header)，预测头网络模块又包括回归分支(regression branch)和分类分支(classification branch)。其中，参与者网络模块用来对输入的m个交通参与者(又称障碍物、障碍物目标、目标)的差分轨迹序列进行参与者特征提取处理；地图网络模块用来对输入的n个车道节点特征进行地图车道特征提取处理；融合网络模块则基于四个融合单元(参与者到车道a2l、车道到车道l2l、车道到参与者l2a和参与者到参与者a2a)对参与者特征和车道特征进行特征融合处理最终由a2a单元输出参与者到参与者的融合特征；预测头网络模块则基于参与者到参与者的融合特征对第m(1≤m≤m)个参与者在未来的k模态(k种可能)轨迹进行预测并为第k条(1≤m≤k)预测轨迹输出对应的置信度(又称置信度评分)，预测头网络模块的回归分支就是用来做多模态轨迹预测处理的，分类分支则是用来做多模态置信度分类处理的。对于上述lanegcn模型的训练，论文中给出了基于损失函数l
mod
＝l
cls
+αl
reg
的反向调制方法进行自监督学习的训练方式。
4.然而我们在实际应用中发现，仅仅基于上述损失函数l
mod
是很难对地图网络模块进行充分训练的。而地图网络模块又是融合网络模块的先验模块，地图网络模块的训练充分度会直接影响融合网络模块的融合效果，融合网络模块的融合效果又会直接影响预测头网络模块的预测精度。

技术实现要素：

5.本发明的目的，就是针对现有技术的缺陷，提供一种模型训练的处理方法、装置、电子设备及计算机可读存储介质，在对lanegcn模型进行整体模型训练之前先基于高精地图训练数据集和损失函数l
map
对地图网络模块进行预训练，通过预训练使得地图网络模块达到充分训练效果；再在保持地图网络模块的网络参数不变的情况下基于损失函数l
mod
＝l
cls
+αl
reg
对lanegcn模型进行整体模型训练。通过本发明，可以降低整体模型的训练难度，提高地图网络模块的训练成熟度，提高lanegcn模型的输出精度。
6.为实现上述目的，本发明实施例第一方面提供了一种模型训练的处理方法，所述方法包括：
7.获取高精地图构建第一训练数据集；
8.根据所述第一训练数据集对lanegcn模型的地图网络模块进行地图网络预训练；
9.所述地图网络预训练成功，则获取车辆路测数据构建第二训练数据集；
10.在保持所述地图网络模块的网络参数不变的前提下根据所述第二训练数据集对所述lanegcn模型进行模型训练。
11.优选的，所述lanegcn模型包括参与者网络模块、所述地图网络模块、融合网络模块和预测头网络模块；所述融合网络模块分别与所述参与者网络模块、所述地图网络模块和所述预测头网络模块连接；
12.所述参与者网络模块用于对形状为m*3*t1的第一输入张量进行参与者特征提取处理生成对应的形状为m*128的第一输出张量；并将所述第一输出张量向所述融合网络模块发送；所述第一输入张量包括m个形状为3*t1的参与者观测张量；m为参与者总数；t1为预设的第一时刻数量，默认为20；
13.所述地图网络模块用于对形状为n*4的第二输入张量进行地图车道特征提取处理生成对应的形状为n*128的第二输出张量；并将所述第二输出张量向所述融合网络模块发送；所述第二输入张量包括n个形状为1*4的车道节点向量；n为车道节点向量总数；
14.所述融合网络模块用于根据所述第一输出张量与所述第二输出张量进行特征融合处理生成对应的形状为m*128的第一融合特征张量；并将所述第一融合特征张量向所述预测头网络模块发送；
15.所述预测头网络模块包括回归分支和分类分支；所述回归分支用于根据所述第一融合特征张量进行多模态轨迹预测处理生成对应的形状为m*k*t2*2的第一预测张量；所述分类分支用于根据所述第一融合特征张量进行多模态置信度分类处理生成对应的形状为m*k的第一置信度张量；k为模态总量；t2为预设的第二时刻数量，默认为30；
16.所述第一预测张量包括m个形状为k*t2*2的第一参与者预测张量；所述第一参与者预测张量与m个参与者一一对应；第一参与者预测张量包括k个形状为t2*2的第一预测轨迹张量；所述第一预测轨迹张量包括所述第二时刻数量t2的第一轨迹点向量；所述第一轨迹点向量为一个二维的轨迹点坐标；
17.所述第一置信度张量包括m个长度为k的第一置信度向量；所述第一置信度向量与m个参与者一一对应；所述第一置信度向量包括k个第一置信度；所述第一置信度与所述第一预测轨迹张量一一对应，所述第一置信度为对应的所述第一预测轨迹张量的预测置信度。
18.优选的，所述获取高精地图构建第一训练数据集，具体包括：
19.根据预设的地图筛选规则从公开的高精地图数据库中筛选高精地图原始数据组成第一场景地图集；所述地图筛选规则包括地图数量最小值、地图尺寸最小值、地图精度最大值、车道数量最小值、车道长度最小值和车道分段长度；所述第一场景地图集包括多个第一场景地图；所述第一场景地图的数量不大于所述地图数量最大值；所述第一场景地图的地图尺寸不小于所述地图尺寸最小值，地图精度不小于所述地图精度最小值；所述第一场景地图包括多个第一车道，所述第一车道的数量不小于所述车道数量最小值，车道长度不小于所述车道长度最小值；所述第一车道包括第一车道中心线；
20.根据所述地图筛选规则的所述车道分段长度对各个所述第一场景地图的各个所述第一车道进行分段得到对应的多个第一车道分段；并将各个所述第一车道分段与对应的
所述第一车道中心线的两个交点记为对应的第一起点和第一终点；
21.在各个所述第一场景地图上，任选一个所述第一车道的起始车道分段的所述第一起点作为原点并以所述起始车道分段的前进方向为x轴正向构建二维笛卡尔坐标系记为对应的第一坐标系；并将当前所述第一场景地图上各个所述第一车道分段的所述第一起点和所述第一终点在所述第一坐标系上的坐标作为对应的第一起点坐标(xs,ys)和第一终点坐标(xe,ye)；并由各个所述第一车道分段的所述第一起点坐标(xs,ys)和所述第一终点坐标(xe,ye)组成对应的形状为1*4的所述车道节点向量；并由得到的所有所述车道节点向量组成对应的第一地图张量；所述第一地图张量的形状为n’*4，n’为所述车道节点向量的总数；
22.由得到的所有所述第一地图张量组成对应的所述第一训练数据集。
23.优选的，所述根据所述第一训练数据集对lanegcn模型的地图网络模块进行地图网络预训练，具体包括：
24.步骤41，将所述地图网络模块单独提取出来与预设的第一多层感知网络连接构成对应的第一训练网络；
25.步骤42，从所述第一训练数据集中提取一个所述第一地图张量作为对应的当前地图张量；
26.步骤43，对所述当前地图张量的所述车道节点向量的总数进行统计生成对应的车道节点总数n0；并根据预设的第一遮挡比例β计算本次的输入车道节点总数n1＝n0*(1-β)和待测车道节点总数n2＝n0*β；并从所述当前地图张量中提取所述输入车道节点总数n1的所述车道节点向量组成对应的形状为n1*4的当前输入张量；并由剩余所述待测车道节点总数n2的所述车道节点向量组成对应的形状为n2*4的当前标签张量；并将所述当前标签张量中的各个所述车道节点向量作为对应的待测车道节点lni；1≤i≤n2；所述第一遮挡比例β默认为20％；
27.步骤44，对各个所述待测车道节点lni的真值中心点的坐标进行确定；所述真值中心点的坐标为横坐标为对应的所述车道节点向量的所述第一起点坐标(xs,ys)和所述第一终点坐标(c,ye)的横坐标平均值(xs+xe)/2，纵坐标为对应的所述第一起点坐标(xs,ys)和所述第一终点坐标(xe,ye)的纵坐标平均值(ys+ye)/2；
28.步骤45，根据所述待测车道节点总数n2以及各个所述真值中心点设置对应的第一损失函数为：
[0029][0030][0031][0032][0033]
si为所述待测车道节点lni的预测中心点，所述预测中心点si的坐标为(xi,yi)，reg
()是回归函数，d()是平滑l1损失函数，为的范数表达式，为的范数表达式；
[0034]
步骤45，将形状为n1*4的所述当前输入张量和所述当前标签张量输入所述第一训练网络，通过所述地图网络模块对所述当前输入张量进行地图车道特征提取处理生成对应的形状为n1*128的第一训练张量；通过所述第一多层感知网络根据所述第一训练张量和所述当前标签张量对与所述当前标签张量的各个所述待测车道节点lni对应的中心点坐标进行回归预测生成对应的形状为n2*2的第二训练张量；所述第二训练张量包括n2个所述预测中心点si的坐标(xi,yi)；
[0035]
步骤46，将各个所述待测车道节点lni对应的所述预测中心点si的坐标(xi,yi)和所述真值中心点的坐标代入所述第一损失函数进行损失值计算生成对应的第一损失值；
[0036]
步骤47，对所述第一损失值是否满足预设的第一损失值收敛范围进行识别；若所述第一损失值不满足所述第一损失值收敛范围，则沿着使所述第一损失函数达到最小值的方向对所述地图网络模块的网络参数进行反向调制，并在所述反向调制完成时返回步骤45继续训练；若所述第一损失值满足所述第一损失值收敛范围，则对所述当前地图张量是否为所述第一训练数据集的最后一个所述第一地图张量进行识别，若不是最后一个则提取下一个所述第一地图张量作为新的所述当前地图张量并返回步骤43继续训练，若是最后一个则停止模型训练并确认所述地图网络预训练成功。
[0037]
优选的，所述获取车辆路测数据构建第二训练数据集，具体包括：
[0038]
步骤51，从预设的车辆路测数据库中选择一个第一路测数据序列；所述第一路测数据序列由时序连续的且完成了目标关联的(t1+1)+t2帧第一路测数据组成；所述第一路测数据包括第一时间戳、第一自车坐标和多个第一目标数据组，所述第一目标数据组包括第一目标标识和第一目标坐标；前后时刻的所述第一路测数据中关联目标对应的两个所述第一目标数据组的所述第一目标标识相同；
[0039]
步骤52，以第(t1+1)帧所述第一路测数据的所述第一自车坐标为第一参考点坐标，并以所述第一参考点坐标对应的所述第一时间戳减去1秒的时间作为第一时间，并以早于所述第一时间且距离所述第一时间最近的所述第一时间戳对应的所述第一自车坐标为第二参考点坐标；以所述第一参考点坐标为原点，以所述第二参考点坐标到所述第一参考点坐标的朝向为x轴正向构建二维笛卡尔坐标系记为对应的第二坐标系；
[0040]
步骤53，在所述第二坐标系下对所有所述第一自车坐标和所述第一目标坐标进行坐标转换生成对应的第二自车坐标和第二目标坐标；
[0041]
步骤54，将前(t1+1)帧所述第一路测数据中所述第一目标标识相同的多个所述第二目标坐标按时间先后顺序排序生成对应的参与者历史轨迹；并对所述参与者历史轨迹的总数进行统计生成对应的第一参与者总数m1；并对各个所述参与者历史轨迹中相邻的所述第二目标坐标进行坐标差分计算生成对应的差分坐标序列；若所述差分坐标序列的差分坐标的数量不够所述第一时刻数量t1则采用前补零的方式进行补足，保证所述差分坐标序列始终具有所述第一时刻数量t1的所述差分坐标，并为每个所述差分坐标分配一个对应的补零状态标识；并由各个所述差分坐标的横向差分坐标
△
x和纵向差分坐标
△
y以及对应的所
述补零状态标识构成对应的形状为1*3的参与者观测向量；并由各个所述参与者历史轨迹对应的所述第一时刻数量t1的所述参与者观测向量组成对应的形状为t1*3的第一观测张量；并对所述第一观测张量进行转置变换从而得到对应的形状为3*t1的所述参与者观测张量；并由得到的所述第一参与者总数m1的所述参与者观测张量组成对应的形状为m1*3*t1的第一训练张量；所述差分坐标包括所述横向差分坐标
△
x和所述纵向差分坐标
△
y；所述补零状态标识包括第一标识值和第二标识值，若所述补零状态标识为第一标识值则对应的所述差分坐标的类型为补零差分坐标，若所述补零状态标识为第二标识值则对应的所述差分坐标的类型为真实差分坐标；
[0042]
步骤55，将后t2帧所述第一路测数据中所述第一目标标识相同的多个所述第二目标坐标按时间先后顺序排序生成对应的参与者真实轨迹；若所述参与者真实轨迹的所述第二目标坐标的数量不够所述第二时刻数量t2则使用预设的卡尔曼滤波器对所述参与者真实轨迹在未来多个时刻的轨迹坐标进行预测从而保证所述参与者真实轨迹始终具有所述第二时刻数量t2的所述第二目标坐标；并由得到的所有所述参与者真实轨迹组成对应的第一真实轨迹集合；
[0043]
步骤56，查询预设的高精地图库，按预设的地图尺寸将覆盖了所有所述第一自车坐标和所述第一目标坐标的高精地图提取出来作为对应的第二场景地图；所述第二场景地图包括多个第二车道，所述第二车道包括第二车道中心线；
[0044]
步骤57，根据预设的车道分段长度对各个所述第二车道进行分段得到对应的多个第二车道分段；并将各个所述第二车道分段与对应的所述第二车道中心线的两个交点记为对应的第二起点和第二终点；并将各个所述第二车道分段的所述第二起点和所述第二终点在所述第二坐标系上的坐标作为对应的第二起点坐标和第二终点坐标；并由各个所述第二车道分段的所述第二起点坐标和所述第二终点坐标组成对应的形状为1*4的所述车道节点向量；并对所述车道节点向量的总数进行统计生成对应的车道节点向量总数n3；并由得到的n3个所述车道节点向量组成对应的形状为n3*4的第二地图张量；
[0045]
步骤58，由所述第一训练张量、所述第一真实轨迹集合和所述第二地图张量组成对应的第二训练数据存入所述第二训练数据集；
[0046]
步骤59，对所述第二训练数据集中的所述第二训练数据的总数进行统计生成对应的第一数量；若所述第一数量小于预设的第一总量阈值则返回步骤51继续准备训练数据；若所述第一数量等于所述第一总量阈值则停止准备训练数据并将所述第二训练数据集输出。
[0047]
优选的，所述根据所述第二训练数据集对所述lanegcn模型进行模型训练，具体包括：
[0048]
步骤61，根据所述第二时刻数量t2设置所述lanegcn模型的损失函数l
mod
为：
[0049]
l
mod
＝l
cls
+αl
reg
，
[0050][0051][0052]
reg(z)＝∑jd(zj)，
[0053][0054]
其中，因子α为1.0；
[0055]
l
cls
为分类损失函数，l
reg
为回归损失函数；
[0056]
所述分类损失函数l
cls
中，∈为一个预设的边际因子，m为参与者索引，1≤m≤参与者总数m，参与者索引m与所述第一目标坐标对应；k为置信度负样本索引，k
*
为置信度正样本索引，1≤k、k
*
≤模态总量k，但k≠k
*
；c
m，k
为第m个参与者的k个所述第一置信度中的负分类样本，为第m个参与者的k个所述第一置信度中的正分类样本；各个参与者的k个所述第一置信度中只有一个为所述正分类样本，其余k-1个均为所述负分类样本；所述正分类样本对应的所述第一预测轨迹张量的最后一个所述第一轨迹点向量的轨迹点坐标与对应的所述参与者真实轨迹的最后一个所述第二目标坐标之间的直线距离最短；
[0057]
所述预测损失函数l
reg
中，t2为预设的第二时刻数量，默认为30；t为时刻索引，1≤t≤t2；reg()是回归函数，d()是平滑l1损失函数；为第m个参与者的k个所述第一预测轨迹张量中对应所述置信度正样本索引k
*
的所述第一预测轨迹张量上第t个所述第一轨迹点向量的轨迹点坐标；为第m个参与者对应的所述参与者真实轨迹中第t个的所述第二目标坐标；
[0058]
步骤62，从所述第二训练数据集中提取第一个所述第二训练数据作为对应的当前训练数据；
[0059]
步骤63，从所述当前训练数据中提取所述第一训练张量、所述第一真实轨迹集合和所述第二地图张量作为对应的当前训练张量、当前真实轨迹集合和当前地图张量；并对所述当前训练张量的所述参与者观测张量的数量进行统计生成当前参与者总数m2；并对所述当前地图张量的所述车道节点向量的数量进行统计生成当前车道节点向量总数n4；
[0060]
步骤64，将形状为m2*3*t1的所述当前训练张量输入所述参与者网络模块进行参与者特征提取处理生成对应的形状为m2*128的第二特征张量；并将形状为n4*4的所述当前地图张量输入所述地图网络模块进行地图车道特征提取处理生成对应的形状为n4*128的第三特征张量；并将所述第二、第三特征张量输入所述融合网络模块进行特征融合处理生成对应的形状为m2*128的第四特征张量；并将所述第四特征张量分别输入所述预测头网络模块的所述回归分支和所述分类分支进行对应的多模态轨迹预测处理和多模态置信度分类处理生成对应的形状为m2*k*t1*2的第二预测张量和形状为m2*k的第二置信度张量；
[0061]
其中，所述第二预测张量包括m2个形状为k*t2*2的第二参与者预测张量；所述第二参与者预测张量与所述第一目标标识对应；第二参与者预测张量包括k个形状为t2*2的第二预测轨迹张量；所述第二预测轨迹张量包括所述第二时刻数t2的第二轨迹点向量；所述第二轨迹点向量为一个二维的轨迹点坐标；
[0062]
所述第二置信度张量包括m2个长度为k的第二置信度向量；所述第二置信度向量与所述第一目标标识对应；所述第二置信度向量包括k个第二置信度；所述第二置信度与所述第二预测轨迹张量一一对应，所述第二置信度为对应的所述第二预测轨迹张量的预测置信度；
[0063]
步骤65，将所述当前参与者总数m2、所述第二预测张量、所述第二置信度张量以及
所述当前真实轨迹集合代入所述lanegcn模型的损失函数l
mod
进行损失值计算生成对应的第二损失值；
[0064]
步骤66，对所述第二损失值是否满足预设的第二损失值收敛范围进行识别；若所述第二损失值不满足所述第二损失值收敛范围，则沿着使所述第二损失函数达到最小值的方向对所述lanegcn模型中除所述地图网络模块之外的各模块网络参数进行反向调制，并在所述反向调制完成时返回步骤64继续训练；若所述第二损失值满足所述损失值收敛范围，则对所述当前训练数据是否为所述第二训练数据集的最后一个所述第二训练数据进行识别，若不是最后一个则提取下一个所述第二训练数据作为新的所述当前训练数据并返回步骤63继续训练，若是最后一个则停止模型训练并确认所述模型训练成功。
[0065]
本发明实施例第二方面提供了一种用于实现上述第一方面所述的模型训练的处理方法的装置,所述装置包括：第一训练数据准备模块、第一模型训练模块、第二训练数据准备模块和第二模型训练模块；
[0066]
所述第一训练数据准备模块用于获取高精地图构建第一训练数据集；
[0067]
所述第一模型训练模块用于根据所述第一训练数据集对lanegcn模型的地图网络模块进行地图网络预训练；
[0068]
所述第二训练数据准备模块用于在所述地图网络预训练成功时获取车辆路测数据构建第二训练数据集；
[0069]
所述第二模型训练模块用于在保持所述地图网络模块的网络参数不变的前提下根据所述第二训练数据集对所述lanegcn模型进行模型训练。
[0070]
本发明实施例第三方面提供了一种电子设备，包括：存储器、处理器和收发器；
[0071]
所述处理器用于与所述存储器耦合，读取并执行所述存储器中的指令，以实现上述第一方面所述的方法步骤；
[0072]
所述收发器与所述处理器耦合，由所述处理器控制所述收发器进行消息收发。
[0073]
本发明实施例第四方面提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，当所述计算机指令被计算机执行时，使得所述计算机执行上述第一方面所述的方法的指令。
[0074]
本发明实施例提供了一种模型训练的处理方法、装置、电子设备及计算机可读存储介质，在对lanegcn模型进行整体模型训练之前先基于高精地图训练数据集和损失函数l
map
对地图网络模块进行预训练，通过预训练使得地图网络模块达到充分训练效果；再在保持地图网络模块的网络参数不变的情况下基于损失函数l
mod
＝l
cls
+αl
reg
对lanegcn模型进行整体模型训练。通过本发明，降低了整体模型的训练难度，提高了地图网络模块的训练成熟度，提高了lanegcn模型的输出精度。
附图说明
[0075]
图1为本发明实施例一提供的一种模型训练的处理方法示意图；
[0076]
图2为本发明实施例二提供的一种模型训练的处理装置的模块结构图；
[0077]
图3为本发明实施例三提供的一种电子设备的结构示意图。
具体实施方式
[0078]
为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部份实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0079]
本发明实施例一提供一种模型训练的处理方法，如图1为本发明实施例一提供的一种模型训练的处理方法示意图所示，本方法主要包括如下步骤：
[0080]
步骤1，获取高精地图构建第一训练数据集；
[0081]
具体包括：步骤11，根据预设的地图筛选规则从公开的高精地图数据库中筛选高精地图原始数据组成第一场景地图集；
[0082]
其中，地图筛选规则包括地图数量最小值、地图尺寸最小值、地图精度最大值、车道数量最小值、车道长度最小值和车道分段长度；第一场景地图集包括多个第一场景地图；第一场景地图的数量不小于地图数量最小值；第一场景地图的地图尺寸不小于地图尺寸最小值，地图精度不大于地图精度最大值；第一场景地图包括多个第一车道，第一车道的数量不小于车道数量最小值，车道长度不小于车道长度最小值；第一车道包括第一车道中心线；
[0083]
这里，地图筛选规则中的地图数量最小值、地图尺寸最小值、地图精度最小值、车道数量最小值、车道长度最小值和车道分段长度都是预先设置的规则参数；地图数量最小值越大则第一场景地图集中用于训练的场景地图越多，地图精度最大值越小则用于训练的场景地图的精度越高，车道数量最小值、车道长度最小值、车道分段长度越小则用于训练的场景地图越复杂；车道分段长度在后续步骤中会用于车道切分由此产生对应的车道节点；由高精地图的公知常识可知，每个高精地图都包括车道信息即第一车道，每条第一车道都带有一个车道中心线即第一车道中心线；
[0084]
步骤12，根据地图筛选规则的车道分段长度对各个第一场景地图的各个第一车道进行分段得到对应的多个第一车道分段；并将各个第一车道分段与对应的第一车道中心线的两个交点记为对应的第一起点和第一终点；
[0085]
这里，在处理分段时默认从第一场景地图的各个第一车道的起始位置起开始分段，每隔一个车道分段长度截取一个车道分段作为对应的第一车道分段；每个第一车道分段势必与当前车道的第一车道中心线存在两个交点，这里将靠近车道起始位置的交点记为第一起点、远离车道起始位置的交点记为第一终点；
[0086]
步骤13，在各个第一场景地图上，任选一个第一车道的起始车道分段的第一起点作为原点并以起始车道分段的前进方向为x轴正向构建二维笛卡尔坐标系记为对应的第一坐标系；并将当前第一场景地图上各个第一车道分段的第一起点和第一终点在第一坐标系上的坐标作为对应的第一起点坐标(xs,ys)和第一终点坐标(xe,ye)；并由各个第一车道分段的第一起点坐标(xs,ys)和第一终点坐标(xe,ye)组成对应的形状为1*4的车道节点向量；并由得到的所有车道节点向量组成对应的第一地图张量；第一地图张量的形状为n’*4，n’为车道节点向量的总数；
[0087]
这里，若将任一第一车道的起始车道分段的第一起点作为自车位置，那么第一坐标系实际就是一个以自车位置为原点、以自车行驶方向为x轴正向的二维鸟瞰视角的自车坐标系；那么第一起点坐标(xs,ys)和第一终点坐标(xe,ye)就是各个车道分段两个特征点
(第一起点、第一终点)在第一坐标系也就是自车坐标系下的坐标；将每个车道分段的特征向量定义为车道节点向量，那么车道节点向量的内容就是由对应车道分段的两个特征点在自车坐标系下的坐标构成的即车道节点向量为(xs,ys,xe,ye)，因此车道节点向量的形状为1*4；当前第一场景地图上的车道分段总数也就是车道节点向量的总数为n’，那么，由n’个车道节点向量进行组合就能得到用于表征当前第一场景地图的形状为n’*4的特征张量即第一地图张量；
[0088]
步骤14，由得到的所有第一地图张量组成对应的第一训练数据集。
[0089]
这里，通过上述步骤1可以不受lanegcn模型整体输入数据范围的限制，尽可能的搜索各类高精地图来组建第一场景地图集，从而为地图网络模块的充分训练奠定数据基础。
[0090]
步骤2，根据第一训练数据集对lanegcn模型的地图网络模块进行地图网络预训练；
[0091]
具体包括：步骤21，将地图网络模块单独提取出来与预设的第一多层感知网络(multilayer perceptron，mlp)连接构成对应的第一训练网络；
[0092]
这里，第一多层感知网络是一个预先训练好的神经网络；第一多层感知网络的输入有两个分别为地图网络模块的输出张量和一个预先准备的标签张量；第一多层感知网络的用途就是先对地图网络模块的输出张量进行全连接从而得到一个全局特征，该全局特征包括了地图网络模块输出张量中涉及的各个已知车道节点的形状(位置、大小、朝向等)特征；再基于上述全局特征进行全连接回归计算从而实现对所有车道节点的中心点进行预测，此处所说的所有车道节点包括已知车道节点和未知车道节点，所谓的未知车道节点是指具有相似形状(大小、朝向等)但不连续的已知车道节点间的车道节点，未知车道节点可以通过全连接回归计算复原；在得到所有车道节点的中心点之后，再基于标签张量中给出的待测车道节点给出对应的待测车道节点的中心点作为网络输出；由此可知，本发明实施例的第一训练网络的输入实际是一个地图张量的部分车道节点向量，输出则是由该地图张量各个剩余车道节点向量对应的中心点坐标组成的输出张量；
[0093]
步骤22，从第一训练数据集中提取一个第一地图张量作为对应的当前地图张量；
[0094]
步骤23，对当前地图张量的车道节点向量的总数进行统计生成对应的车道节点总数n0；并根据预设的第一遮挡比例β计算本次的输入车道节点总数n1＝n0*(1-β)和待测车道节点总数n2＝n0*β；并从当前地图张量中提取输入车道节点总数n1的车道节点向量组成对应的形状为n1*4的当前输入张量；并由剩余待测车道节点总数n2的车道节点向量组成对应的形状为n2*4的当前标签张量；并将当前标签张量中的各个车道节点向量作为对应的待测车道节点lni；
[0095]
其中，1≤i≤n2；第一遮挡比例β默认为80％；
[0096]
这里，当前地图张量中的车道节点向量的总量为车道节点总数n0，在对地图网络模块进行训练时，需要从这n0个中按一个预设的提取比例即(1-第一遮挡比例β)提取部分车道节点向量构成地图网络模块的输入向量，并将剩余的车道节点向量组成第一多层感知网络所需的标签张量，这个操作类似对当前地图张量中的车道节点进行部分遮挡，所以将相关比例称为遮挡比例即第一遮挡比例β，第一遮挡比例β的默认值为20％；在从当前地图张量中提取输入车道节点总数n1的车道节点向量组成当前输入张量时，按随机提取原则进
行提取；得到的标签张量中的各个车道节点向量被定义为待测车道节点lni，这里的待测车道节点lni就是在前文步骤21中提到的未知车道节点；
[0097]
例如，当前地图张量的形状为50*4说明车道节点总数n0＝50，第一遮挡比例β＝20％，那么，车道节点总数n1＝n0*(1-β)＝40，待测车道节点总数n2＝n0*β＝10；从当前地图张量中随机提取40个车道节点向量组成形状为40*4的当前输入张量，并由剩余10个车道节点向量组成组成形状为10*4的当前标签张量，当前标签张量中的10个车道节点向量被依次记为待测车道节点ln
i＝1
、ln
i＝2
……
ln
i＝10
；
[0098]
步骤24，对各个待测车道节点lni的真值中心点的坐标进行确定；
[0099]
其中，真值中心点的坐标为横坐标为对应的车道节点向量的第一起点坐标(xs,ys)和第一终点坐标(c,ye)的横坐标平均值(xs+xe)/2，纵坐标为对应的第一起点坐标(xs,ys)和第一终点坐标(xe,ye)的纵坐标平均值(ys+ye)/2；
[0100]
这里，每个待测车道节点lni对应一组：第一起点坐标(xs,ys)和第一终点坐标(c,ye)；那么，每个待测车道节点lni的真值中心点的坐标就应为的坐标就应为
[0101]
例如，已知当前标签张量包括10个待测车道节点ln
i＝1
、ln
i＝2
……
ln
i＝10
，对应的就可算出10个真值中心点
[0102]
步骤25，根据待测车道节点总数n2以及各个真值中心点设置对应的第一损失函数为：
[0103][0104][0105][0106][0107]
其中，si为待测车道节点lni的预测中心点，预测中心点si的坐标为(xi,yi)，reg()是回归函数，d()是平滑l1损失函数，为的范数表达式，为的范数表达式；
[0108]
这里，预测中心点si就是第一多层感知网络输出张量中包含的待测车道节点的中心点，每个预测中心点si对应一个待测车道节点即每个预测中心点si对应一个真值中心点二者间距越小则第一训练网络的网络成熟度越高；又已知第一训练网络的第一多层感知网络是预先训练成熟的神经网络，其网络参数在整个训练过程中保持不变，也就是说预测中心点si与真值中心点二者间距越小则第一训练网络的地图网络模块的网络成熟度
越高；所以，本发明实施例基于预测中心点si与真值中心点二者间距的回归函数的平均值构建第一损失函数l
map
，而回归函数的计算方式如上所示，采用横向(x轴向)和纵向(y轴向)间距的平滑l1损失函数和的总和来实现；而平滑l1损失函数d(σ)的计算原则由公知的平滑l1损失函数计算方式可知，由计算因子σ的范数‖σ‖二值域(小于1的第一值域和大于或等于1的第二值域)决定，在小于1的第一值域中采用(0.5*σ2)的方式计算，在大于或等于1的第二值域中采用(‖σ‖-0.5)的方式计算；
[0109]
步骤25，将形状为n1*4的当前输入张量和当前标签张量输入第一训练网络，通过地图网络模块对当前输入张量进行地图车道特征提取处理生成对应的形状为n1*128的第一训练张量；通过第一多层感知网络根据第一训练张量和当前标签张量对与当前标签张量的各个待测车道节点lni对应的中心点坐标进行回归预测生成对应的形状为n2*2的第二训练张量；
[0110]
其中，第二训练张量包括n2个预测中心点si的坐标(xi,yi)；
[0111]
这里，地图网络模块对当前输入张量进行地图车道特征提取处理的处理实现可参看论文《learning lane graph representations for motion forecasting》，在此不做一一赘述；第一多层感知网络的实现如前文所述，在此也不做重复描述；
[0112]
例如，已知当前输入张量的形状为40*4，当前标签张量的形状为10*4，那么得到的第二训练张量的形状为10*2即第二训练张量由10个预测中心点si的坐标(xi,yi)构成；
[0113]
步骤26，将各个待测车道节点lni对应的预测中心点si的坐标(xi,yi)和真值中心点的坐标代入第一损失函数进行损失值计算生成对应的第一损失值；
[0114]
例如，已知待测车道节点总数n2＝10，已知10个预测中心点si的坐标(xi,yi)和10个真值中心点的坐标代入第一损失函数l
map
可得第一损失值为：
[0115][0116]
步骤27，对第一损失值是否满足预设的第一损失值收敛范围进行识别；若第一损失值不满足第一损失值收敛范围，则沿着使第一损失函数达到最小值的方向对地图网络模块的网络参数进行反向调制，并在反向调制完成时返回步骤25继续训练；若第一损失值满足第一损失值收敛范围，则对当前地图张量是否为第一训练数据集的最后一个第一地图张量进行识别，若不是最后一个则提取下一个第一地图张量作为新的当前地图张量并返回步骤23继续训练，若是最后一个则停止模型训练并确认地图网络预训练成功。
[0117]
这里，第一损失值收敛范围是一个预设的合理损失值误差范围；若第一损失值不满足第一损失值收敛范围说明当次训练尚未收敛，则对地图网络模块进行网络参数调制并在调制后重返步骤25继续训练；若第一损失值满足第一损失值收敛范围说明基于当次的训练数据也就是当前地图张量的训练结束，还需再调取下一个训练数据也就是第一训练数据集的下一个第一地图张量进行训练，直到第一训练数据集的所有第一地图张量都被用于训练且都达到收敛效果为止。
[0118]
综上，通过本发明实施例步骤1-2的训练数据准备和模型训练，可抛开lanegcn模
型的整体输入限制实现对地图网络模块的充分训练，从而使得lanegcn模型中的地图网络模块具有更高的模型精度和范化适应能力。本发明实施例再通过上述步骤1-2之后就可将地图网络模块的网络参数固化下来，并将其带入lanegcn模型中通过后续步骤3-4对lanegcn模型进行整体训练。
[0119]
在对后续步骤3-4进行描述之前，此处先对lanegcn模型的模块结构和数据结构一下简单描述。
[0120]
lanegcn模型包括参与者网络模块、地图网络模块、融合网络模块和预测头网络模块；融合网络模块分别与参与者网络模块、地图网络模块和预测头网络模块连接；
[0121]
这里，可参看论文《learning lane graph representations for motion forecasting》的详细说明；
[0122]
(一)参与者网络模块
[0123]
参与者网络模块用于对形状为m*3*t1的第一输入张量进行参与者特征提取处理生成对应的形状为m*128的第一输出张量；并将第一输出张量向融合网络模块发送；
[0124]
其中，第一输入张量包括m个形状为3*t1的参与者观测张量；m为参与者总数；t1为预设的第一时刻数量，默认为20；
[0125]
这里，所谓参与者即是指交通参与者，也即是常规由自动驾驶系统的感知模块识别出的障碍物目标(目标)；参与者总数m为一个变量，第一时刻数量t1为一个预先设置的常量，默认为20，在实际应用中第一时刻数量t1指当前时刻之前的采样时刻数量；例如，m＝5、t1＝20、当前时刻为t0，那么，第一输入张量实际就是由5个障碍物目标在当前时刻t0之前的5条历史轨迹(即3*t1的参与者观测张量)组成的张量，每个障碍物目标的历史轨迹(参与者观测张量)包括t1＝20个轨迹点，每个轨迹点对应一个长度为3的向量，由后续处理步骤可知该向量包括对应轨迹点的坐标(x，y)和一个补零状态标识；
[0126]
(二)地图网络模块
[0127]
地图网络模块用于对形状为n*4的第二输入张量进行地图车道特征提取处理生成对应的形状为n*128的第二输出张量；并将第二输出张量向融合网络模块发送；
[0128]
其中，第二输入张量包括n个形状为1*4的车道节点向量；n为车道节点向量总数；
[0129]
这里，由前文可知车道节点向量的数据结构由对应的第一起点和第一终点的坐标组成；第二输入张量则由当前地图的所有车道节点向量组成；车道节点向量总数n为一个变量；
[0130]
(三)融合网络模块
[0131]
融合网络模块用于根据第一输出张量与第二输出张量进行特征融合处理生成对应的形状为m*128的第一融合特征张量；并将第一融合特征张量向预测头网络模块发送；
[0132]
这里，由论文《learning lane graph representations for motion forecasting》可知，融合网络模块包括四个融合单元：参与者到车道(actor to lane，a2l)融合单元、车道到车道(lane to lane，l2l)融合单元、车道到参与者(lane to actor，l2a)融合单元和参与者到参与者(actor to actor，a2a)融合单元；a2l融合单元用于对第一输出张量和第二输出张量进行参与者到车道的特征融合输出对应的a2l融合特征张量；l2l融合单元用于对a2l融合特征张量进行车道到车道的特征融合输出对应的l2l融合特征张量；l2a融合单元用于对第一输出张量和l2l融合特征张量进行车道到参与者的特征融合输出
对应的l2a融合特征张量；a2a融合单元用于对l2a融合特征张量进行参与者到参与者的特征融合输出对应的a2a融合特征张量也即形状为m*128的第一融合特征张量；
[0133]
(四)预测头网络模块
[0134]
预测头网络模块包括回归分支和分类分支；回归分支用于根据第一融合特征张量进行多模态轨迹预测处理生成对应的形状为m*k*t2*2的第一预测张量；分类分支用于根据第一融合特征张量进行多模态置信度分类处理生成对应的形状为m*k的第一置信度张量；
[0135]
其中，k为模态总量；t2为预设的第二时刻数量，默认为30；
[0136]
第一预测张量包括m个形状为k*t2*2的第一参与者预测张量；第一参与者预测张量与m个参与者一一对应；第一参与者预测张量包括k个形状为t2*2的第一预测轨迹张量；第一预测轨迹张量包括第二时刻数量t2的第一轨迹点向量；第一轨迹点向量为一个二维的轨迹点坐标；
[0137]
第一置信度张量包括m个长度为k的第一置信度向量；第一置信度向量与m个参与者一一对应；第一置信度向量包括k个第一置信度；第一置信度与第一预测轨迹张量一一对应，第一置信度为对应的第一预测轨迹张量的预测置信度。
[0138]
这里，预测头网络模块是通过回归分支和分类分支对m个参与者在未来时段内的k种可能轨迹进行预测得到m*k个预测轨迹即第一预测轨迹张量，并由m*k个第一预测轨迹张量组成输出的第一预测张量；并为每个第一预测轨迹张量分配一个置信度分数即第一置信度，并由每个参与者对应的k个第一置信度组成对应的第一置信度向量，再由m个长度为k的第一置信度向量组成输出的第一置信度张量；
[0139]
每个第一预测轨迹张量的时刻总数也就是第一轨迹点向量总数相等都为第二时刻数量t2，此处每个第一轨迹点向量对应一个预测轨迹点的坐标所以第一轨迹点向量的长度为2，所以第一预测轨迹张量的形状为t2*2；
[0140]
每种轨迹可能对应一个模态，模态总量k可预先设定为4即对应前、后、左、右四种可能，也可基于每次的实际预测结果进行获取，若模态总量k为预先设定的常量那么第一预测张量中可能会存在轨迹点向量为全0的第一预测轨迹张量说明没有对应的预测轨迹，那么对应的第一置信度为0。
[0141]
上述描述对lanegcn模型的模块结构和数据结构进行了介绍，基于此即可理解下文步骤3-4中的数据准备和模型训练处理过程。
[0142]
步骤3，地图网络预训练成功，则获取车辆路测数据构建第二训练数据集；
[0143]
这里，第二训练数据集是基于lanegcn模型的整体输入要求即参与者网络模块和地图网络模块的输入数据要求构建的训练数据集；其中，地图网络模块的输入数据与参与者网络模块的输入数据具有空间关联性；
[0144]
具体包括：步骤31，从预设的车辆路测数据库中选择一个第一路测数据序列；
[0145]
其中，第一路测数据序列由时序连续的且完成了目标关联的(t1+1)+t2帧第一路测数据组成；第一路测数据包括第一时间戳、第一自车坐标和多个第一目标数据组，第一目标数据组包括第一目标标识和第一目标坐标；前后时刻的第一路测数据中关联目标对应的两个第一目标数据组的第一目标标识相同；
[0146]
这里，本发明实施例在进行当前步骤3之前预先要通过车辆路测对车辆路测数据库进行数据储备，具体为：
[0147]
执行路测任务的车辆在自车行驶过程中，调用自车的自动驾驶系统的感知模块持续对自车周围的障碍物目标(即交通参与者、参与者)进行感知从而获得连续时刻的多个感知数据(类似激光雷达点云、摄像头图像等)，每获得一个感知数据就基于预设的目标检测模型对当前感知数据进行目标检测从而得到多个目标位姿(包括坐标、形状、速度、朝向等信息)，再基于预设的目标关联算法对前后时刻两个感知数据的目标检测结果进行目标关联并为关联目标分配同一个目标标识信息，再对具有相同目标标识信息的同一目标(即同一参与者)进行轨迹跟踪就可得到对应的目标历史轨迹，每个目标历史轨迹对应一个目标标识且由多个轨迹点构成，每个轨迹点包括一个轨迹点坐标信息并对应一个时间戳信息；
[0148]
另外，执行路测任务的车辆在调用感知模块进行跟踪目标历史轨迹的同时，还通过自动驾驶系统的定位模块对自车实时位姿(包括坐标、速度、朝向等信息)进行同步获取，并根据自车实时位姿得到自车历史轨迹，与目标历史轨迹类似自车历史轨迹也由多个轨迹点构成，每个轨迹点包括一个轨迹点坐标信息并对应一个时间戳信息；自车在维护自车历史轨迹时，会将自车轨迹点的时间戳信息与目标轨迹点的时间戳信息进行同步，从而使得留存的自车轨迹点和各个目标历史轨迹的轨迹点能对应同一个同步时间戳信息；
[0149]
另外，执行路测任务的车辆在生成时间同步的目标历史轨迹和自车历史轨迹的同时，还会基于预设的片段时长定期对自车历史轨迹和各个参与者的目标历史轨迹进行片段切分从而得到自车以及各个参与者的轨迹片段；再将同一时段的自车与各个参与者的轨迹片段按轨迹点的同步时间戳信息进行轨迹点坐标组合从而得到该时段的路测数据序列并存于本地；其中，路测数据序列包括多帧路测数据，每帧路测数据包括同步时间戳+自车坐标+多个目标数据组，每个目标数据组包括目标标识+目标坐标，路测数据序列的长度为路测数据的总数；
[0150]
在路测任务结束时，执行路测任务的车辆会将当次行驶过程中保存的多个路测数据序列上传到车辆路测数据库进行保存；
[0151]
基于上述数据储备过程，我们可知当前步骤从车辆路测数据库中获取的第一路测数据序列实际就是一个自车+多个参与者的轨迹片段集合；第一路测数据序列中的各个第一路测数据实际就是一个时间点上的自车+多个参与者的轨迹点坐标组合；第一路测数据的第一时间戳就是对应时间点的自车与多个参与者的同步时间戳信息；第一路测数据的第一自车坐标就是对应时间点上的自车实时位姿中的坐标信息；第一路测数据的各个第一目标数据组就是对应时间点上各个参与者的目标标识信息+轨迹点坐标信息，其中，第一目标标识即为对应参与者的目标标识信息，第一目标坐标即为对应参与者在对应时间点上的轨迹点坐标信息；前后时刻的第一路测数据即是指第一路测数据序列中相邻的两个第一路测数据，由前述目标关联说明内容可知同属一个参与者(即关联目标)的两个第一路测数据中的第一目标标识是同一个目标标识信息即前后时刻的第一路测数据中关联目标对应的两个第一目标数据组的第一目标标识相同；
[0152]
本发明实施例默认获取的第一路测数据序列的长度为(t1+1)+t2；那么在从车辆路测数据库中选择一个第一路测数据序列时，先从车辆路测数据库选择一个路测数据序列作为当前路测数据序列；若当前路测数据序列的长度等于(t1+1)+t2则将当前路测数据序列作为对应的第一路测数据序列输出；若当前路测数据序列的长度大于(t1+1)+t2，则以(t1+1)+t2为截取长度对当前路测数据序列按步长为1的方式进行滑动片段截取得到多个路测数据
序列片段，并将每个路测数据序列片段作为一个第一路测数据序列的候选序列以供使用；本发明实施例的这种处理方式能充分利用车辆路测数据库的储备数据产生丰富的训练数据源；
[0153]
例如，车辆路测数据库中的路测数据序列a长度为60，(t1+1)+t2＝(20+1)+30＝51，那么按步长为1、截取长度为51的滑动片段截取方式对路测数据序列a从第1个路测数据开始滑动片段截取就可获得(60-51)+1＝10个候选序列以供使用，这就等于由一个路测数据序列a产生了10个第一路测数据序列备用，每个备用的第一路测数据序列的长度都为51；
[0154]
步骤32，以第(t1+1)帧第一路测数据的第一自车坐标为第一参考点坐标，并以第一参考点坐标对应的第一时间戳减去1秒的时间作为第一时间，并以早于第一时间且距离第一时间最近的第一时间戳对应的第一自车坐标为第二参考点坐标；以第一参考点坐标为原点，以第二参考点坐标到第一参考点坐标的朝向为x轴正向构建二维笛卡尔坐标系记为对应的第二坐标系；
[0155]
这里，在第一时刻数量t1默认为20、第二时刻数量t2默认为30时，第一路测数据序列包括了(t1+1)+t2＝51帧第一路测数据；第二坐标系实际就是以(t1+1)＝21帧第一路测数据对应的时间点为当前时间点t0，并以当前时间点t0对应的第一自车坐标为原点，以前1秒到当前时间点t0的自车行驶方向(朝向)为x轴正向的二维鸟瞰视角的自车坐标系；
[0156]
步骤33，在第二坐标系下对所有第一自车坐标和第一目标坐标进行坐标转换生成对应的第二自车坐标和第二目标坐标；
[0157]
这里，实际就是将第一路测数据序列中的所有轨迹点坐标(自车与各个参考者的轨迹点坐标)都转换到统一的自车坐标系即第二坐标系下；
[0158]
步骤34，将前(t1+1)帧第一路测数据中第一目标标识相同的多个第二目标坐标按时间先后顺序排序生成对应的参与者历史轨迹；并对参与者历史轨迹的总数进行统计生成对应的第一参与者总数m1；并对各个参与者历史轨迹中相邻的第二目标坐标进行坐标差分计算生成对应的差分坐标序列；若差分坐标序列的差分坐标的数量不够第一时刻数量t1则采用前补零的方式进行补足，保证差分坐标序列始终具有第一时刻数量t1的差分坐标，并为每个差分坐标分配一个对应的补零状态标识；并由各个差分坐标的横向差分坐标
△
x和纵向差分坐标
△
y以及对应的补零状态标识构成对应的形状为1*3的参与者观测向量；并由各个参与者历史轨迹对应的第一时刻数量t1的参与者观测向量组成对应的形状为t1*3的第一观测张量；并对第一观测张量进行转置变换从而得到对应的形状为3*t1的参与者观测张量；并由得到的第一参与者总数m1的参与者观测张量组成对应的形状为m1*3*t1的第一训练张量；
[0159]
其中，差分坐标包括横向差分坐标
△
x和纵向差分坐标
△
y；补零状态标识包括第一标识值和第二标识值，若补零状态标识为第一标识值则对应的差分坐标的类型为补零差分坐标，若补零状态标识为第二标识值则对应的差分坐标的类型为真实差分坐标；
[0160]
例如，第一路测数据序列包括了(t1+1)+t2＝51帧第一路测数据；
[0161]
设从第1个到第51帧的第一路测数据中都包括了2个第一目标数据组(第一目标数据组1、2)，从第11个到第50帧第一路测数据中还包括一个第一目标数据组3；其中，第一目标数据组1、2的第一目标标识分别为标识a、b，第一目标数据组3的第一目标标识为标识c；
[0162]
已知t1＝20，设在第一路测数据序列的前(20+1)＝21帧第一路测数据中，第一目
标数据组1、2对应的第一目标坐标分别为p
a1,r
、p
b1,r
，对应的第二目标坐标分别为p
a2,r
、p
b2,r
，1≤r≤21；第一目标坐标3对应的第一目标坐标为p
c1,r*
，对应的第二目标坐标为p
c2,r*
，11≤r
*
≤21；
[0163]
那么，将前21帧第一路测数据中第一目标标识相同的多个第二目标坐标按时间先后顺序排序可以得到3个参与者历史轨迹：
[0164]
参与者历史轨迹1{p
a2,r＝1
,p
a2,r＝2
,p
a2,r＝3
…
p
a2,r＝20
,p
a2,r＝21
}，参与者历史轨迹1的轨迹长度为21；
[0165]
参与者历史轨迹2{p
b2,r＝1
,p
b2,r＝2
,p
b2,r＝3
…
p
b2,r＝20
,p
b2,r＝21
}，参与者历史轨迹2的轨迹长度为21；
[0166]
参与者历史轨迹3{p
c2,r*＝11
,p
c2,r*＝12
,p
c2,r*＝13
…
p
c2,r*＝20
,p
c2,r*＝21
}，参与者历史轨迹3的轨迹长度为11；
[0167]
第一参与者总数m1＝3；
[0168]
对参与者历史轨迹1、2、3中相邻的第二目标坐标进行坐标差分计算可以得到3个差分坐标序列：
[0169]
差分坐标序列1{
△
p
a2,r＝1
＝p
a2,r＝2-p
a2,r＝1
,
…△
p
a2,r＝20
＝p
a2,r＝21-p
a2,r＝20
}，差分坐标序列1中差分坐标
△
p
a2,r
的数量为20与t1＝20相等不用补零，也就是说从
△
p
a2,r＝1
到
△
p
a2,r＝20
都是真实差分坐标，对应的补零状态标识都为第二标识值；
[0170]
差分坐标序列2{
△
p
b2,r＝1
＝p
b2,r＝2-p
b2,r＝1
,
…△
p
b2,r＝20
＝p
b2,r＝21-p
b2,r＝20
}，差分坐标序列2中差分坐标
△
p
b2,r
的数量为20与t1＝20相等不用补零，也就是说从
△
p
b2,r＝1
到
△
p
b2,r＝20
都是真实差分坐标，对应的补零状态标识都为第二标识值；
[0171]
差分坐标序列3{
△
p
c2,r*＝11
＝p
c2,r*＝12-p
c2,r*＝11
,
…△
p
c2,r*＝20
＝p
c2,r*＝21-p
c2,r*＝20
}，差分坐标序列3中差分坐标
△
p
c2,r*
的数量为10不够t1＝20需要对差分坐标序列3进行前补零使得差分坐标序列3中差分坐标
△
p
c2,r*
的数量达到20，补零后的差分坐标序列3为：
[0172]
{
△
p
c2,r＝1
,
…△
p
c2,r＝10
,
△
p
c2,r＝11
…△
p
c2,r＝20
},
[0173]
其中从
△
p
c2,r＝1
到
△
p
c2,r＝10
为补零差分坐标、对应的补零状态标识为第一标识值，
△
p
c2,r＝11
到
△
p
c2,r＝20
为真实差分坐标、对应的补零状态标识为第二标识值；
[0174]
将差分坐标包括的横向差分坐标
△
x和纵向差分坐标
△
y代入差分坐标序列1、2和补零后的差分坐标序列3可得：
[0175]
差分坐标序列1{(
△
x
a2,r＝1
,
△ya2,r＝1
),
…
(
△
x
a2,r＝20
,
△ya2,r＝20
)},
[0176]
差分坐标序列2{(
△
x
b2,r＝1
,
△yb2,r＝1
),
…
(
△
x
b2,r＝20
,
△yb2,r＝20
)},
[0177]
差分坐标序列3{(0,0),(0,0),(0,0),(0,0),(0,0),(0,0),(0,0),(0,0),(0,0),(0,0),(
△
x
c2,r＝11
,
△yc2,r＝11
)
…
(
△
x
c2,r＝20
,
△yc2,r＝20
)}；
[0178]
设第一标识值为0，第二标识值为1，那么，
[0179]
由差分坐标序列1可以得到20个参与者观测向量为：参与者观测向量a1(
△
x
a2,r＝1
,
△ya2,r＝1
,第二标识值＝1)
……
参与者观测向量a20(
△
x
a2,r＝20
,
△ya2,r＝20
,第二标识值＝1)；从而得到与标识a对应的第一观测张量a为{参与者观测向量a1,参与者观测向量a2
……
参与者观测向量a20}；这里，参与者观测向量a1的形状为1*3，第一观测张量a的形状为20*3，对第一观测张量a进行转置得到对应的参与者观测张量a，那么参与者观测张量a的形状就为3*20；
[0180]
由差分坐标序列2可以得到20个参与者观测向量为：参与者观测向量b1(
△
x
b2,r＝1
,
△yb2,r＝1
,第二标识值＝1)
……
参与者观测向量b20(
△
x
b2,r＝20
,
△yb2,r＝20
,第二标识值＝1)；从而得到与标识b对应的第一观测张量b为{参与者观测向量b1,参与者观测向量b2
……
参与者观测向量b20}；这里，参与者观测向量b1的形状为1*3，第一观测张量b的形状为20*3，对第一观测张量b进行转置得到对应的参与者观测张量b，那么参与者观测张量b的形状就为3*20；
[0181]
由差分坐标序列2可以得到20个参与者观测向量为：参与者观测向量c1(0,0,第一标识值＝0)
……
参与者观测向量c10(0,0,第一标识值＝0)，参与者观测向量c11(
△
x
c2,r＝11
,
△yc2,r＝11
,第二标识值＝1)
……
参与者观测向量c20(
△
x
c2,r＝20
,
△yc2,r＝20
,第二标识值＝1)；从而得到与标识c对应的第一观测张量c为{参与者观测向量c1,参与者观测向量c2
……
参与者观测向量c20}；这里，参与者观测向量c1的形状为1*3，第一观测张量c的形状为20*3，对第一观测张量c进行转置得到对应的参与者观测张量c，那么参与者观测张量c的形状就为3*20；
[0182]
由得到的对应标识a、b、c的m1＝3个参与者观测张量a、b、c组成对应的第一训练张量，那么第一训练张量的形状就为3*3*20；
[0183]
步骤35，将后t2帧第一路测数据中第一目标标识相同的多个第二目标坐标按时间先后顺序排序生成对应的参与者真实轨迹；若参与者真实轨迹的第二目标坐标的数量不够第二时刻数量t2则使用预设的卡尔曼滤波器对参与者真实轨迹在未来多个时刻的轨迹坐标进行预测从而保证参与者真实轨迹始终具有第二时刻数量t2的第二目标坐标；并由得到的所有参与者真实轨迹组成对应的第一真实轨迹集合；
[0184]
例如，延续上述示例，已知第一路测数据序列包括了(t1+1)+t2＝51帧第一路测数据，t2＝30，第一路测数据序列中的后30帧第一路测数据中前29帧都包括了3个第一目标数据组(第一目标数据组1、2、3)，但最后一帧第一路测数据中只包括2个第一目标数据组(第一目标数据组1、2)，其中第一目标数据组1、2、3的第一目标标识分别为标识a、b、c，对应的第二目标坐标分别为p
a2,g
、p
b2,g
、p
c2,o
，22≤g≤51，22≤o≤50；
[0185]
那么，将后30帧第一路测数据中第一目标标识相同的多个第二目标坐标按时间先后顺序排序可以得到3个参与者真实轨迹：
[0186]
参与者真实轨迹1{p
a2,g＝22
,p
a2,g＝23
…
p
a2,g＝51
}，参与者真实轨迹1的第二目标坐标的数量为30与第二时刻数量t2＝30相等无需进行轨迹补充；
[0187]
参与者真实轨迹2{p
b2,g＝22
,p
b2,g＝23
…
p
b2,g＝51
}，参与者真实轨迹2的第二目标坐标的数量为30与第二时刻数量t2＝30相等无需进行轨迹补充；
[0188]
参与者真实轨迹3{p
c2,o＝22
,p
c2,o＝23
…
p
c2,o＝50
}，参与者真实轨迹3的第二目标坐标的数量为29不够第二时刻数量t2＝30，因此需要则使用预设的卡尔曼滤波器对参与者真实轨迹3在p
c2,o＝50
之后1个时刻的轨迹坐标进行预测从而保证参与者真实轨迹3始终具有第二时刻数量t2＝30个第二目标坐标；完成预测后的参与者真实轨迹3为{p
c2,g＝22
,p
c2,g＝23
…
p
c2,g＝51
}，其中p
c2,g＝51
为预测出的第二目标坐标；
[0189]
然后，将所有参与者真实轨迹组成对应的第一真实轨迹集合{参与者真实轨迹1，参与者真实轨迹2，参与者真实轨迹3}；
[0190]
这里，当前步骤准备出的第一真实轨迹集合为前述步骤34准备出的第一训练张量
对应的真值数据，在后续步骤中会用于对第一训练张量对应的lanegcn模型输出预测轨迹进行比对；
[0191]
步骤36，查询预设的高精地图库，按预设的地图尺寸将覆盖了所有第一自车坐标和第一目标坐标的高精地图提取出来作为对应的第二场景地图；
[0192]
其中，第二场景地图包括多个第二车道，第二车道包括第二车道中心线；
[0193]
这里，lanegcn模型的地图网络模块的输入数据与参与者网络模块的输入数据具有空间关联性，因此本发明实施例在准备对应的训练数据时，从已知的高精地图库中查找覆盖了所有第一自车坐标和第一目标坐标的高精地图区域作为待选区域，并基于预先设定的地图尺寸信息对该待选区域进行地图裁剪从而得到对应的第二场景地图；
[0194]
步骤37，根据预设的车道分段长度对各个第二车道进行分段得到对应的多个第二车道分段；并将各个第二车道分段与对应的第二车道中心线的两个交点记为对应的第二起点和第二终点；并将各个第二车道分段的第二起点和第二终点在第二坐标系上的坐标作为对应的第二起点坐标和第二终点坐标；并由各个第二车道分段的第二起点坐标和第二终点坐标组成对应的形状为1*4的车道节点向量；并对车道节点向量的总数进行统计生成对应的车道节点向量总数n3；并由得到的n3个车道节点向量组成对应的形状为n3*4的第二地图张量；
[0195]
这里，在处理分段时默认从第二场景地图的各个第二车道的起始位置起开始分段，每隔一个车道分段长度截取一个车道分段作为对应的第二车道分段；每个第二车道分段势必与当前车道的第二车道中心线存在两个交点，这里将靠近车道起始位置的交点记为第二起点、远离车道起始位置的交点记为第二终点；将每个车道分段的特征向量定义为车道节点向量，那么车道节点向量的内容就是由对应车道分段的两个特征点在自车坐标系下即第二坐标系上的坐标构成，因此车道节点向量的形状为1*4；第二场景地图上的车道分段总数也就是车道节点向量总数为n3，那么，由n3个车道节点向量进行组合就能得到用于表征当前第二场景地图的形状为n3*4的特征张量即第二地图张量；当前步骤准备出的第二地图张量为前述步骤34准备出的第一训练张量对应的车道数据，在后续步骤中会与第一训练张量一起输入lanegcn模型进行多模态轨迹预测；
[0196]
步骤38，由第一训练张量、第一真实轨迹集合和第二地图张量组成对应的第二训练数据存入第二训练数据集；
[0197]
步骤39，对第二训练数据集中的第二训练数据的总数进行统计生成对应的第一数量；若第一数量小于预设的第一总量阈值则返回步骤31继续准备训练数据；若第一数量等于第一总量阈值则停止准备训练数据并将第二训练数据集输出。
[0198]
这里，第一总量阈值为一个预先设定的第二训练数据集的总量阈值，只要第二训练数据集中的训练数据总量达到该阈值则可以停止数据准备继而转至后续步骤进行模型训练，反之若训练数据总量未达到该阈值则应返回步骤31继续准备训练数据。
[0199]
步骤4，在保持地图网络模块的网络参数不变的前提下根据第二训练数据集对lanegcn模型进行模型训练；
[0200]
具体包括：步骤41，根据第二时刻数量t2设置lanegcn模型的损失函数l
mod
为：
[0201]
l
mod
＝l
cls
+αl
reg
，
[0202][0203][0204]
reg(z)＝∑jd(zj)，
[0205][0206]
其中，因子α为1.0；
[0207]
l
cls
为分类损失函数，l
reg
为回归损失函数；
[0208]
分类损失函数l
cls
中，∈为一个预设的边际因子，m为参与者索引，1≤m≤参与者总数m，参与者索引m与第一目标坐标对应；k为置信度负样本索引，k
*
为置信度正样本索引，1≤k、k
*
≤模态总量k,但k≠k
*
；c
m,k
为第m个参与者的k个第一置信度中的负分类样本，c
m,k*
为第m个参与者的k个第一置信度中的正分类样本；各个参与者的k个第一置信度中只有一个为正分类样本，其余k-1个均为负分类样本；正分类样本对应的第一预测轨迹张量的最后一个第一轨迹点向量的轨迹点坐标与对应的参与者真实轨迹的最后一个第二目标坐标之间的直线距离最短；
[0209]
预测损失函数l
reg
中，t2为预设的第二时刻数量，默认为30；t为时刻索引，1≤t≤t2；reg()是回归函数，d()是平滑l1损失函数；为第m个参与者的k个第一预测轨迹张量中对应置信度正样本索引k
*
的第一预测轨迹张量上第t个第一轨迹点向量的轨迹点坐标；为第m个参与者对应的参与者真实轨迹中第t个的第二目标坐标；
[0210]
这里，lanegcn模型的损失函数l
mod
可参看论文《learning lane graph representations for motion forecasting》的详细说明；
[0211]
步骤42，从第二训练数据集中提取第一个第二训练数据作为对应的当前训练数据；
[0212]
步骤43，从当前训练数据中提取第一训练张量、第一真实轨迹集合和第二地图张量作为对应的当前训练张量、当前真实轨迹集合和当前地图张量；并对当前训练张量的参与者观测张量的数量进行统计生成当前参与者总数m2；并对当前地图张量的车道节点向量的数量进行统计生成当前车道节点向量总数n4；
[0213]
步骤44，将形状为m2*3*t1的当前训练张量输入参与者网络模块进行参与者特征提取处理生成对应的形状为m2*128的第二特征张量；并将形状为n4*4的当前地图张量输入地图网络模块进行地图车道特征提取处理生成对应的形状为n4*128的第三特征张量；并将第二、第三特征张量输入融合网络模块进行特征融合处理生成对应的形状为m2*128的第四特征张量；并将第四特征张量分别输入预测头网络模块的回归分支和分类分支进行对应的多模态轨迹预测处理和多模态置信度分类处理生成对应的形状为m2*k*t1*2的第二预测张量和形状为m2*k的第二置信度张量；
[0214]
其中，第二预测张量包括m2个形状为k*t2*2的第二参与者预测张量；第二参与者预测张量与第一目标标识对应；第二参与者预测张量包括k个形状为t2*2的第二预测轨迹张量；第二预测轨迹张量包括第二时刻数t2的第二轨迹点向量；第二轨迹点向量为一个二维
的轨迹点坐标；
[0215]
第二置信度张量包括m2个长度为k的第二置信度向量；第二置信度向量与第一目标标识对应；第二置信度向量包括k个第二置信度；第二置信度与第二预测轨迹张量一一对应，第二置信度为对应的第二预测轨迹张量的预测置信度；
[0216]
例如，设模态总量k＝4，以前述示例中由参与者观测张量a、b、c组成的第一训练张量{参与者观测张量a、b、c}为当前训练张量，第一真实轨迹集合{参与者真实轨迹1，参与者真实轨迹2，参与者真实轨迹3}为当前真实轨迹集合，第二地图张量为当前地图张量，将当前训练张量和当前地图张量输入lanegcn模型经由参与者网络模块、地图网络模块、融合网络模块和预测头网络模块进行运算之后得到m2＝3、k＝4的形状为3*4*20*2的第二预测张量和形状为3*4的第二置信度张量；
[0217]
那么，第二预测张量包括3个形状为4*30*2的第二参与者预测张量分别为第二参与者预测张量a、b、c；每个第二参与者预测张量中有4个形状为30*2的第二预测轨迹张量即第二预测轨迹张量a1、a2、a3、a4，第二预测轨迹张量b1、b2、b3、b4，第二预测轨迹张量c1、c2、c3、c4；每个第二预测轨迹张量(a1-a4，b1-b4，c1-c4)中包括30个第二轨迹点向量即30个二维的轨迹点坐标,1≤k’≤k即1≤k’≤4，1≤m≤m2即1≤m≤3，1≤t≤t2即1≤t≤30；
[0218]
第二置信度张量包括3个长度为4的第二置信度向量分别为第二置信度向量a、b、c；每个第二置信度向量中有4个第二置信度c
m，k
′
；
[0219]
步骤45，将当前参与者总数m2、第二预测张量、第二置信度张量以及当前真实轨迹集合代入lanegcn模型的损失函数l
mod
进行损失值计算生成对应的第二损失值；
[0220]
具体包括：步骤451，对当前真实轨迹集合中各个参与者真实轨迹的进行遍历；遍历时，将当前遍历的参与者真实轨迹作为当前真实轨迹，并将当前真实轨迹的最后一个第二目标坐标作为当前坐标，并将当前真实轨迹对应的第一目标标识作为当前目标标识；并计算当前目标标识对应的各个第二预测轨迹张量的最后一个第二轨迹点向量对应的轨迹点坐标与当前坐标的直线距离生成对应的第一直线距离；并从得到的所有第一直线距离中选择最短的作为对应的当前最短距离，并将当前最短距离对应的第二预测轨迹张量作为对应的匹配预测轨迹张量，并将匹配预测轨迹张量对应的模态分支索引作为对应的匹配模态索引，并由当前目标标识+匹配模态索引从第二置信度张量中提取对应的第二置信度作为对应的匹配置信度；并由匹配模态索引确定对应的置信度正样本索引k
*
，并由匹配置信度确定对应的正分类样本并将第二置信度张量中与当前目标标识对应的且不与正分类样本匹配的其他第二置信度均设为对应的负分类样本c
m，k
；
[0221]
例如，对当前真实轨迹集合中3个参与者真实轨迹进行遍历；
[0222]
当前真实轨迹为参与者真实轨迹1时，当前坐标为参与者真实轨迹1的最后一个第二目标坐标，当前目标标识为标识a；对当前坐标与标识a对应的4个第二预测轨迹张量(a1-a4)的最后一个第二轨迹点向量对应的轨迹点坐标的直线距离进行计算得到4个第一直线距离，设与第二预测轨迹张量a1的第一直线距离最短，则第二预测轨迹张量a1为匹配预测轨迹张量，匹配预测轨迹张量对应的模态分支索引为1即匹配模态索引为1、对应的置信度正样本索引k
*
＝1，从第二置信度张量中提取出的与标识a+匹配模态索引1对应的正分类样
本应为那么与标识a对应的负分类样本c
m，k
则包括c
m＝1，k＝2
、c
m＝1，k＝3
、c
m＝1，k＝4
；
[0223]
当前真实轨迹为参与者真实轨迹2时，当前坐标为参与者真实轨迹2的最后一个第二目标坐标，当前目标标识为标识b；对当前坐标与标识b对应的4个第二预测轨迹张量(b1-b4)的最后一个第二轨迹点向量对应的轨迹点坐标的直线距离进行计算得到4个第一直线距离，设与第二预测轨迹张量b2的第一直线距离最短，则第二预测轨迹张量b2为匹配预测轨迹张量，匹配预测轨迹张量对应的模态分支索引为2即匹配模态索引为2、对应的置信度正样本索引k
*
＝2，从第二置信度张量中提取出的与标识b+匹配模态索引2对应的正分类样本应为那么与标识b对应的负分类样本c
m，k
则包括c
m＝2，k＝1
、c
m＝2，k＝3
、c
m＝2，k＝4
；
[0224]
当前真实轨迹为参与者真实轨迹3时，当前坐标为参与者真实轨迹3的最后一个第二目标坐标，当前目标标识为标识c；对当前坐标与标识c对应的4个第二预测轨迹张量(c1-c4)的最后一个第二轨迹点向量对应的轨迹点坐标的直线距离进行计算得到4个第一直线距离，设与第二预测轨迹张量c3的第一直线距离最短，则第二预测轨迹张量c3为匹配预测轨迹张量，匹配预测轨迹张量对应的模态分支索引为3即匹配模态索引为3、对应的置信度正样本索引k
*
＝3，从第二置信度张量中提取出的与标识c+匹配模态索引3对应的正分类样本应为那么与标识c对应的负分类样本c
m，k
则包括c
m＝3，k＝1
、c
m＝3，k＝2
、c
m＝3，k＝4
；
[0225]
步骤452，从各个第二参与者预测张量中选择与各自对应的置信度正样本索引k
*
对应的第二预测轨迹张量作为对应的正样本预测轨迹张量，并将该正样本测轨迹张量的各个第二轨迹点向量作为对应的正样本轨迹点向量
[0226]
例如，已知对于标识a，置信度正样本索引k
*
＝1，那么第二预测轨迹张量a1即为参与者a的正样本预测轨迹张量；那么，第二预测轨迹张量a1的各个第二轨迹点向量即为标识a对应的正样本轨迹点向量
[0227]
已知对于标识b，置信度正样本索引k
*
＝2，那么第二预测轨迹张量b2即为参与者b的正样本预测轨迹张量；那么，第二预测轨迹张量b2的各个第二轨迹点向量即为标识b对应的正样本轨迹点向量
[0228]
已知对于标识c，置信度正样本索引k
*
＝3，那么第二预测轨迹张量c3即为参与者c的正样本预测轨迹张量；那么，第二预测轨迹张量c3的各个第二轨迹点向量即为标识b对应的正样本轨迹点向量
[0229]
步骤453，将当前真实轨迹集合中各个参与者真实轨迹的第二目标坐标作为对应的真实轨迹点向量
[0230]
例如，延续前述示例，已知当前真实轨迹集合包括参与者真实轨迹1、2、3；
[0231]
对参与者真实轨迹1而言，提取其各个第二目标坐标作为对应的真实轨迹点向量
[0232]
对参与者真实轨迹2而言，提取其各个第二目标坐标作为对应的真实轨迹点向量
[0233]
对参与者真实轨迹3而言，提取其各个第二目标坐标作为对应的真实轨迹点向量
[0234]
步骤455，将得到的所有正分类样本负分类样本c
m，k
、正样本轨迹点向量和真实轨迹点向量以及当前参与者总数m2代入损失函数l
mod
进行损失值计算生成对应的第二损失值；
[0235]
例如，将当前参与者总数m2＝3和得到的所有正分类样本＝3和得到的所有正分类样本负分类样本c
m，k
(c
m＝1，k＝2
、c
m＝1，k＝3
、c
m＝1，k＝4
、c
m＝2，k＝1
、c
m＝2，k＝3
、c
m＝2，k＝4
、c
m＝3，k＝1
、c
m＝3，k＝2
、c
m＝3，k＝4
)、正样本轨迹点向量)、正样本轨迹点向量和真实轨迹点向量代入损失函数l
mod
，
[0236]
l
mod
＝l
cls
+1.0*l
reg
，
[0237][0238][0239]
对于reg()函数的求解，与前述步骤25类似，在此就不做进一步分解；由上述计算步骤可知，损失函数l
mod
中各个参数都是已知数据由此即可算出对应的第二损失值；
[0240]
步骤46，对第二损失值是否满足预设的第二损失值收敛范围进行识别；若第二损失值不满足第二损失值收敛范围，则沿着使第二损失函数达到最小值的方向对lanegcn模型中除地图网络模块之外的各模块网络参数进行反向调制，并在反向调制完成时返回步骤44继续训练；若第二损失值满足损失值收敛范围，则对当前训练数据是否为第二训练数据集的最后一个第二训练数据进行识别，若不是最后一个则提取下一个第二训练数据作为新的当前训练数据并返回步骤43继续训练，若是最后一个则停止模型训练并确认模型训练成功。
[0241]
这里，第二损失值收敛范围是一个预设的合理损失值误差范围；若第二损失值不满足第二损失值收敛范围说明当次训练尚未收敛，则对lanegcn模型中除地图网络模块之外的各模块网络参数进行反向调制并在调制后重返步骤44继续训练；若第二损失值满足第二损失值收敛范围说明基于当次的训练数据也就是当前训练数据的训练结束，还需再调取下一个训练数据也就是第二训练数据集的下一个第二训练数据进行训练，直到第二训练数据集的所有第二训练数据都被用于训练且都达到收敛效果为止。
[0242]
综上，通过本发明实施例步骤3-4的训练数据准备和模型训练，基于预训练成熟的地图网络模块对lanegcn模型进行训练，降低了lanegcn模型的整体模型训练难度，提高了lanegcn模型的整体输出精度。
[0243]
图2为本发明实施例二提供的一种模型训练的处理装置的模块结构图，该装置为
实现前述方法实施例的终端设备或者服务器，也可以为能够使得前述终端设备或者服务器实现前述方法实施例的装置，例如该装置可以是前述终端设备或者服务器的装置或芯片系统。如图2所示，该装置包括：第一训练数据准备模块201、第一模型训练模块202、第二训练数据准备模块203和第二模型训练模块204。
[0244]
第一训练数据准备模块201用于获取高精地图构建第一训练数据集。
[0245]
第一模型训练模块202用于根据第一训练数据集对lanegcn模型的地图网络模块进行地图网络预训练。
[0246]
第二训练数据准备模块203用于在地图网络预训练成功时获取车辆路测数据构建第二训练数据集。
[0247]
第二模型训练模块204用于在保持地图网络模块的网络参数不变的前提下根据第二训练数据集对lanegcn模型进行模型训练。
[0248]
本发明实施例提供的一种模型训练的处理装置，可以执行上述方法实施例中的方法步骤，其实现原理和技术效果类似，在此不再赘述。
[0249]
需要说明的是，应理解以上装置的各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，第一训练数据准备模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所描述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
[0250]
例如，以上这些模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(application specific integrated circuit，asic)，或，一个或多个数字信号处理器(digital signal processor，dsp)，或，一个或者多个现场可编程门阵列(field programmable gate array，fpga)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(central processing unit，cpu)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，soc)的形式实现。
[0251]
在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。该计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行该计算机程序指令时，全部或部分地产生按照前述方法实施例所描述的流程或功能。上述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。上述计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输，例如，上述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线路((digital subscriber line，dsl))或无线(例如红外、无线、蓝牙、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。上述计算机可读存储介质可以是
计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。上述可用介质可以是磁性介质，(例如，软盘、硬盘、磁带)、光介质(例如，dvd)、或者半导体介质(例如固态硬盘(solid state disk，ssd))等。
[0252]
图3为本发明实施例三提供的一种电子设备的结构示意图。该电子设备可以为前述的终端设备或者服务器，也可以为与前述终端设备或者服务器连接的实现本发明实施例方法的终端设备或服务器。如图3所示，该电子设备可以包括：处理器301(例如cpu)、存储器302、收发器303；收发器303耦合至处理器301，处理器301控制收发器303的收发动作。存储器302中可以存储各种指令，以用于完成各种处理功能以及实现前述方法实施例描述的处理步骤。优选的，本发明实施例涉及的电子设备还包括：电源304、系统总线305以及通信端口306。系统总线305用于实现元件之间的通信连接。上述通信端口306用于电子设备与其他外设之间进行连接通信。
[0253]
在图3中提到的系统总线305可以是外设部件互连标准(peripheral component interconnect，pci)总线或扩展工业标准结构(extended industry standard architecture，eisa)总线等。该系统总线可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。通信接口用于实现数据库访问装置与其他设备(例如客户端、读写库和只读库)之间的通信。存储器可能包含随机存取存储器(random access memory，ram)，也可能还包括非易失性存储器(non-volatile memory)，例如至少一个磁盘存储器。
[0254]
上述的处理器可以是通用处理器，包括中央处理器cpu、网络处理器(network processor，np)、图形处理器(graphics processing unit，gpu)等；还可以是数字信号处理器dsp、专用集成电路asic、现场可编程门阵列fpga或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
[0255]
需要说明的是，本发明实施例还提供一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使得计算机执行上述实施例中提供的方法和处理过程。
[0256]
本发明实施例还提供一种运行指令的芯片，该芯片用于执行前述方法实施例描述的处理步骤。
[0257]
本发明实施例提供了一种模型训练的处理方法、装置、电子设备及计算机可读存储介质，在对lanegcn模型进行整体模型训练之前先基于高精地图训练数据集和损失函数l
map
对地图网络模块进行预训练，通过预训练使得地图网络模块达到充分训练效果；再在保持地图网络模块的网络参数不变的情况下基于损失函数l
mod
＝l
cls
+αl
reg
对lanegcn模型进行整体模型训练。通过本发明，降低了整体模型的训练难度，提高了地图网络模块的训练成熟度，提高了lanegcn模型的输出精度。
[0258]
专业人员应该还可以进一步意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。
[0259]
结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块，或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
[0260]
以上所述的具体实施方式，对本发明的目的、技术方案和有益效果进行了进一步详细说明，所应理解的是，以上所述仅为本发明的具体实施方式而已，并不用于限定本发明的保护范围，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：何润林钱祥隽
技术所有人：苏州轻棹科技有限公司
我是此专利的发明人

上一篇：一种分层的气体超声流量计测量流道的制作方法
上一篇：一种管柱攀爬巡检机器人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。