一种交互场景生成的方法、装置及电子设备与流程

文档序号:26940306发布日期:2021-10-12 15:44阅读:61来源:国知局
一种交互场景生成的方法、装置及电子设备与流程

1.本发明涉及数据生成技术领域,具体而言,涉及一种交互场景生成的方法、装置、电子设备及计算机可读存储介质。


背景技术:

2.无人驾驶(autonomous driving)作为一项被广泛认为可以推动人类社会经济巨大进步的技术,具有大幅降低交通拥堵,减少交通事故,提高出行效率,释放驾驶时间,节省停车空间,增加汽车利用率,促进共享经济,节约社会资源等诸多优势。
3.无人驾驶系统最为关键也最具挑战的技术之一就是如何在陌生的环境中有效地与周围的车辆进行互动。这主要是由于交互场景(scenarios)的高度多样性和复杂性,以及现实中无法搜集实验所有可能的交互场景。仿真虚拟测试(simulation virtual tests)便是模拟无人驾驶车辆与其它车辆互动的极为重要的平台。仿真虚拟测试允许我们在可控的环境下对同一交互场景实施改变,从而进行反复测试来迭代改进无人驾驶系统。而在现实中,无法做到针对系统的每一次改变来进行几千次的实际路测评估。
4.如何大规模生成真实有效的、丰富多样的车辆交互场景于是便成为仿真虚拟测试的核心技术之一。当前业界普遍采取的方法是:(1)根据人工先验的知识经验手动创制交互场景,例如绘制行人车辆的行为轨迹(way points);(2)从真实记录数据(log data)中人工选取具有代表性的交互场景,并在此基础上进行编辑,例如增加或者移除相关行人或者车辆。(3)自动生成大量有效多样的交互场景或者有效预测车辆行驶轨迹,例如利用卷积社会池化(convolutional social pooling),社会长短期记忆神经网络(social long short-term memory),以及社会生成对抗神经网络(social generative adversarial network)等生成或者预测行人或者车辆的运动轨迹。现有方法的不足在于依赖于人工绘制筛选的车辆互动场景无法进行大规模扩展,而现有自动生成的方法也无法生成适应于不同交通地图的、真实有效丰富多样的互动场景。


技术实现要素:

5.为解决现有存在的技术问题,本发明实施例提供一种交互场景生成的方法、装置、电子设备及计算机可读存储介质。
6.第一方面,本发明实施例提供了一种交互场景生成的方法,包括:
7.获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列,对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态;
8.根据所述编码隐式状态确定相应的隐式状态概率分布,并根据所述隐式状态概率分布采样确定初始隐式状态;
9.对所述初始隐式状态进行解码处理,确定所述目标对象的第一坐标序列概率分布和所述交互对象的第二坐标序列概率分布;根据所述第一坐标序列概率分布采样确定所述目标对象的新坐标序列,根据所述第二坐标序列概率分布采样确定所述交互对象的新坐标
序列。
10.第二方面,本发明实施例还提供了一种交互场景生成的装置,包括:
11.编码模块,用于获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列,对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态;
12.采样状态模块,用于根据所述编码隐式状态确定相应的隐式状态概率分布,并根据所述隐式状态概率分布采样确定初始隐式状态;
13.解码采样模块,用于对所述初始隐式状态进行解码处理,确定所述目标对象的第一坐标序列概率分布和所述交互对象的第二坐标序列概率分布;根据所述第一坐标序列概率分布采样确定所述目标对象的新坐标序列,根据所述第二坐标序列概率分布采样确定所述交互对象的新坐标序列。
14.第三方面,本发明实施例提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,所述计算机程序被所述处理器执行时实现上述任意一项所述的交互场景生成的方法中的步骤。
15.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的交互场景生成的方法中的步骤。
16.本发明实施例提供的交互场景生成的方法、装置、电子设备及计算机可读存储介质,基于从真实交互场景中提取的基础坐标序列编解码生成新坐标序列,使得新坐标序列具有高度真实性。通过对隐式状态概率分布随机采样确定初始隐式状态,以及在解码阶段通过对坐标序列概率分布随机采样获得目标对象和交互对象的坐标,基于双层次的随机采样使得该生成交互场景的方式具备多模态的特性,针对同一地图能够自动产生多种不同的交互场景;此外,该生成交互场景的方式提取对象的基础坐标序列作为输入,弱化了与地图本身相关的参数,使得该方式不受限于特定地图,即该方式也可以扩展到多种不同地图,从而可以合成多种地图中的多种不同交互场景。
附图说明
17.为了更清楚地说明本发明实施例或背景技术中的技术方案,下面将对本发明实施例或背景技术中所需要使用的附图进行说明。
18.图1示出了本发明实施例所提供的一种交互场景生成的方法的流程图;
19.图2示出了本发明实施例所提供的交互场景生成方法所采用的模型架构的整体结构示意图;
20.图3示出了本发明实施例所提供的交互场景生成方法所采用的模型架构按时序展开后的结构示意图;
21.图4示出了本发明实施例所提供的交互场景生成的装置的第一结构示意图;
22.图5示出了本发明实施例所提供的交互场景生成的装置的第二结构示意图;
23.图6示出了本发明实施例所提供的一种用于执行交互场景生成的方法的电子设备的结构示意图。
具体实施方式
24.在本发明实施例的描述中,所属技术领域的技术人员应当知道,本发明实施例可以实现为方法、装置、电子设备及计算机可读存储介质。因此,本发明实施例可以具体实现为以下形式:完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、硬件和软件结合的形式。此外,在一些实施例中,本发明实施例还可以实现为在一个或多个计算机可读存储介质中的计算机程序产品的形式,该计算机可读存储介质中包含计算机程序代码。
25.上述计算机可读存储介质可以采用一个或多个计算机可读存储介质的任意组合。计算机可读存储介质包括:电、磁、光、电磁、红外或半导体的系统、装置或器件,或者以上任意的组合。计算机可读存储介质更具体的例子包括:便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom)、闪存(flash memory)、光纤、光盘只读存储器(cd-rom)、光存储器件、磁存储器件或以上任意组合。在本发明实施例中,计算机可读存储介质可以是任意包含或存储程序的有形介质,该程序可以被指令执行系统、装置、器件使用或与其结合使用。
26.上述计算机可读存储介质包含的计算机程序代码可以用任意适当的介质传输,包括:无线、电线、光缆、射频(radio frequency,rf)或者以上任意合适的组合。
27.可以以汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、集成电路配置数据或以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言,例如:java、smalltalk、c++,还包括常规的过程式程序设计语言,例如:c语言或类似的程序设计语言。计算机程序代码可以完全的在用户计算机上执行、部分的在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行以及完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括:局域网(lan)或广域网(wan),可以连接到用户计算机,也可以连接到外部计算机。
28.本发明实施例通过流程图和/或方框图描述所提供的方法、装置、电子设备。
29.应当理解,流程图和/或方框图的每个方框以及流程图和/或方框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,从而生产出一种机器,这些计算机可读程序指令通过计算机或其他可编程数据处理装置执行,产生了实现流程图和/或方框图中的方框规定的功能/操作的装置。
30.也可以将这些计算机可读程序指令存储在能使得计算机或其他可编程数据处理装置以特定方式工作的计算机可读存储介质中。这样,存储在计算机可读存储介质中的指令就产生出一个包括实现流程图和/或方框图中的方框规定的功能/操作的指令装置产品。
31.也可以将计算机可读程序指令加载到计算机、其他可编程数据处理装置或其他设备上,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机或其他可编程数据处理装置上执行的指令能够提供实现流程图和/或方框图中的方框规定的功能/操作的过程。
32.下面结合本发明实施例中的附图对本发明实施例进行描述。
33.图1示出了本发明实施例所提供的一种交互场景生成的方法的流程图。如图1所
示,该方法包括:
34.步骤101:获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列,对第一基础坐标序列和第二基础坐标序列进行编码处理,生成编码隐式状态。
35.本发明实施例中,在交互场景中存在目标对象和与该目标对象进行交互的交互对象;具体的,在车辆交互场景中,该目标对象可以为无人驾驶汽车等,相应的交互对象即可以是与该无人驾驶汽车存在交互的车辆(例如并行车辆、对向来车等)或者行人等。同时,在交互场景中可以存在一个或多个目标对象,每个目标对象也可以存在一个或多个交互对象;当目标对象为无人驾驶汽车时,此时可以只考虑该无人驾驶汽车周围的对象,即交互场景中包含一个无人驾驶汽车以及一个或多个与该无人驾驶汽车交互的其他车辆。
36.传统生成交互场景的方法一般以交互场景的图像作为输入,本发明实施例中提取交互场景的本质,即交互场景中每个对象(包括目标对象和交互对象)在不同时刻的坐标数据所形成的坐标序列之间的交互,基于每个对象的坐标序列生成新的交互场景。
37.具体的,本发明实施例中根据目标对象在不同时刻的坐标数据确定该目标对象真实的坐标序列,即第一基础坐标序列,该第一基础坐标序列包含目标对象在不同时刻的多个第一坐标数据;同理,根据交互对象在不同时刻的坐标数据也可以相应确定该交互对象真实的坐标序列,即第二基础坐标序列,该第二基础坐标序列包含交互对象在不同时刻的多个第二坐标数据。在确定第一基础坐标序列和第二基础坐标序列之后,即可对该第一基础坐标序列和第二基础坐标序列进行编码处理,从而生成编码隐式状态。本实施例中可以预先训练好编码器(encoder),将该第一基础坐标序列和第二基础坐标序列输入至训练好的编码器即可进行编码,进而生成相应的编码隐式状态。
38.此外,第一基础坐标序列和第二基础坐标序列中所包含的坐标数据的数量相同,即第一坐标数据和第二坐标数据的数量相同。可选的,可以基于对象行动的轨迹来确定坐标序列。上述步骤101“获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列”包括:
39.步骤a1:获取目标对象在预设时间段内的第一轨迹,并获取交互对象在预设时间段内的第二轨迹。
40.步骤a2:以相同的采样方式对第一轨迹和第二轨迹分别进行采样处理,确定目标对象多个位置点的第一坐标数据和交互对象多个位置点的第二坐标数据,并根据多个第一坐标数据生成第一基础坐标序列,根据多个第二坐标数据生成第二基础坐标序列。
41.本发明实施例中,真实交互场景中的对象在一个时间段内均会形成相应的轨迹,基于同一个预设时间段内目标对象和交互对象的轨迹即可提取出其中的坐标数据,进而生成坐标序列。具体的,可以按照时间顺序从每个轨迹中均匀采样(sample)m个坐标数据,即从第一轨迹中采样m个第一坐标数据,并形成第一基础坐标序列,从第而轨迹中采样m个第二坐标数据,并形成第二基础坐标序列。可选的,若目标对象的轨迹和交互对象的轨迹所对应的时间段不同,则可以对两个轨迹的时间进行归一化处理,将两个轨迹归一化为具有相同时间长度的轨迹,之后再提取坐标数据。例如,可以将目标对象和交互对象的轨迹均归一化为t秒,且每秒均匀采样s个点,共可以采样t
×
s个点,即每个轨迹可以采样t
×
s个坐标数据。
42.步骤102:根据编码隐式状态确定相应的隐式状态概率分布,并根据隐式状态概率
分布,采样确定初始隐式状态。
43.本发明实施例中,该隐式状态概率分布可以为预设形式的概率分布,例如正态分布、均匀分布等,基于编码隐式状态可以确定隐式状态概率分布的参数,该参数例如是正态分布的均值和标准偏差等。通过从该隐式状态概率分布中采样的方式可以随机得到隐式状态,即初始隐式状态,且随机得到的该初始隐式状态也符合编码隐式状态的概率分布。本实施例中,可以基于变分自动编码器(variational auto-encoder,vae)中的设计原理确定初始隐式状态。可选的,上述步骤“根据编码隐式状态确定相应的隐式状态概率分布”包括:
44.将编码隐式状态映射为预设维度的均值向量μ和预设维度的标准偏差向量σ,确定多元正态分布n(μ,σ),并基于kl散度约束多元正态分布n(μ,σ)与标准多元正态分布n(0,i)之间的距离;其中,i表示预设维度的单位矩阵。
45.本发明实施例中,可以基于预先训练好的多层感知机(multilayer perception,mlp),将该编码隐式状态映射为均值向量μ和标准偏差向量σ,且该均值向量μ和标准偏差向量σ均是预设维度的,进而基于预设维度的均值向量μ和标准偏差向量σ即可表示真实交互场景的多元正态分布(multivariate normal distribution)n(μ,σ);同时,基于kl散度来约束多元正态分布n(μ,σ)与标准多元正态分布n(0,i)之间的距离,从而可以保证隐式状态取值空间的平滑性。其中,该标准多元正态分布n(0,i)中的i表示预设维度的单位矩阵。例如,均值向量μ和标准偏差向量σ的预设维度为n
z
,则i为n
z
×
n
z
的单位矩阵。该预设维度的具体数值可以基于经验确定,或者基于统计的方式确定,本实施例对此不做限定。
46.同时,上述步骤“根据隐式状态概率分布,采样确定初始隐式状态”包括:根据隐式状态概率分布进行随机采样,并采样得到隐式随机向量z;将隐式随机向量z映射为用于解码的初始隐式状态h0。
47.本发明实施例中,基于隐式状态概率分布n(μ,σ)进行随机采样,从而可以采样得到相应的隐式随机向量z;同时,可以预先训练另一个多层感知机,将该隐式随机向量z映射为用于解码的初始隐式状态h0。
48.步骤103:对初始隐式状态进行解码处理,确定目标对象的第一坐标序列概率分布和交互对象的第二坐标序列概率分布;根据第一坐标序列概率分布,采样确定目标对象的新坐标序列,并根据第二坐标序列概率分布,采样确定交互对象的新坐标序列。
49.本发明实施例中,基于初始隐式状态并不直接确定对象的坐标,而是以解码处理的方式确定目标对象和交互对象的坐标序列概率分布,即第一坐标序列概率分布和第二坐标序列概率分布,进而通过采样的方式得到目标对象和交互对象的新坐标序列。两个新坐标序列可以分别表示目标对象和交互对象的新的行动轨迹,从而能够生成新的交互场景。与上述基于编码器进行编码的过程类似,本实施例中可以预先训练好解码器(decoder),将该初始隐式状态输入至该解码器即可生成目标对象的第一坐标序列概率分布和交互对象的第二坐标序列概率分布,之后通过采样即可确定目标对象的新坐标序列和交互对象的新坐标序列。
50.具体的,该交互场景生成方法所采用的模型架构可参见图2所示。将从真实交互场景中提取出的基础坐标序列(包括第一基础坐标序列和第二基础坐标序列)输入至编码器中,编码器输出编码隐式状态h;之后基于该编码隐式状态h的隐式状态概率分布随机采样得到初始隐式状态h0,并将该初始隐式状态h0输入至解码器进行解码处理,确定目标对象和
交互对象的坐标序列概率分布,之后继续通过随机采样的方式确定新坐标序列(包括目标对象的新坐标序列和交互对象的新坐标序列)。
51.本发明实施例提供的一种交互场景生成的方法,基于从真实交互场景中提取的基础坐标序列编解码生成新坐标序列,使得新坐标序列具有高度真实性。通过对隐式状态概率分布随机采样确定初始隐式状态,以及在解码阶段通过对坐标序列概率分布随机采样获得目标对象和交互对象的坐标,基于双层次的随机采样使得该生成交互场景的方式具备多模态(multi-modal)的特性,针对同一地图能够自动产生多种不同的交互场景;此外,该生成交互场景的方式提取对象的基础坐标序列作为输入,弱化了与地图本身相关的参数,使得该方式不受限于特定地图,即该方式也可以扩展到多种不同地图,从而可以合成多种地图中的多种不同交互场景。
52.在上述实施例的基础上,由于坐标序列为一个序列,该编码器具体可以是单层或多层的循环神经网络(recurrent neural network,rnn),即基于循环神经网络实现序列编码。本发明实施例中,上述步骤101“对第一基础坐标序列和第二基础坐标序列进行编码处理,生成编码隐式状态”包括:
53.步骤b1:确定第一基础坐标序列所包含的多个第一坐标数据,并确定第二基础坐标序列所包含的多个第二坐标数据,第一坐标数据的数量与第二坐标数据的数量相同。
54.步骤b2:根据相同时序的第一坐标数据和第二坐标数据分别生成多个组坐标数据,并将多个组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据循环神经网络的输出生成编码隐式状态。
55.本发明实施例中,如上所述,两个基础坐标序列包含相同数量的坐标数据,即第一坐标数据的数量与第二坐标数据的数量相同;在进行编码处理时,将具有相同时序的第一坐标数据和第二坐标数据拼接形成一个组坐标数据,并按照时序将该组坐标数据依次输入至循环神经网络中进行编码。例如,第一基础坐标序列包含按照时间顺序排列的3个第一坐标数据s1、s2、s3,第二基础坐标序列包含按照时间顺序排列的3个第二坐标数据a1、a2、a3,则可以将s1和a1作为一个组坐标数据,s2和a2作为一个组坐标数据,s3和a3作为一个组坐标数据。在车辆交互场景中,坐标数据可以为二维的坐标。
56.可选的,编码时所用的循环神经网络具体可以为双向循环神经网络(bi-directional recurrent neural network)。本实施例中,编码时所用的循环神经网路包括前向循环神经网络(forward recurrent neural network,forward rnn)和后向循环神经网络(backward recurrent neural network,backward rnn);上述步骤b2“将多个组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据循环神经网络的输出生成编码隐式状态”包括:
57.步骤b21:按照正向的时间顺序将多个组坐标数据依次作为前向循环神经网络的输入,并根据前向循环神经网络的输出生成前向隐式状态。
58.本发明实施例中,组坐标数据是按照时间顺序生成的,故该组坐标数据也具有时间顺序这一属性,本实施例中按照正向的时间顺序将组坐标数据依次作为前向循环神经网络的输入,最终可以得到相应的输出结果,即前向隐式状态。参见图3所示,图3示出了模型架构按照时序展开后的结构示意图;第一基础坐标序列包含m个第一坐标数据,第二基础坐标序列包含m个第二坐标数据,相应可以生成m个组坐标数据,按照时间顺序排列依次为d1,
d2,...,d
m
,即将组坐标数据d1,d2,...,d
m
依次作为前向循环神经网络每一步(step)的输入,最终输出前向隐式状态h


59.步骤b22:按照反向的时间顺序将多个组坐标数据依次作为后向循环神经网络的输入,并根据后向循环神经网络的输出生成后向隐式状态。
60.本实施例中,“反向的时间顺序”为倒转时间后的顺序,其与“正向的时间顺序”相反。m个组坐标数据按照正向的时间顺序排列依次为d1,d2,...,d
m
,则其按照反向的时间顺序排列依次为d
m
,d
m-1
,...,d1。参见图3所示,将组坐标数据d
m
,d
m-1
,...,d1依次作为后向循环神经网络每一步(step)的输入,最终输出后向隐式状态h

。图3中,d
i
表示按照正向的时间顺序排列的第i个组坐标数据。
61.步骤b23:根据前向隐式状态和后向隐式状态拼接生成编码隐式状态。
62.本发明实施例中,结合前向隐式状态h

和后向隐式状态h

即可最终生成编码隐式状态;本实施例中采用拼接的方式将前向隐式状态h

和后向隐式状态h

拼接为编码隐式状态。例如,前向隐式状态h

和后向隐式状态h

均为128维的向量,则拼接后生成的编码隐式状态为256维的向量。本实施例中基于前向循环神经网络和后向循环神经网络依次进行解码,能够更加准确快速地提取坐标数据的特征,提高生成的新坐标数据的真实有效性。
63.在确定编码隐式状态之后,即可将该编码隐式状态映射为均值向量μ和标准偏差向量σ,进而采样得到初始隐式状态。如图3所示,编码隐式状态输入至第一个多层感知机mlp1,通过该多层感知机mlp1将编码隐式状态映射为两个预设维度的向量,即均值向量μ和标准偏差向量σ;该均值向量μ和标准偏差向量σ可以表示多元正态分布n(μ,σ),之后根据该多元正态分布n(μ,σ)随机采样以获取隐式随机向量z,并通过第二个多层感知机mlp2将隐式随机向量z映射为用于序列解码的初始隐式状态h0。
64.在上述实施例的基础上,进行解码处理的解码器也可以为单层或多层的循环神经网络,基于循环神经网络实现序列解码。本发明实施例中,该解码器为单向循环神经网络(unidirectional recurrent neural network,unidirectional rnn),且在解码过程的第i步中,基于第i-1步生成的新坐标数据和隐式随机向量z进行解码。具体的,上述步骤103“对初始隐式状态进行解码处理,确定目标对象的第一坐标序列概率分布和交互对象的第二坐标序列概率分布;根据第一坐标序列概率分布,采样确定目标对象的新坐标序列,并根据第二坐标序列概率分布,采样确定交互对象的新坐标序列”包括:
65.步骤c1:根据隐式随机向量z和第i-1步新坐标数据对第i-1步隐式状态进行解码处理,确定第i步隐式状态和第i步坐标数据概率分布;其中,第i-1步新坐标数据包括目标对象的第i-1步新坐标数据和交互对象的第i-1步新坐标数据,第i步坐标数据概率分布包括第i步第一坐标数据概率分布和第i步第二坐标数据概率分布;第i-1步新坐标数据的初始值包括预设的目标对象的初始坐标数据和交互对象的初始坐标数据,第i-1步隐式状态的初始值为初始隐式状态h0。
66.步骤c2:根据第i步第一坐标数据概率分布采样确定目标对象的第i步第一新坐标数据,根据第i步第二坐标数据概率分布采样确定交互对象的第i步第二新坐标数据。
67.本发明实施例中,对于每一步的解码过程,需要基于上一步得到的新坐标数据和隐式随机向量z最上一步的隐式状态进行解码。具体的,参见图3所示,在第i步的解码过程中,可以提前获取到第i-1步新坐标数据d
i-1
和第i-1步隐式状态h
i-1
,并基于隐式随机向量z
和第i-1步新坐标数据d
i-1
对第i-1步隐式状态h
i-1
进行解码处理,从而可以生成第i步隐式状态h
i
和第i步坐标数据概率分布p
i
;其中,该第i步坐标数据概率分布p
i
包括目标对象的第i步第一坐标数据概率分布和交互对象的第i步第二坐标数据概率分布之后,根据第i步第一坐标数据概率分布采样确定目标对象的第i步第一新坐标数据根据第i步第二坐标数据概率分布采样确定交互对象的第i步第二新坐标数据第i步第一新坐标数据和第i步第二新坐标数据即为第i步新坐标数据d
i

68.此外,对于第1步解码的过程,第0步新坐标数据为预设的初始坐标数据d0,第0步隐式状态为初始隐式状态h0。具体的,首先预设初始坐标数据d0,该初始坐标数据d0包括目标对象的初始坐标数据和交互对象的初始坐标数据;具体的,该初始坐标数据d0可以为真是交互场景中两个对象的初始坐标数据,即第一基础坐标序列和第二基础坐标序列中的第一个坐标数据;或者,该初始坐标数据d0也可以是人为设置的坐标点,或采用其他方式自动生成的坐标数据,本实施例对此不做限定。参见图3所示,在第1步解码过程中,根据隐式随机向量z和预设的初始坐标数据d0对初始隐式状态h0进行解码处理,从而可以确定第1步隐式状态h1和第1步坐标数据概率分布p1;其中,该第1步坐标数据概率分布p1包括目标对象的第1步第一坐标数据概率分布和交互对象的第1步第二坐标数据概率分布之后,根据第1步第一坐标数据概率分布采样确定目标对象的第1步第一新坐标数据根据第1步第二坐标数据概率分布采样确定交互对象的第1步第二新坐标数据第1步第一新坐标数据和第1步第二新坐标数据即为第1步新坐标数据d1。
69.步骤c3:对i进行加一处理,重复上述每一步确定第一新坐标数据和第二新坐标数据的过程,直至解码结束。
70.步骤c4:根据所有的第一新坐标数据生成目标对象的新坐标序列,并根据所有的第二新坐标数据生成交互对象的新坐标序列。
71.本发明实施例中,在每一步的解码过程中均执行上述步骤c1和步骤c2,直至解码过程结束;如图3所示,直至第n步解码过程结束。本实施例中通过解码处理可以依次确定每一步的新坐标数据,即d1,d2,...,d
i
,...,d
n
;相应的,可以确定目标对象每一步的新坐标数据,即第一新坐标数据从而生成目标对象的新坐标序列;同样的,可以确定交互对象的第二新坐标数据并生成交互对象的新坐标序列。其中,原始坐标数据的个数与该新坐标数据的个数可以是相同的,即图3中的m=n。本实施中基于隐式随机向量z和上一步的新坐标数据对隐式状态进行解码处理,能够强化解码过程中每一步对于隐式随机向量z的使用,进而使得合成的新坐标数据更好表现出隐式随机向量z所对应的对象在交互时的特征;例如在车辆交互场景中,可以更好地突出隐式随机向量z所对应的自动驾驶车辆和交互车辆交互时的特性。
72.可选的,本实施例中以高斯混合模型(gaussian mixture model,gmm)表示坐标数据概率分布。上述步骤c1中确定第i步坐标数据概率分布的过程具体包括:
73.确定第i步第一坐标数据概率分布的参数和第i步第二坐标数据概率分布的参数且第i步第一坐标数据概率分布和第i步第二坐标数据
概率分布分别为:
[0074][0075][0076]
其中,x
s
,y
s
表示第一坐标数据的坐标值,x
a
,y
a
表示第二坐标数据的坐标值,函数n()表示高斯分布密度函数;分别为目标对象在第i步第一坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,分别为交互对象在第i步第二坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,且
[0077]
本发明实施例中,以高斯混合模型描述目标对象和交互对象的坐标数据概率分布知具体的,本发明实施例中的解码器解码生成相应高斯混合模型的参数,即和两组参数分别表示目标对象和交互对象的坐标数据概率分布,即基于两组参数即可分别确定每一步的第一坐标数据概率分布和第二坐标数据概率分布。本发明实施例中,在对编码器、解码器等形成的整体模型进行训练的过程中,可以将样本中提取出的坐标序列作为输入,将相应的高斯混合模型的参数作为输出进行训练;其中,具体可以基于大量真实交互场景的相关数据进行训练,使得自动生成的新坐标数据具有高度真实性。
[0078]
本发明实施例提供的一种交互场景生成的方法,基于从真实交互场景中提取的基础坐标序列编解码生成新坐标序列,使得新坐标序列具有高度真实性。通过对隐式状态概率分布随机采样确定初始隐式状态,以及在解码阶段通过对坐标序列概率分布随机采样获得目标对象和交互对象的坐标,基于双层次的随机采样使得该生成交互场景的方式具备多模态的特性,针对同一地图能够自动产生多种不同的交互场景;此外,该生成交互场景的方式提取对象的基础坐标序列作为输入,弱化了与地图本身相关的参数,使得该方式不受限于特定地图,即该方式也可以扩展到多种不同地图,从而可以合成多种地图中的多种不同交互场景。基于前向循环神经网络和后向循环神经网络依次进行解码,能够更加准确快速地提取坐标数据的特征,提高生成的新坐标数据的真实有效性。基于隐式随机向量z和上一步的新坐标数据对隐式状态进行解码处理,能够强化解码过程中每一步对于隐式随机向量z的使用,进而使得合成的新坐标数据更好表现出隐式随机向量z所对应的对象在交互时的特征。
[0079]
上文结合图1至图3,详细描述了本发明实施例提供的交互场景生成的方法,该方法也可以通过相应的装置实现,下面将结合图4和图5,详细描述本发明实施例提供的交互场景生成的装置。
[0080]
图4示出了本发明实施例所提供的一种交互场景生成的装置的结构示意图。如图4所示,该交互场景生成的装置包括:
[0081]
编码模块41,用于获取目标对象的第一基础坐标序列和交互对象的第二基础坐标
序列,对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态;
[0082]
采样状态模块42,用于根据所述编码隐式状态确定相应的隐式状态概率分布,并根据所述隐式状态概率分布采样确定初始隐式状态;
[0083]
解码采样模块43,用于对所述初始隐式状态进行解码处理,确定所述目标对象的第一坐标序列概率分布和所述交互对象的第二坐标序列概率分布;根据所述第一坐标序列概率分布采样确定所述目标对象的新坐标序列,根据所述第二坐标序列概率分布采样确定所述交互对象的新坐标序列。
[0084]
本发明实施例提供的交互场景生成的装置,基于从真实交互场景中提取的基础坐标序列编解码生成新坐标序列,使得新坐标序列具有高度真实性。通过对隐式状态概率分布随机采样确定初始隐式状态,以及在解码阶段通过对坐标序列概率分布随机采样获得目标对象和交互对象的坐标,基于双层次的随机采样使得该生成交互场景的方式具备多模态的特性,针对同一地图能够自动产生多种不同的交互场景;此外,该生成交互场景的方式提取对象的基础坐标序列作为输入,弱化了与地图本身相关的参数,使得该方式不受限于特定地图,即该方式也可以扩展到多种不同地图,从而可以合成多种地图中的多种不同交互场景。
[0085]
在上述实施例的基础上,所述编码模块41对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态,包括:
[0086]
确定所述第一基础坐标序列所包含的多个第一坐标数据,并确定所述第二基础坐标序列所包含的多个第二坐标数据,所述第一坐标数据的数量与所述第二坐标数据的数量相同;
[0087]
根据相同时序的所述第一坐标数据和所述第二坐标数据分别生成多个组坐标数据,并将多个所述组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据所述循环神经网络的输出生成编码隐式状态。
[0088]
在上述实施例的基础上,所述循环神经网络包括前向循环神经网络和后向循环神经网络;所述编码模块41将多个所述组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据所述循环神经网络的输出生成编码隐式状态,包括:
[0089]
按照正向的时间顺序将多个所述组坐标数据依次作为所述前向循环神经网络的输入,并根据所述前向循环神经网络的输出生成前向隐式状态;
[0090]
按照反向的时间顺序将多个所述组坐标数据依次作为所述后向循环神经网络的输入,并根据所述后向循环神经网络的输出生成后向隐式状态;
[0091]
根据所述前向隐式状态和所述后向隐式状态拼接生成所述编码隐式状态。
[0092]
在上述实施例的基础上,所述编码模块41获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列包括:
[0093]
获取目标对象在预设时间段内的第一轨迹,并获取交互对象在所述预设时间段内的第二轨迹;
[0094]
以相同的采样方式对所述第一轨迹和所述第二轨迹分别进行采样处理,确定所述目标对象多个位置点的第一坐标数据和所述交互对象多个位置点的第二坐标数据,并根据多个所述第一坐标数据生成第一基础坐标序列,根据多个所述第二坐标数据生成第二基础
坐标序列。
[0095]
在上述实施例的基础上,所述采样状态模块根据所述编码隐式状态确定相应的隐式状态概率分布包括:
[0096]
将所述编码隐式状态映射为预设维度的均值向量μ和预设维度的标准偏差向量σ,确定多元正态分布n(μ,σ),并基于kl散度约束所述多元正态分布n(μ,σ)与标准多元正态分布n(0,i)之间的距离;其中,i表示预设维度的单位矩阵。
[0097]
在上述实施例的基础上,所述采样状态模块42根据所述隐式状态概率分布采样确定初始隐式状态包括:
[0098]
根据所述隐式状态概率分布进行随机采样,并采样得到隐式随机向量z;将所述隐式随机向量z映射为用于解码的初始隐式状态h0。
[0099]
在上述实施例的基础上,参见图5所示,所述解码采样模块43包括:
[0100]
解码单元431,用于根据所述隐式随机向量z和第i-1步新坐标数据对第i-1步隐式状态进行解码处理,确定第i步隐式状态和第i步坐标数据概率分布;其中,所述第i-1步新坐标数据包括目标对象的第i-1步新坐标数据和所述交互对象的第i-1步新坐标数据,所述第i步坐标数据概率分布包括第i步第一坐标数据概率分布和第i步第二坐标数据概率分布;所述第i-1步新坐标数据的初始值包括预设的所述目标对象的初始坐标数据和所述交互对象的初始坐标数据,所述第i-1步隐式状态的初始值为所述初始隐式状态h0;
[0101]
采样单元432,用于根据所述第i步第一坐标数据概率分布采样确定所述目标对象的第i步第一新坐标数据,根据所述第i步第二坐标数据概率分布采样确定所述交互对象的第i步第二新坐标数据;
[0102]
序列生成单元433,用于对i进行加一处理,重复上述每一步确定第一新坐标数据和第二新坐标数据的过程,直至解码结束;根据所有的所述第一新坐标数据生成所述目标对象的新坐标序列,并根据所有的所述第二新坐标数据生成所述交互对象的新坐标序列。
[0103]
在上述实施例的基础上,解码单元431确定第i步坐标数据概率分布包括:
[0104]
确定第i步第一坐标数据概率分布的参数和第i步第二坐标数据概率分布的参数且所述第i步第一坐标数据概率分布和所述第i步第二坐标数据概率分布分别为:
[0105][0106][0107]
其中,x
s
,y
s
表示第一坐标数据的坐标值,x
a
,y
a
表示第二坐标数据的坐标值,函数n()表示高斯分布密度函数;分别为所述目标对象在第i步第一坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,分别为所述交互对象在第i步第二坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,且
[0108]
本发明实施例提供的一种交互场景生成的装置,基于从真实交互场景中提取的基础坐标序列编解码生成新坐标序列,使得新坐标序列具有高度真实性。通过对隐式状态概率分布随机采样确定初始隐式状态,以及在解码阶段通过对坐标序列概率分布随机采样获得目标对象和交互对象的坐标,基于双层次的随机采样使得该生成交互场景的方式具备多模态的特性,针对同一地图能够自动产生多种不同的交互场景;此外,该生成交互场景的方式提取对象的基础坐标序列作为输入,弱化了与地图本身相关的参数,使得该方式不受限于特定地图,即该方式也可以扩展到多种不同地图,从而可以合成多种地图中的多种不同交互场景。基于前向循环神经网络和后向循环神经网络依次进行解码,能够更加准确快速地提取坐标数据的特征,提高生成的新坐标数据的真实有效性。基于隐式随机向量z和上一步的新坐标数据对隐式状态进行解码处理,能够强化解码过程中每一步对于隐式随机向量z的使用,进而使得合成的新坐标数据更好表现出隐式随机向量z所对应的对象在交互时的特征。
[0109]
此外,本发明实施例还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该收发器、该存储器和处理器分别通过总线相连,计算机程序被处理器执行时实现上述交互场景生成的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0110]
具体的,参见图6所示,本发明实施例还提供了一种电子设备,该电子设备包括总线1110、处理器1120、收发器1130、总线接口1140、存储器1150和用户接口1160。
[0111]
在本发明实施例中,该电子设备还包括:存储在存储器1150上并可在处理器1120上运行的计算机程序,计算机程序被处理器1120执行时实现以下步骤:
[0112]
获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列,对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态;
[0113]
根据所述编码隐式状态确定相应的隐式状态概率分布,并根据所述隐式状态概率分布采样确定初始隐式状态;
[0114]
对所述初始隐式状态进行解码处理,确定所述目标对象的第一坐标序列概率分布和所述交互对象的第二坐标序列概率分布;根据所述第一坐标序列概率分布采样确定所述目标对象的新坐标序列,根据所述第二坐标序列概率分布采样确定所述交互对象的新坐标序列。
[0115]
可选地,计算机程序被处理器1120执行“对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态”步骤时,使得处理器具体实现以下步骤:
[0116]
确定所述第一基础坐标序列所包含的多个第一坐标数据,并确定所述第二基础坐标序列所包含的多个第二坐标数据,所述第一坐标数据的数量与所述第二坐标数据的数量相同;
[0117]
根据相同时序的所述第一坐标数据和所述第二坐标数据分别生成多个组坐标数据,并将多个所述组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据所述循环神经网络的输出生成编码隐式状态。
[0118]
可选地,计算机程序被处理器1120执行“将多个所述组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据所述循环神经网络的输出生成编码隐式状态”步骤时,使得处理器具体实现以下步骤:
[0119]
按照正向的时间顺序将多个所述组坐标数据依次作为所述前向循环神经网络的输入,并根据所述前向循环神经网络的输出生成前向隐式状态;
[0120]
按照反向的时间顺序将多个所述组坐标数据依次作为所述后向循环神经网络的输入,并根据所述后向循环神经网络的输出生成后向隐式状态;
[0121]
根据所述前向隐式状态和所述后向隐式状态拼接生成所述编码隐式状态。
[0122]
可选地,计算机程序被处理器1120执行“获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列”步骤时,使得处理器具体实现以下步骤:
[0123]
获取目标对象在预设时间段内的第一轨迹,并获取交互对象在所述预设时间段内的第二轨迹;
[0124]
以相同的采样方式对所述第一轨迹和所述第二轨迹分别进行采样处理,确定所述目标对象多个位置点的第一坐标数据和所述交互对象多个位置点的第二坐标数据,并根据多个所述第一坐标数据生成第一基础坐标序列,根据多个所述第二坐标数据生成第二基础坐标序列。
[0125]
可选地,计算机程序被处理器1120执行“根据所述编码隐式状态确定相应的隐式状态概率分布”步骤时,使得处理器具体实现以下步骤:
[0126]
将所述编码隐式状态映射为预设维度的均值向量μ和预设维度的标准偏差向量σ,确定多元正态分布n(μ,σ),并基于kl散度约束所述多元正态分布n(μ,σ)与标准多元正态分布n(0,i)之间的距离;其中,i表示预设维度的单位矩阵。
[0127]
可选地,计算机程序被处理器1120执行“根据所述隐式状态概率分布采样确定初始隐式状态”步骤时,使得处理器具体实现以下步骤:
[0128]
根据所述隐式状态概率分布进行随机采样,并采样得到隐式随机向量z;将所述隐式随机向量z映射为用于解码的初始隐式状态h0。
[0129]
可选地,计算机程序被处理器1120执行“对所述初始隐式状态进行解码处理,确定所述目标对象的第一坐标序列概率分布和所述交互对象的第二坐标序列概率分布;根据所述第一坐标序列概率分布采样确定所述目标对象的新坐标序列,根据所述第二坐标序列概率分布采样确定所述交互对象的新坐标序列”步骤时,使得处理器具体实现以下步骤:
[0130]
根据所述隐式随机向量z和第i-1步新坐标数据对第i-1步隐式状态进行解码处理,确定第i步隐式状态和第i步坐标数据概率分布;其中,所述第i-1步新坐标数据包括目标对象的第i-1步新坐标数据和所述交互对象的第i-1步新坐标数据,所述第i步坐标数据概率分布包括第i步第一坐标数据概率分布和第i步第二坐标数据概率分布;所述第i-1步新坐标数据的初始值包括预设的所述目标对象的初始坐标数据和所述交互对象的初始坐标数据,所述第i-1步隐式状态的初始值为所述初始隐式状态h0;
[0131]
根据所述第i步第一坐标数据概率分布采样确定所述目标对象的第i步第一新坐标数据,根据所述第i步第二坐标数据概率分布采样确定所述交互对象的第i步第二新坐标数据;
[0132]
对i进行加一处理,重复上述每一步确定第一新坐标数据和第二新坐标数据的过程,直至解码结束;
[0133]
根据所有的所述第一新坐标数据生成所述目标对象的新坐标序列,并根据所有的所述第二新坐标数据生成所述交互对象的新坐标序列。
[0134]
可选地,计算机程序被处理器1120执行“确定第i步坐标数据概率分布”步骤时,使得处理器具体实现以下步骤:
[0135]
确定第i步第一坐标数据概率分布的参数和第i步第二坐标数据概率分布的参数且所述第i步第一坐标数据概率分布和所述第i步第二坐标数据概率分布分别为:
[0136][0137][0138]
其中,x
s
,y
s
表示第一坐标数据的坐标值,x
a
,y
a
表示第二坐标数据的坐标值,函数n()表示高斯分布密度函数;分别为所述目标对象在第i步第一坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,分别为所述交互对象在第i步第二坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,且
[0139]
收发器1130,用于在处理器1120的控制下接收和发送数据。
[0140]
本发明实施例中,总线架构(用总线1110来代表),总线1110可以包括任意数量互联的总线和桥,总线1110将包括由处理器1120代表的一个或多个处理器与存储器1150代表的存储器的各种电路连接在一起。
[0141]
总线1110表示若干类型的总线结构中的任何一种总线结构中的一个或多个,包括存储器总线以及存储器控制器、外围总线、加速图形端口(accelerate graphical port,agp)、处理器或使用各种总线体系结构中的任意总线结构的局域总线。作为示例而非限制,这样的体系结构包括:工业标准体系结构(industry standard architecture,isa)总线、微通道体系结构(micro channel architecture,mca)总线、扩展isa(enhanced isa,eisa)总线、视频电子标准协会(video electronics standards association,vesa)、外围部件互连(peripheral component interconnect,pci)总线。
[0142]
处理器1120可以是一种集成电路芯片,具有信号处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中硬件的集成逻辑电路或软件形式的指令完成。上述的处理器包括:通用处理器、中央处理器(central processing unit,cpu)、网络处理器(networkprocessor,np)、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field programmable gate array,fpga)、复杂可编程逻辑器件(complex programmable logic device,cpld)、可编程逻辑阵列(programmable logic array,pla)、微控制单元(microcontroller unit,mcu)或其他可编程逻辑器件、分立门、晶体管逻辑器件、分立硬件组件。可以实现或执行本发明实施例中公开的各方法、步骤及逻辑框图。例如,处理器可以是单核处理器或多核处理器,处理器可以集成于单颗芯片或位于多颗不同的芯片。
[0143]
处理器1120可以是微处理器或任何常规的处理器。结合本发明实施例所公开的方
法步骤可以直接由硬件译码处理器执行完成,或者由译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存取存储器(random access memory,ram)、闪存(flash memory)、只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasableprom,eprom)、寄存器等本领域公知的可读存储介质中。所述可读存储介质位于存储器中,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0144]
总线1110还可以将,例如外围设备、稳压器或功率管理电路等各种其他电路连接在一起,总线接口1140在总线1110和收发器1130之间提供接口,这些都是本领域所公知的。因此,本发明实施例不再对其进行进一步描述。
[0145]
收发器1130可以是一个元件,也可以是多个元件,例如多个接收器和发送器,提供用于在传输介质上与各种其他装置通信的单元。例如:收发器1130从其他设备接收外部数据,收发器1130用于将处理器1120处理后的数据发送给其他设备。取决于计算机系统的性质,还可以提供用户接口1160,例如:触摸屏、物理键盘、显示器、鼠标、扬声器、麦克风、轨迹球、操纵杆、触控笔。
[0146]
应理解,在本发明实施例中,存储器1150可进一步包括相对于处理器1120远程设置的存储器,这些远程设置的存储器可以通过网络连接至服务器。上述网络的一个或多个部分可以是自组织网络(ad hocnetwork)、内联网(intranet)、外联网(extranet)、虚拟专用网(vpn)、局域网(lan)、无线局域网(wlan)、广域网(wan)、无线广域网(wwan)、城域网(man)、互联网(internet)、公共交换电话网(pstn)、普通老式电话业务网(pots)、蜂窝电话网、无线网络、无线保真(wi-fi)网络以及两个或更多个上述网络的组合。例如,蜂窝电话网和无线网络可以是全球移动通信(gsm)系统、码分多址(cdma)系统、全球微波互联接入(wimax)系统、通用分组无线业务(gprs)系统、宽带码分多址(wcdma)系统、长期演进(lte)系统、lte频分双工(fdd)系统、lte时分双工(tdd)系统、先进长期演进(lte-a)系统、通用移动通信(umts)系统、增强移动宽带(enhance mobilebroadband,embb)系统、海量机器类通信(massive machine type ofcommunication,mmtc)系统、超可靠低时延通信(u1tra reliable lowlatency communications,urllc)系统等。
[0147]
应理解,本发明实施例中的存储器1150可以是易失性存储器或非易失性存储器,或可包括易失性存储器和非易失性存储器两者。其中,非易失性存储器包括:只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存(flash memory)。
[0148]
易失性存储器包括:随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如:静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddrsdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,drram)。本发明实施例描述的电子设备的存储器1150包括但不限于上述和任意其他适合类型的存储器。
[0149]
在本发明实施例中,存储器1150存储了操作系统1151和应用程序1152的如下元素:可执行模块、数据结构,或者其子集,或者其扩展集。
[0150]
具体而言,操作系统1151包含各种系统程序,例如:框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序1152包含各种应用程序,例如:媒体播放器(media player)、浏览器(browser),用于实现各种应用业务。实现本发明实施例方法的程序可以包含在应用程序1152中。应用程序1152包括:小程序、对象、组件、逻辑、数据结构以及其他执行特定任务或实现特定抽象数据类型的计算机系统可执行指令。
[0151]
此外,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述交互场景生成的方法实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
[0152]
具体而言,计算机程序被处理器执行时可实现以下步骤:
[0153]
获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列,对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态;
[0154]
根据所述编码隐式状态确定相应的隐式状态概率分布,并根据所述隐式状态概率分布采样确定初始隐式状态;
[0155]
对所述初始隐式状态进行解码处理,确定所述目标对象的第一坐标序列概率分布和所述交互对象的第二坐标序列概率分布;根据所述第一坐标序列概率分布采样确定所述目标对象的新坐标序列,根据所述第二坐标序列概率分布采样确定所述交互对象的新坐标序列。
[0156]
可选地,计算机程序被处理器1120执行“对所述第一基础坐标序列和所述第二基础坐标序列进行编码处理,生成编码隐式状态”步骤时,使得处理器具体实现以下步骤:
[0157]
确定所述第一基础坐标序列所包含的多个第一坐标数据,并确定所述第二基础坐标序列所包含的多个第二坐标数据,所述第一坐标数据的数量与所述第二坐标数据的数量相同;
[0158]
根据相同时序的所述第一坐标数据和所述第二坐标数据分别生成多个组坐标数据,并将多个所述组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据所述循环神经网络的输出生成编码隐式状态。
[0159]
可选地,计算机程序被处理器1120执行“将多个所述组坐标数据依次作为训练好的循环神经网络的输入进行编码处理,根据所述循环神经网络的输出生成编码隐式状态”步骤时,使得处理器具体实现以下步骤:
[0160]
按照正向的时间顺序将多个所述组坐标数据依次作为所述前向循环神经网络的输入,并根据所述前向循环神经网络的输出生成前向隐式状态;
[0161]
按照反向的时间顺序将多个所述组坐标数据依次作为所述后向循环神经网络的输入,并根据所述后向循环神经网络的输出生成后向隐式状态;
[0162]
根据所述前向隐式状态和所述后向隐式状态拼接生成所述编码隐式状态。
[0163]
可选地,计算机程序被处理器1120执行“获取目标对象的第一基础坐标序列和交互对象的第二基础坐标序列”步骤时,使得处理器具体实现以下步骤:
[0164]
获取目标对象在预设时间段内的第一轨迹,并获取交互对象在所述预设时间段内的第二轨迹;
[0165]
以相同的采样方式对所述第一轨迹和所述第二轨迹分别进行采样处理,确定所述目标对象多个位置点的第一坐标数据和所述交互对象多个位置点的第二坐标数据,并根据多个所述第一坐标数据生成第一基础坐标序列,根据多个所述第二坐标数据生成第二基础坐标序列。
[0166]
可选地,计算机程序被处理器1120执行“根据所述编码隐式状态确定相应的隐式状态概率分布”步骤时,使得处理器具体实现以下步骤:
[0167]
将所述编码隐式状态映射为预设维度的均值向量μ和预设维度的标准偏差向量σ,确定多元正态分布n(μ,σ),并基于kl散度约束所述多元正态分布n(μ,σ)与标准多元正态分布n(0,i)之间的距离;其中,i表示预设维度的单位矩阵。
[0168]
可选地,计算机程序被处理器1120执行“根据所述隐式状态概率分布采样确定初始隐式状态”步骤时,使得处理器具体实现以下步骤:
[0169]
根据所述隐式状态概率分布进行随机采样,并采样得到隐式随机向量z;将所述隐式随机向量z映射为用于解码的初始隐式状态h0。
[0170]
可选地,计算机程序被处理器1120执行“对所述初始隐式状态进行解码处理,确定所述目标对象的第一坐标序列概率分布和所述交互对象的第二坐标序列概率分布;根据所述第一坐标序列概率分布采样确定所述目标对象的新坐标序列,根据所述第二坐标序列概率分布采样确定所述交互对象的新坐标序列”步骤时,使得处理器具体实现以下步骤:
[0171]
根据所述隐式随机向量z和第i-1步新坐标数据对第i-1步隐式状态进行解码处理,确定第i步隐式状态和第i步坐标数据概率分布;其中,所述第i-1步新坐标数据包括目标对象的第i-1步新坐标数据和所述交互对象的第i-1步新坐标数据,所述第i步坐标数据概率分布包括第i步第一坐标数据概率分布和第i步第二坐标数据概率分布;所述第i-1步新坐标数据的初始值包括预设的所述目标对象的初始坐标数据和所述交互对象的初始坐标数据,所述第i-1步隐式状态的初始值为所述初始隐式状态h0;
[0172]
根据所述第i步第一坐标数据概率分布采样确定所述目标对象的第i步第一新坐标数据,根据所述第i步第二坐标数据概率分布采样确定所述交互对象的第i步第二新坐标数据;
[0173]
对i进行加一处理,重复上述每一步确定第一新坐标数据和第二新坐标数据的过程,直至解码结束;
[0174]
根据所有的所述第一新坐标数据生成所述目标对象的新坐标序列,并根据所有的所述第二新坐标数据生成所述交互对象的新坐标序列。
[0175]
可选地,计算机程序被处理器1120执行“确定第i步坐标数据概率分布”步骤时,使得处理器具体实现以下步骤:
[0176]
确定第i步第一坐标数据概率分布的参数和第i步第二坐标数据概率分布的参数且所述第i步第一坐标数据概率分布和所述第i步第二坐标数据概率分布分别为:
[0177]
[0178][0179]
其中,x
s
,y
s
表示第一坐标数据的坐标值,x
a
,y
a
表示第二坐标数据的坐标值,函数n()表示高斯分布密度函数;分别为所述目标对象在第i步第一坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,分别为所述交互对象在第i步第二坐标数据概率分布的、高斯混合模型的第k个正态分布的权重、均指向量、标准偏差向量、相关性向量,且
[0180]
计算机可读存储介质包括:永久性和非永久性、可移动和非可移动媒体,是可以保留和存储供指令执行设备所使用指令的有形设备。计算机可读存储介质包括:电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备以及上述任意合适的组合。计算机可读存储介质包括:相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、非易失性随机存取存储器(nvram)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带存储、磁带磁盘存储或其他磁性存储设备、记忆棒、机械编码装置(例如在其上记录有指令的凹槽中的穿孔卡或凸起结构)或任何其他非传输介质、可用于存储可以被计算设备访问的信息。按照本发明实施例中的界定,计算机可读存储介质不包括暂时信号本身,例如无线电波或其他自由传播的电磁波、通过波导或其他传输介质传播的电磁波(例如穿过光纤电缆的光脉冲)或通过导线传输的电信号。
[0181]
在本技术所提供的几个实施例中,应该理解到,所披露的装置、电子设备和方法,可以通过其他的方式实现。例如,以上描述的装置实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接,也可以是电的、机械的或其他的形式连接。
[0182]
所述作为分离部件说明的单元可以是或也可以不是物理上分开的,作为单元显示的部件可以是或也可以不是物理单元,既可以位于一个位置,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或全部单元来解决本发明实施例方案要解决的问题。
[0183]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0184]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术作出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(包括:个人计算机、服务器、数据中心或其他网络设备)执行本发明各个实施例所
述方法的全部或部分步骤。而上述存储介质包括如前述所列举的各种可以存储程序代码的介质。
[0185]
以上所述,仅为本发明实施例的具体实施方式,但本发明实施例的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例披露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明实施例的保护范围之内。因此,本发明实施例的保护范围应以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1