用于在环境背景下模拟类人控制行为的系统和基于计算机的方法与流程

文档序号:14203983阅读:181来源:国知局



背景技术:

本发明涉及一种用于在环境背景下模拟类人控制行为的基于计算机的方法,并且具体涉及包括用于实现数据的双向压缩的基于计算机的方法的这种系统和方法。

如今,辅助系统被用于几乎任何种类的工业的许多应用。尤其是汽车工业或航空工业以及计算工业辅助系统普遍用于为用户提供操作系统。在汽车工业中,广泛使用如通过检测和最小化打滑来提高车辆稳定性的安全性的esc(电子稳定性控制装置),或紧急情况下通过解析制动踏板被推动的速度和力来确保最大制动力的eba(紧急制动辅助装置)的公知的系统。在航空工业中,有源自动驾驶仪或所谓的有线飞行系统通常用于现代民用和军用飞机,其中电子接口通过将飞行控制装置的运动转换成电子信号来取代手动飞行控制装置,并且无需人为干预来启动飞行控制装置。

此外,集成在如车辆或飞机的系统中的传感器和致动器的数量迅速增加,目的是电子地监视和/或控制这些系统中的每个组件。

传感器和致动器的数量增加引起的一个问题是用于识别系统的具体情况或运行状态而需要处理和/或分析的数据量。

现代辅助系统的意图是在动态变化的环境中操作机器的同时提供对人类意图的稳健、敏感和实时的监控。这种现代化的辅助系统实现了机器的有效和安全的操作,优化为实际的人类意图操作。这种机器可以是任何一种由人类操作的系统,像例如车辆、飞机、船舶、机器等以及像例如计算机游戏等的计算系统。在下文中,术语“系统”应理解为这些类型中的任意类型。

辅助系统通常使用虚拟开发方法。在汽车开发过程中,这些方法正在迅速获得重视,以应对重要的业务挑战:缩短产品上市时间,优化产品质量、性能和价值,降低生产和开发成本,应对日益严格的排放和安全法规。例如,发动机和动力总成领域的一个特殊挑战是即将出台的欧洲“现实驾驶排放”(rde)法规。rde合规要求在各种操作条件下控制车辆废气排放。这严重影响了传统上基于固定驾驶循环的发动机标定过程。

标定过程的虚拟化部分允许通过在由虚拟驾驶员模型操作的虚拟驾驶环境中运行物理或灰箱车辆模型来评估在各种真实驾驶条件下的车辆和发动机行为。

具有人工(即,在机器上实现,或者在计算机中或作为计算机实现,或在工具中或作为工具实现)记忆系统的感知/认知架构被用作这种辅助系统。它们特别适合于响应人类操作员来理解和控制工具的动态行为,尤其是对于在动态变化环境中操作员和工具实时的真实安全交互。

文献wo2014009031涉及一种方法或系统或架构,特别是具有人工记忆系统的感知/认知架构,其包括:

-至少一个第一节点,其适于存储和调用(例如,长的)输入序列,诸如被建模为事件的(例如,长的)输入序列;

-至少一个第二节点,其适于从原始数据中提取和保存原型,每个原型代表数据组块,表征具有类似特征的(在其环境中的工具的)现实世界操作。

在本文中公开的架构中,第二节点为第一节点提供输入。原始数据通常是从传感器获得的数据,所述传感器例如用于感测机器或工具的致动器或控制元件的活动的传感器。

人工记忆系统通常由多个节点组成,每个节点解决像例如下列之一的一个具体任务:空间池、信号量化、时间和强制时间池、事件和强制事件池。整个系统的功能是通过利用不同类型的定向连接将这些节点连接来实现的,例如:前馈(ff)输入/输出、反馈(fb)输入/输出、状态一致性检查等等。

本文献中描述的记忆预测框架(mpf)在特定实施例中是受到哺乳动物新皮层的功能启发的“人工记忆唤醒系统”,能够鉴别、存储、识别感测参数的空间/时间模式,能够分类所暴露的事件,并随时间进行预测。一个mpf网络由可以包含类似神经气的自适应记忆系统的分层的节点组来组成,所述系统能够并行分析不同的时空输入,然后在整个层次结构中进行通信,以便发现更高层级的行为和属性。

具有输入和输出的节点的三个主要目的是学习并认知特别的输入模式、将它们与若干外部(可能未知的)原因或事件相关联、以及最终预测接下来的输入模式。

为了实现这些目标,通常要区分两个不同的阶段:训练阶段或学习阶段,用于学习影响节点的内部“记忆”的输入模式;以及推理阶段,其为节点的实际操作阶段,在该阶段期间输入模式与所记忆的模式进行比较并生成ff和fb输出。

实际上,没有什么阻止节点以一起进行训练和推理的“连续学习”的方式操作。另一种可能是具有用于克服“冷启动”问题的很短的初始训练阶段,初始训练阶段随后是连续学习阶段。

无论如何,推理阶段的目的是评估当前的输入模式,以便将其与一个或多个习得的原因相关联。这导致表示当前输入模式属于习得的原因之一的可能性的ff输出信号的生成。该过程通常也受到表示由母节点提供的对当前ff输出信号的预测的fb输入信号的影响。该最后的特征是为了允许节点在可能共享通用输入模式的不同原因之间消歧:这通常被称为“关注的焦点”。生成ff输出之后,节点还应该经由其fb输出生成对向子节点发送信号的下一输入模式的预测:这可能需要等待所有网络完成ff更新以从上到下的节点传播预测。

很明显,借助ff和fb连接的节点间信息交换是记忆预测框架(mpf)的核心,诸如上文提到的wo2014009031中所公开的。

因此,节点之间的通信效率既在可以交换的比特数量方面也在节点内的计算量方面影响整个系统。事实上,效率越高,两个节点之间可以交换的比特越多,并且节点内处理相同数量的数据需要越少的计算量。

双向映射是一种降低维数的技术,避免了诸如主成分分析(pca)和通常的流形学习算法的常见技术的典型缺陷。特别地,避免了线性,线性对低精度的映射的习得的流形有约束,以及避免了方向性(directionality),方向性助长了从它们的低维表示中恢复原始的高维点的不可能性。

在由laurensvandermaaten和geoffreyhinton在机器学习研究(machinelearningresearch)期刊,第1卷(2008)第1-48页中发表的题为“使用t-sne可视化数据”的文章中公开了一种名为t分布随机相邻嵌入(t-sne)的公知的基于计算机的方法。

t-sne方法允许利用保留接近性的降维来可视化高维数据集,无需对可视化进行任何可能的推理。



技术实现要素:

本发明旨在通过对节点间通信执行可逆降维来提高记忆预测框架全局效率,其允许高维空间和低维空间之间的数据相关双向映射。

用于通过将高维数据压缩成例如二维或三维映射的较低维度映射来实现数据的双向压缩的基于计算机的方法达到了该目标,该方法包括:接收具有大于一维的第一维度的数据,例如由至少一个传感器捕获并发送的数据;以及将所述数据或由所述数据(诸如gps数据段或车辆的车载电子控制单元的数据段)导出的属性压缩为具有比第一维度低的第二维度的压缩数据。

根据这种基于计算机的方法的一般特征,对于两个度量空间x=(x,μx)和y=(y,μy),其中x为维度大于或等于第二空间y的维度的第一空间,μx是所述第一空间x上的第一度量,μy是所述第二空间y上的度量,p是属于所述第一空间x的第一n个点的组,一个点为空间中的一个元素,通过以下等式求出属于所述第二空间y的第二n个点的组q来实现压缩:

其中d(.,.)是方阵空间上的对称距离函数,而a1和a2是具有以下性质的任意两个函数,a为a1和a2函数中的任一个:

-a:r+[0,1],

-a(0)=1,

-limx→∞a(z)=0,

-a(z1)>a(z2)当且仅当z1<z2。

a1和a2可以是具有所述特性的任何函数,包括:

当s>0时,或者当s>0时,或者当s>0时或者当s>0时

一旦针对第一n个点的组p的n个点中的每一个求解了等式1,则两个n个点的组p和q中的点之间的对应关系(称为bimap)即bimap=(p,q)可以用作变换图集以借助下面的等式2和等式3将所述第一空间x的点转换成所述第二空间y的点,反之亦然。

第一空间x和第二空间y是y的维数小于x的维数的一般空间。基于计算机的方法创建x中的点和y中的点之间的对应关系。因此,压缩是通过使y的点在维数上小于x的点来实现的。这种压缩方法被定义为双向的,因为它既允许数据的压缩也允许数据的解压缩,相反,其它的流形学习算法只允许数据的压缩而不允许数据的解压缩。

该基于计算机的方法和t-sne的基于计算机的方法之间的两个主要差异在于这里给出的既添加新的点到映射而无需重新计算整个映射并且又创建从度量y到度量x的逆向对应关系以使较高维度的点从其较低维的表示恢复的可能性。

事实上,t-sne不会创建任何映射,并且任何新的点的添加都会限制重新计算所有数据以将其可视化。

与t-sne的第二个区别也是与gashler等人发表于nips(2007)第8卷第513-520页的题为“iterativenon-lineardimensionalityreductionwithmanifoldsculpting”(“用流形刻画的迭代非线性降维”)文章中以及coifman等人发表于2006年7月的杂志《appliedandcomputationalharmonicanalysis》(《应用和计算谐波分析》)第21卷第1期第5-30页的题为“diffusionmaps”(“扩散映射”)的文章中公开的标准流形学习基于计算机的方法的主要区别。

此外,取决于函数a1和a2的选择,该基于计算机的方法可以准确地传送从p到q的邻近关系,和/或可以显示自聚类特征,和/或有助于高亮显示数据中的隐藏模式。例如,如果a1和a2是相同的函数,那么邻近关系被精确地传送,而当a2比al具有更厚尾部(tail)时,那么在x上不太接近的点将被分散在对y的投影上,从而高亮显示了x中原点的邻域结构,即聚类。

在该基于计算机的方法的第一方案中,所述方法还包括在初始化所述双向压缩之前从至少一个数据中提取属性。

从每个数据中提取属性使得已经能够挑选出被认为与未来操作相关的每个数据的元素,并因此已经通过仅保留双向压缩为二维或三维映射的相关部分(即,属性)来实现所使用数据的第一压缩。

此外,对诸如时空属性的属性的提取有助于使用双向映射压缩来简化基于计算机的模型的训练。

在该基于计算机的方法的第二方案中,所述压缩方法包括通过求解以下等式来压缩在度量y上属于度量x的新的点m:

并且通过求解下面的等式来对度量x上属于度量y的新的点t进行解压缩:

其中μx(p,m)和μy(q,t)是bimap的点与对应的相应空间中新的点之间的距离矢量,bimap是由等式2(压缩)和等式(3)(解压缩)给出的x的点与y的点的对应关系。

此外,当需要分别在y或x中映射新的点m或t时,可以使用a1(μx(p,m))或a2(μy(q,t))来评估客观的映射失真指数(mdi)。事实上,通过该基于计算机的方法获得的映射精度取决于相对于图集bimap=(p,q)中的点的接近度。通过从学习的点中搜索具有最小激活失真的点(即,求解等式2或等式3)来表示相关性。评估mdi的可能性造成x空间中的点部分方案以便具有更精确的图集以及内在异常检测机制来支持或实施mpf内的背景检查。

本发明的另一个目的是提供一种用于在环境背景下模拟类人决策的基于计算机的方法,所述方法包括:

-利用至少一个传感器捕获环境数据,

-通过将高维数据压缩成上文定义的较低维映射来实现用于实现数据的双向压缩的基于计算机的方法,

-如果在基于计算机的模型的学习阶段期间捕获环境数据,则通过压缩数据的所述映射将具有不同特性的数据分离的良好程度来判定所述映射的质量,以评估所述映射,所述捕获的数据对应于已经预先评估的已知的预先记录的数据,

-如果在所述学习阶段之后捕获环境数据,则将新的点添加到所述压缩数据,并且生成指示使用哪个类人决策的信号来对应于操作员的状态。

取决于环境背景和方法的使用,模拟的类人决策可以是考虑到一些例如声音的第一类型环境数据的关于他们的环境的人类判断,或者是对了解了像汽车的位置、速度和档位的一些第二类型环境数据的人类(例如驾驶员)将会采取何种行动进行预测的类人控制行为控制,或者其他种类的类人决策。

因此,在包括记忆预测框架的架构中,该基于计算机的方法可以以三种不同的方式起作用:第一作为输入数据预处理,第二作为节点间前馈和反馈数据压缩,第三作为节点输出分类器。

在第一种配置中,即输入数据预处理中,由双向映射的基于计算机的压缩方法所起的作用是使网络处理来自维度较小的域的数据,从而节省存储和计算能力。

在第二配置中,即节点间前馈和反馈数据压缩中,使用双向映射的基于计算机的压缩方法压缩来自最低层节点的前馈输出,并解压缩从最高层节点输出的反馈。

在第三配置中,即节点输出分类器,双向映射的基于计算机的压缩方法有助于可视化节点内的学习动态,从而有助于人类对存储在其中的信息的定性解释。在这种情况下,所述压缩方法充当基于聚类的分类器。

在第二配置中,在学习阶段结束之后发生的推理任务期间,根据wo2014009031,mpf节点计算当前输入与其所有存储的重合之间相对于定义的量度的距离,因此其输出由作为已知存储的重合的样本的所述输入的距离相关概率分布构成的前馈信号。

在节点内,通过将重合用作参考点,重合的空间与度量耦合,所述度量既表明重合在节点输入空间内具有自然定义的空间概念,也表明前馈信号是输入在其在输入空间内的位置方面的编码。

换句话说,对于任何新的输入m,mpf节点n的输出是矢量an(μn(c,m)),其中an(.)是节点n的激活函数,μn(.)是其度量,并且c是其一组重合。

因此,任何节点的输出都是等式2的前半部分,而对称地,反馈输出是等式3的后半部分。

特别地,每个节点的输出的维度随着节点本身的记忆大小而增加。在现实世界中使用mpf期间,即在推理阶段期间,节点可以具有数百或数千概率的输出维数。由于上述层中的节点必须从较低层中节点的输出学习,所以在堆叠例如mpf的层次结构中的节点时,降维的需要就很重要。

特别是较小的维度输入意味着执行所有mpf能力所需要的计算能力的减小。

当较高层的节点接收到作为输入的若干较低层节点的输出时,这个问题更加相关,那么其输入空间的维度就相应地增加到其输入节点的重合数量的总和。

在反馈连接中无疑会需要反向投影,因为其对许多mpf特征是强制性的。

而且,每当c的阶数超过输入空间n的维数至少一维时,节点输入空间内的输入m的位置与输出中的前馈信号的空间之间存在一对一的对应关系,这意味着任何进一步的对应关系都会对an(μn(c,m))增加冗余,这可以通过所述压缩方法清除掉。

如今,例如购买新车时,汽车的音质是消费者考虑的一个非常重要的方面。由于音质主要是一个主观方面,所以没有可靠的方法来客观地评价音质。因此,在汽车开发过程中的评估步骤通常依赖于专家常常给出的在不同汽车之间的相对尺度的判断。

因此,该基于计算机的方法的该方案使得能够将汽车声音的主观判断客观化,换句话说,它使得能够对评估汽车声音的过程客观化。

在用于在环境背景下模拟类人决策的基于计算机的方法的第一方案中,所述基于计算机的方法包括在实现用于实现数据的双向压缩的基于计算机的方法之前利用至少一个滤波器预处理所述环境数据,所述基于计算机的方法用于实现作为输入滤波的环境数据的数据的双向压缩。

这个附加的步骤使得特别是在汽车音响处理的应用中,环境数据能够通过诸如带通滤波器的一系列滤波器以及帮助增加和多样化所处理的信息量的预处理步骤。例如,在汽车音响处理的应用中,预处理步骤可以包括去噪、卷积或任何可能的音频处理。一般地,它可以是任何类型的数据操作或特征提取。

mpf架构主要是非监督的和数据驱动的。因此,滤除数据可有助于排除无用或误导性信息,帮助mpf专注于更重要的特征。

在用于在环境背景下模拟类人决策的基于计算机的方法的第二方案中,环境数据包括利用噪声传感器在汽车驾驶舱内记录的原始声音的至少一个样本,并且所述方法还包括:在利用至少一个滤波器对由所述听觉模型输出的数据进行预处理之前,将所述环境数据输入到听觉模型中,以递送多个不同版本的环境数据,所述预处理在每个版本的环境数据上实现。

因此,该基于计算机的方法的该方案使得能够将汽车声音的主观判断客观化,换句话说,它能够使对评估汽车声音的过程客观化。

原始声音可以通过使用与can总线数据(即,控制器区域网络)同步的高保真麦克风进行记录。

听觉模型是将声学数据转换为心理声学数据的仿生技术。物理声音属性与人类感知之间的对应关系是复杂的并且远非线性的。执行诸如积分、时频掩蔽的若干操作。从计算的角度来看,听觉模型可以被看作为任务是复制人耳所执行的操作的一组滤波器。这种方法被广泛用于语音识别,但在汽车领域很少被考虑。

原始记录的声音使用科学文献中提出的听觉模型进行处理。考虑到诸如频率选择、时频掩蔽的不同听觉模型的效果,该步骤的输出是一组确定的频带中能量的量。

使用一组不同的听觉模型来生成要在下面的步骤中处理的相同原始声音的多个“心理声学版本”。

本发明的另一个目的是提出一种用于在环境背景下模拟类人行为的系统,其包括用于捕获环境数据的至少一个传感器、以及用于与工具和操作员的动态行为交互的具有记忆体的架构。

根据用于在环境背景下模拟类人行为的系统的一般特征,所述架构被配置为处理所述基于计算机的方法的步骤,以用于在上文定义的环境背景下模拟类人决策。

而且,申请wo2014009031中的所有特征被整合在本说明书中。

在用于在环境背景中模拟类人行为的系统的第一方案中,该架构的记忆体是人工记忆体,该架构是具有用于抽象、泛化和学习的结构和机制的第一神经网络,所述第一神经网络的实现品(implementation)包括人工分层记忆系统,包括:接收端口,其被配置为接收由传感器(在工具上)产生的数据;一个或多个第一节点,其被配置为学习和识别从所述接收端口接收到的频繁出现的输入属性和序列,所述一个或多个第一节点形成第二神经网络,所述第二神经网络包括作为组件的神经元和连接图中两个或多个所述神经元的边缘;以及输出端口,其被配置为输出由所述架构构建并且与所述行为相关联的数据,由此所述一个或多个第一节点中的每一个或者本质上全部第一节点适用于时间序列分析,并且包括拓扑图或时间图中连接的组件。

在用于在环境背景下模拟类人行为的系统的第二方案中,所述系统包括预处理滤波器,以将一组不同的滤波器应用于由至少一个传感器捕获的环境数据。

在用于在环境背景下模拟类人行为的系统的第三方案中,所述环境数据包括利用噪声传感器记录在汽车驾驶舱内的原始声音的至少一个样本,并且所述系统还包括听觉模型,其被配置为在滤波预处理滤波之前应用于所述记录的环境数据以输出所述环境数据的多个不同版本,所述滤波预处理在所述环境数据的每个版本上实现。

本发明的另一个目的是提出一种包括电子控制单元的机动车辆,所述电子控制单元包括用于在环境背景下模拟类人行为的系统。

附图说明

通过根据附图阅读作为非限制性的示例的下文,将更好地理解本发明,在附图中:

-图1示意性地示出了根据本发明的实施例的人工记忆系统;

-图2示出了用于在环境背景下模拟类人行为的基于计算机的方法的图示。

具体实施方式

将参照特定实施例并参照一定的附图来描述本发明,但是本发明不限于此,而是仅由权利要求限定。所描述的附图仅是示意性的而非限制性的。在附图中,为了说明的目的,一些元件的尺寸可能被放大,而没有按比例绘制。在本说明书和权利要求书中使用术语“包括”时,其并不排除其他元件或步骤。当涉及单数名词时使用不定冠词或定冠词,例如“一个(a)”或“一个(an)”、“所述”包括该名词的复数,除非另有特别说明。

在权利要求中使用的术语“包括”不应该被解释为限于其后列出的器件;其并不排除其他元件或步骤。因此,表述“装置包括器件a和b”的范围不应限于装置仅由组件a和b组成。其意味着就本发明而言,装置的仅有关的部件是a和b。

此外,说明书和权利要求书中的术语第一、第二、第三等用于区分相似的元件,而不一定用于描述顺序或时间顺序。应该理解的是,如此使用的术语在适当情况下是可互换的,并且这里描述的本发明的实施例能够以不同于在此描述或示出的其他顺序操作。

在图1中示意性地呈现了根据本发明实施例的用于在环境背景下模拟类人行为的系统100。

模拟系统100包括配置成捕获环境数据的两个传感器110。在本实施例中,传感器110是被放置在汽车驾驶舱内的两个不同位置的两个高保真麦克风。

模拟系统还包括具有人工记忆系统120的架构,所述架构被配置为与工具和操作员的动态行为进行交互。具有人工记忆系统120的架构由具有抽象、泛化和学习的结构和机制的第一神经网络构成。

第一神经网络的实现品包括人工分层记忆系统130,人工分层记忆系统130包括:接收端口,其被配置为接收由麦克风110生成的数据;一个或多个第一节点140,其被配置为学习和识别从接收端口接收的频繁发生的输入属性和序列;以及一个或多个第二节点150。一个或多个第一节点140形成第二神经网络,所述第二神经网络包括:作为组件的神经元和连接图中的所述神经元中的两个或多个的边缘;以及输出端口,所述输出端口被配置为输出由该架构构建的并且与行为相关联的数据,由此所述一个或多个第一节点中的每一个或本质上全部适于时间序列分析,并且包括拓扑图或时间图中连接的组件。

在本发明的实施例中,提到了操作人员,诸如驾驶员、船长、飞行员、玩家。这样的人可以是“自主的”。例如,操作员命令可以以存储在可由系统读取的适当存储介质上的命令的形式被预先给出。例如,如果操作员是驾驶员并且工具是诸如汽车的车辆,则命令可能是目的地、预期的到达时间、预期的燃料消耗、是否积极地、运动地、冷静地驾驶。实际的驾驶员也可以有意地接通系统,并且可以提供命令以根据驾驶员的正常行为或其他行为的加速度、制动力、速度、燃料消耗等等方式将驾驶员驱动到目的地。在缺少命令的情况下,该系统也可以接管。例如,如果检测到驾驶员入睡,则系统将车辆安全地停下来。驾驶员是否已经入睡可以通过意识检查来检测。

本发明的实施例基于记忆预测框架(mpf)并且包括人工分层记忆系统。人工分层记忆系统可以是用于场景识别/“分类”和/或预处理阶段的具有改进能力的增强型分层时间记忆(htm)。该系统和方法已经适合于能够取决于采样频率、由于引入时间事件管理而关于输入操作员命令的预测以及上述预处理阶段而提供诸如10-15个数目的样本或例如半秒左右所需的任何适当数目的样本。

图1的实施例的架构对应于文件wo2014009031中描述的包括增强型分层记忆的架构。

记忆预测框架适合作为一种基本模型,因为它预见了良好的学习、抽象和泛化所必需的几乎所有的结构和机制,例如前馈和反馈信号在网络内流动,它们的对应关系作为对情况了解程度的测度,这是评估网络的泛化能力的先决条件。mpf计算方法及其学习算法已经被证明可以很好地处理不同的感觉通道,但是仍然需要特定感觉的预处理或调节。一旦建立,即适应特定的传感器模态,则原则上不需要预处理。然而,它可以不时地被有利地应用为例如前面提到的所谓的基元。本发明的实施例可以被看作是mpf的合适部分的实例。

图2示意性地呈现了用于在环境背景下模拟类人决策的基于计算机的方法。该模拟方法由模拟系统100的人工分层记忆体130内的节点140和150来实现。

在这个例子中,类人决策是汽车的驾驶员的行为,所考虑的环境背景对应于他周围的声音。

在模拟方法的第一步骤10中,与can总线数据同步的若干高保真麦克风记录汽车驾驶舱内的原始声音。所记录的原始声音处于高维度配置,例如三维配置。

在模拟方法的第二步骤12中,对应于所记录的原始声音的电子信号发送到具有所述人工记忆系统120的架构,并且通过一组听觉模型进行预处理以生成每个所记录的原始声音中的多个“心理声学版本”,其在滤波步骤之后将被输入到人工记忆系统120中。

在模拟方法的第三步骤14中,通过一组带通滤波器对与每个记录的原始声音的多个心理声学版本对应的电子信号进行预处理。

在模拟方法的后续步骤16中,使用用于通过将所述经滤波的数据压缩成二维映射来实现数据的双向压缩的基于计算机的方法,将经滤波的声音发送到待处理的节点。

在步骤18中,模拟方法的后续步骤和压缩方法的第一步骤中,经滤波的声音由其他节点或相同节点接收。

在压缩方法的第二步骤20中,节点操作从每个经滤波的原始声音中的属性的提取,以便挑选出被认为与用于模拟类人控制行为的方法相关的每个数据的元素。

所提取的属性是例如时空属性,以便简化对用于模拟类人控制行为的基于计算机的方法的训练。

在压缩方法的第三步骤22中,节点操作从经滤波的原始声音中提取的属性的压缩。

所述压缩是通过以下等式求出属于度量y的一n个点的组q来实现的:

x=(x,μx)和y=(y,μy)是两个度量空间,x为第一空间,其维度大于或等于第二空间y的维度,μx为空间x上的第一度量,μy为空间y上的第二度量,p是属于所述第一空间x的第一n个点的组,并且d(.,.)是方阵空间上的对称距离函数,而a1和a2是保持以下特性的任何两个函数:

-a:r+[0,1],即a是为所有正实数定义的并且产生包括0和1的0与1之间的值的函数;

-a(0)=1,即a是自变量0将生成值1的函数,

-limx→∞a(z)=0,即a是当自变量逼近增长时具有0的极限值的函数,

-a(z1)>a(z2)当且仅当z1<z2,即a是一个严格的递减函数。

一旦对于第一n个点的组p的n个点中的每一个求解了等式1,那么两个n个点的组p和q的各点之间的对应关系,即bimap=(p,q)(参照bimap)可以用作为变换图集,以借助下面的等式2和等式3将所述第一空间x的点转换成所述第二空间y的点,反之亦然。

通过这样的步骤,可以由此将新的点添加到映射中而不需要重新计算整个映射,并且创建从空间y到空间x的逆向对应关系以使较高维度的点从其较低维的表示恢复。

因此,通过求解以下等式,属于空间x的任何新的点m可以在空间y上被压缩:

并且属于空间y的任何新的点t可以通过求解以下等式在空间x上被解压缩:

其中μx(p,m)和μy(q,t)是bimap点和对应的相应空间中的新的点之间之间的距离矢量,bimap是求解等式1的一对点bimap=(p,q)。

取决于节点140和/或150中的阶段,压缩方法可以以三种不同的方式起作用。

在学习阶段,它可以充当输入数据预处理,使网络处理来自维度较少的域的数据,从而节省存储和计算能力。

在推理阶段,在学习阶段之后,它可以充当节点间前馈(ff)和反馈(fb)数据压缩或作为节点输出分类器。

当充当节点间ff和fb数据压缩时,压缩方法被用来压缩来自较低层节点的ff输出,并且解压缩来自较高层节点的反馈输出。

当充当节点输出分类器时,压缩方法有助于在节点内可视化学习动态,以帮助对存储在其中的信息进行人类定性解释。在这种情况下,压缩方法充当基于聚类的分类器。

如果架构处于学习阶段,则在用于在环境背景下模拟类人决策的基于计算机的方法的接下来的步骤24中,通过将所述压缩数据与先前记忆的不同参考进行比较并且用与所述参考之一相关联的标签来标记压缩数据的映射来评估所述压缩数据的映射。

如果架构处于推理阶段中,替代于步骤24,在步骤26中将从新记录的原始声音的推导中提取的任何新属性添加到压缩数据的映射,并且生成指示使用哪个类人决策对应于使用用于在环境背景下模拟类人决策的基于计算机的方法的系统的人类状态。

因此,在推理阶段期间,用于模拟类似决策的方法可以使架构执行若干操作,诸如:

-通过经过这里描述的过程而不修改习得的记忆来评估新的声音;

-通过分析由bimap执行的低维聚类来推理获得类似判断的声音的共同特性;

-通过在映射上高亮显示不寻常行为,提高类人判断的可靠性;

-从期望的判断产生声音;由于所有步骤都是可逆的,因此可以从生成的bimap上的位置开始合成具有预期判断的新的声音。

以下是使用本发明的另一个例子,其详细解释了本发明的某些方案。

虚拟开发方法正在汽车开发过程中迅速获得重视,以应对重要的业务挑战:缩短产品上市时间,优化产品质量、性能和价值,降低生产和开发成本,应对日益严格的排放和安全法规。发动机和动力总成领域的一个特殊挑战是即将出台的欧洲“现实驾驶排放”(rde)法规。rde合规要求在各种操作条件下控制车辆废气排放。这严重影响了传统上基于固定驱动循环的发动机标定过程。

标定过程的虚拟化部分允许通过在由虚拟驾驶员模型操作的虚拟驾驶环境中运行物理或灰箱车辆模型来评估在各种真实驾驶条件下的车辆和发动机行为。

本发明在这个例子中用于开发以类人方式处理加速/制动、离合器和换档的新的外部驾驶员模型,即用于模拟类人控制行为的方法。

本发明的方法基于机器学习,因为它允许模型从记录的数据中学习并且在任何任意路线上复制驾驶员的行为,使其适合于rde模拟。

所提出的方法由三个主要阶段组成,在这些阶段中,架构的节点着手建立测试中的记录数据与模拟环境之间的关系。

在被称为提取阶段的第一阶段中,由诸如传感器110的传感器捕获的数据被发送到映射属性提取器。映射属性提取器或者可以将记录的电子控制单元(ecu)数据与全球定位系统(gps)位置一起作为输入,或者仅将gps点作为输入,以产生连接它们的路线的属性。第一种情况是准备输入,以便从数据中习得真实的驾驶员行为,而第二种情况则需要通过新的路线推断习得的行为。

在被称为学习阶段的第二阶段,捕获的数据被输入到模型中,以学习驾驶路线上的真实驾驶员行为并将其泛化以便在新路线上复制所述行为。在这个阶段,bimap被用于通过感测ecu和gps数据来学习环境中的真实驾驶员行为。在推理阶段,bimap在新的环境中产生预期的人类行为。

在被称为推理阶段的第三模块中,以闭环与模拟环境协作的功能模型单元(functionalmock-upunit,fmu)控制器在学习阶段期间使用所构建的模型,以通过以人类可行方式进行在汽车上的控制(换档和踏板)来实施驾驶员纵向行为。

这个例子展示了人工智能驾驶员,它可以在记录的路线上学习真实的驾驶行为,并将其泛化到任意路线上。驾驶员模型在车辆踏板和档位选择上都展现出类人驾驶行为,因此其适合于用在模拟排放上。

本发明可以在处理器系统上实现。处理系统可以包括计算设备或处理引擎,例如微处理器或fpga。可以在处理系统中实施根据本发明的实施例或者权利要求保护的上述任何方法。这样的处理系统可以包括联接到存储子系统的至少一个可定制或可编程处理器,该存储子系统包括至少一种形式的存储器,例如ram、rom等等。应当注意的是,一个或多个处理器可以是通用的或专用处理器,并且可以包含在设备中,所述设备例如是具有执行其他功能的其他组件的芯片。因此,根据本发明的实施例的方法的一个或多个方案可以以数字电子电路,或以计算机硬件、固件、软件或其组合来实现。处理系统可以包括具有磁盘驱动器和/或cd-rom驱动器和/或dvd驱动器中的至少一个的存储子系统。在一些实施方式中,可以包括显示系统、键盘和定点设备作为用户界面子系统的一部分,以为用户提供手动输入信息,诸如参数值。可以包括允许连接到不同类型的物理传感器的诸如到各种设备的网络连接、接口等的更多元件。处理系统的各种元件可以以包括经由总线子系统的各种方式联接,为了简单起见作为单个总线联接,但是本领域技术人员将理解的是包括至少一个总线的系统。当在处理系统上执行时存储子系统的存储可以在某个时间保存实施文中描述的方法实施例的步骤的一组指令的部分或全部。

本发明还包括计算机程序产品,其在计算设备上(例如,在上述类型的处理器上)执行时提供根据本发明的任何方法的功能。当在处理引擎上执行时,根据本发明的软件可以包含提供用于与工具和操作员的动态行为进行交互的具有人工记忆的感知/认知架构的代码段,其中感知/认知架构基于具有用于抽象和泛化以及选择性学习的结构和机制的记忆预测框架的实现品,记忆预测框架的实现品包括增强型人工分层记忆系统。软件可以适于与预处理阶段协作。该软件在被执行时可以适于基于时间事件管理来提供关于输入操作员命令的预测,并且在基元和循环模式方面描述来自物理传感器的输入数据。

本发明还包括具有根据本发明的软件的计算机程序产品,所述软件当在处理引擎上执行时可以包含代码段,所述代码段提供用于与工具和操作员的动态行为进行交互的具有人工记忆的感知/认知架构,其中所述知觉/认知架构基于具有用于抽象和泛化以及选择性学习的结构和机制的记忆预测框架的实现品,所述记忆预测框架的实现品包括增强型人工分层记忆系统。该软件可以适于与预处理阶段协作,该软件适于根据基元和循环模式描述来自物理传感器的输入数据。该软件可以适于允许前馈和反馈信号流,并且开发前馈信号流和反馈信号流之间的对应关系作为背景检查的测度。

本发明还包括一种包括根据本发明的软件的计算机程序产品,其可以包含代码段,所述代码段提供当在处理引擎上执行时用于与工具和操作员的动态行为进行交互的具有人工记忆的感知/认知架构。该架构可以基于具有结构的记忆预测框架的实现品,并且该软件可以适于提供用于抽象和泛化以及选择性学习的机制,该记忆预测框架的实现品包括增强型人工分层记忆系统。该软件可以适于与预处理阶段协作,该软件适于根据基元和循环模式来描述来自物理传感器的输入数据,该软件适于基于来自物理传感器的输入来输出压缩后的关于工具和/或操作员的更高层的信息。

上述软件可以适用于物理i/o层、增强型分层存储器、时间主设备、背景检查、监督门控、系统控制单元和用户控制i/o层。该软件可以适于转换物理传感器输入,而无需将信息内容修改为可由增强型分层存储器管理的格式。该软件可以适于被教导和识别,并预测从物理i/o层接收到的输入模式的序列。该软件可以适于基于由物理i/o层接收到的物理传感器输入来输出压缩后的更高层的信息。

虽然已经在附图和前面的描述中详细说明和描述了本发明,但是这样的说明和描述被认为是说明性的或示例性的而不是限制性的;本发明不限于所公开的实施例。

通过研究附图、公开内容和所附权利要求,本领域技术人员在实践所要求保护的本发明时可以理解和实现所公开实施例的其他变型。

例如,单个单元可以实现权利要求中详述的若干项的功能。权利要求中的任何参考标记不应被解释为限制了范围。

例如,在本发明的实施例中,建模动作可以是采用马尔可夫链的“路径”或“序列”,由此htm的这种实施例可以“跟随”仅一条路径。

本发明进一步提供了一种遵循记忆预测框架(mpf)理论开发的架构,尤其涉及一种基于hmpf开发来处理特定的分类/预测问题的系统,将人工大脑提供为其主要处理元件。

人工大脑继而可能包括许多以层来组织并通过前馈(ff)、反馈(fb)和预测信号相互通信的处理节点。这些信号本质上是表示特定输入模式为特定世界原因的结果的可能性的概率密度函数(pdf)。整个系统可能借助也作为输出提供给网络的背景检查信号来进一步检查分层网络的状态。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1