用于自主车辆的基于反馈的控制模型的生成的制作方法

文档序号:15232827发布日期:2018-08-21 19:51阅读:142来源:国知局

本发明涉及操作自主车辆。



背景技术:

自主车辆变得越来越与日常相关并在日常的基础上使用。在自主车辆中,控制器依靠传感器来检测周围的障碍物和路面。控制器实现了能够控制转向、制动和加速以到达目的地并避免碰撞的逻辑。

本文公开的系统和方法提供了用于实现自主车辆的控制逻辑的改进方法。



技术实现要素:

根据本发明,提供一种方法,所述方法包括通过计算机系统:

接收来自一个或多个自主车辆的一个或多个乘客的反馈;

从所述一个或多个自主车辆接收传感器数据和控制数据;

根据所述反馈、传感器数据和控制数据生成行为模型;

确定所述行为模型的不确定性;以及

根据所述行为模型和所述行为模型的不确定性生成控制模型。

根据本发明的一个实施例,其中所述反馈包括一个或多个驾驶操纵评级,每个所述评级包括位置。

根据本发明的一个实施例,其中接收反馈包括接收来自多个乘客的反馈。

根据本发明的一个实施例,该方法还包括由所述计算机系统根据实验设计标准来选择所述多个乘客。

根据本发明的一个实施例,该方法还包括由所述计算机系统根据实验设计算法来选择所述多个乘客,所述实验设计算法根据潜在乘客的人口统计属性和潜在乘客的驾驶偏好处理潜在乘客以供选择。

根据本发明的一个实施例,其中根据所述反馈和传感器数据生成所述行为模型包括:根据所述反馈和传感器数据生成随机响应表面模型(ssrm),所述ssrm将反馈与由所述传感器数据指示的环境因素、在所述传感器数据中指示的所述一个或多个自主车辆的状态以及在所述控制数据中指示的由所述自主车辆采取的控制动作相关联。

根据本发明的一个实施例,该方法还包括:

由所述计算机系统根据所述反馈、传感器数据和控制数据的一部分评估所述ssrm;

由所述计算机系统确定所述ssrm不令人满意地对应于所述反馈部、传感器数据和控制数据的部分;

响应于确定所述ssrm不令人满意地对应于所述反馈、传感器数据和控制数据的部分,收集附加反馈、附加传感器数据和附加控制数据;以及

使用所述附加反馈、附加传感器数据和附加控制数据生成更新的ssrm。

根据本发明的一个实施例,其中根据所述行为模型和所述模型的所述不确定性来生成所述控制模型包括:使用所述行为模型和所述行为模型的所述不确定性执行考虑不确定性的多目标优化(ouu)算法。

根据本发明的一个实施例,其中所述传感器数据包括光检测和测距(lidar)传感器、无线电检测和测距(radar)传感器以及一个或多个摄像机中的至少一个的输出。

根据本发明的一个实施例,该方法还包括:

将所述控制模型上传到自主车辆中;

由所述自主车辆的控制器接收一个或多个传感器的输出;以及

由所述控制器使用根据所述控制模型处理的所述输出自主地驾驶所述自主车辆。

根据本发明,提供一种系统,所述系统包括一个或多个处理设备和可操作地联接到所述一个或多个处理设备的一个或多个存储设备,所述一个或多个存储设备存储可执行代码,所述可执行代码有效地使得所述一个或多个处理设备执行以下操作:

接收来自一个或多个自主车辆的一个或多个乘客的反馈;

从所述一个或多个自主车辆接收传感器数据和控制数据;

根据所述反馈、传感器数据和控制数据生成行为模型;

确定所述行为模型的不确定性;以及

根据所述行为模型和所述行为模型的所述不确定性生成控制模型。

根据本发明的一个实施例,其中所述反馈包括一个或多个驾驶操纵评级,每个评级包括位置。

根据本发明的一个实施例,其中所述一个或多个乘客包括多个乘客。

根据本发明的一个实施例,其中所述可执行代码进一步有效地使所述一个或多个处理设备根据实验设计标准来选择所述多个乘客。

根据本发明的一个实施例,其中所述可执行代码进一步有效地使所述一个或多个处理设备根据实验设计算法来选择所述多个乘客,所述实验算法设计根据潜在乘客的人口统计属性和潜在乘客的驾驶偏好处理所述潜在乘客以供选择。

根据本发明的一个实施例,其中所述可执行代码进一步有效地使所述一个或多个处理设备通过根据所述反馈生成随机响应表面模型(ssrm)来根据所述反馈和传感器数据生成所述行为模型,ssrm将反馈与由所述传感器数据指示的环境因素、在所述传感器数据中指示的所述一个或多个自主车辆的状态,以及在所述控制数据中指示的由所述自主车辆采取的控制动作相关联。

根据本发明的一个实施例,其中所述可执行代码进一步有效地使所述一个或多个处理设备执行以下操作:

根据所述反馈、传感器数据和控制数据的部分评估所述ssrm;

如果所述ssrm不能令人满意地对应于所述反馈、传感器数据和控制数据的部分,则执行以下操作:

收集附加反馈、附加传感器数据和附加控制数据;以及

使用所述附加反馈、附加传感器数据和附加控制数据来生成更新的ssrm。

根据本发明的一个实施例,其中所述可执行代码进一步有效地使得所述一个或多个处理设备通过以下方式根据所述行为模型和所述模型的所述不确定性来生成所述控制模型:使用所述行为模型和所述行为模型的不确定性执行考虑不确定性的多目标优化(ouu)算法。

根据本发明的一个实施例,其中所述传感器数据包括光检测和测距(lidar)传感器、无线电检测和测距(radar)传感器以及一个或多个摄像机中的至少一个的输出。

根据本发明的一个实施例,其中所述可执行代码进一步有效地使所述一个或多个处理设备将所述控制模型上传到自主车辆中。

附图说明

为了容易理解本发明的优点,将通过参考在附图中示出的具体实施例来呈现上面简要描述的本发明的更具体的描述。应当理解,这些附图仅描绘了本发明的典型实施例,并且因此不被认为是对本发明范围的限制,本发明将通过使用附图以附加的特征和细节来描述和解释,其中:

图1是实现根据本发明实施例的系统的部件的示意性框图;

图2是适合于实现根据本发明的实施例的方法的示例计算设备的示意性框图;

图3是根据本发明实施例的用于基于乘客反馈生成控制模型的方法的过程流程图;

图4示出了根据本发明实施例的用于接收乘客反馈的界面;

图5是示出根据本发明实施例的实验过程的设计的图;

图6a和图6b是示出根据本发明实施例的随机响应表面建模(srsm)的曲线图;

图7a和图7b是示出根据本发明实施例的srsm方法的不确定性建模的曲线图;以及

图8是示出根据本发明实施例的高斯过程回归的曲线图。

具体实施方式

参照图1,可以使用所示出的系统100来执行这里公开的方法。如在此更详细讨论的,控制器102可以为容纳控制器102的车辆执行自主导航和碰撞避免。车辆100可以具有本领域已知的任何车辆的所有结构和特征,包括车轮、联接到车轮的传动系、联接到传动系的发动机、转向系统、制动系统以及包括在车辆中的本领域已知的其它系统。

控制器102可以从一个或多个外部传感器104接收一个或多个输出。例如,一个或多个摄像机106a可以被安装到车辆100并且将图像流输出到控制器102。外部传感器104可以包括诸如超声波传感器106b、radar(无线电检测和测距)传感器106c、lidar(光检测和测距)传感器106d、sonar(声音导航和测距)传感器106e等的传感器。

控制器102可以执行接收外部传感器104的输出的自主控制模块108。自主控制模块108可以包括障碍物识别模块110a、碰撞预测模块110b和决策模块110c。障碍物识别模块110a分析外部传感器的输出并识别潜在的障碍物,包括人、动物、车辆、建筑物、路沿和其他物体和结构。特别地,障碍物识别模块110a可以识别传感器输出中的车辆图像。

碰撞预测模块110b基于车辆100的当前的轨迹或当前的预期路径来预测哪些障碍物图像可能与车辆100发生碰撞。碰撞预测模块110b可以评估与由障碍物识别模块110a识别的物体碰撞的可能性。决策模块110c可以做出停止、加速、转弯等的决策以避开障碍物。碰撞预测模块110b预测潜在碰撞的方式以及决策模块110c采取行动以避免潜在碰撞的方式可以根据自主车辆领域中已知的任何方法或系统。

决策模块110c可以控制车辆的轨迹以导航到期望的目标,同时避开障碍物。例如,决策模块110c可以启动控制车辆100的方向和速度的一个或多个驱动器112。例如,驱动器112可以包括转向驱动器114a、加速器驱动器114b和制动器驱动器114c。驱动器114a-114c的配置可以根据自主车辆领域中已知的这种驱动器的任何实施方式。

在一些实施例中,由决策模块110c做出的控制决定可以由根据本文描述的方法更新和/或生成的控制模型116来实现。在一些实施例中,障碍物识别模块110a和碰撞预测模块110b的上述功能也可以由控制模型116来实现。

控制器102可以与服务器系统118进行数据通信。例如,控制器102可以与一个或多个蜂窝通信塔120进行数据通信,所述一个或多个蜂窝通信塔120通过诸如局域网(lan)、广域网(wan)、因特网或任何其他无线或有限网络连接的网络122与服务器系统118进行数据通信。

服务器系统118可以托管或访问数据库124。数据库124可以存储反馈记录126。反馈记录126可以对应于驾驶操纵,例如转弯、经过的路段、自主停车等。每个反馈记录126可以包括特定用户或与特定用户相关联。因此,每个反馈记录126可以包括该用户的一个或多个属性128a或与其相关联,该属性可以包括用户标识符、人口统计属性(年龄、性别、职业等)以及驾驶特定属性(保守的、冒险的等)。这些属性可以由用户自己报告并通信给服务器系统118或从可用数据收集。

反馈记录126可以包括用户反馈128b。用户反馈128b可以是评级的形式(例如从1到5,其中5是最好的)。用户反馈128b指示用户对驾驶操纵的感知。例如,如果用户感到不舒服,则将给出较低的评级。用户反馈128b可以包括关于多个因素的反馈,诸如关于用户舒适度的反馈以及关于用户对安全性的感知的反馈。

反馈记录126可以记录特定位置128c(作为反馈记录的主题的驾驶操纵发生的位置)或者与其相关联。该位置可以是一定范围的位置,例如定义一段经过的道路;转弯的入口、顶点和/或出口;或其他位置范围。以这种方式,来自单个用户或一组用户的关于道路的特定特征的反馈可以被组合在一起。

反馈记录126可以包括与作为反馈记录126的主题的驾驶操纵相对应的传感器数据128d或与其相关联。传感器数据128d可以包括在包括驾驶操纵的时段期间的传感器的输出,例如在单独的驾驶操纵期间或在驾驶操纵的任一侧的某个窗口期间,例如1到10秒,或对应于位置或位置128c的范围的任一侧上的5到20英尺。

传感器数据128d可以包括在操纵期间指示车辆的环境的时段期间的外部传感器104的输出。传感器数据128d可以包括在该时段期间的其他车辆传感器的输出,诸如指示车辆的状态的传感器、诸如指示加速度、横摆率、侧倾等的加速度计。因此,传感器数据可以包括方向盘角度传感器、车轮速度传感器、车辆速度传感器、发动机转速传感器、发动机扭矩传感器、本领域已知的用于感测车辆状态的任何其他传感器的输出。

反馈记录126可以进一步包括该时段的控制数据128e。控制数据128e可以包括描述由决策模型110c采取的控制决策的数据,例如制动控制输出(其可以指示制动的定时和大小)、转向车轮角度变化(其可以由转向柱角度变化表示或齿条位置变化表示)、加速器控制输出(例如节气门开度的减小或增加)、牵引力和稳定性控制输出(制动调节、车轮之间的扭矩再分配等)或影响车辆的轨迹和操作的任何其他控制输入,特别是可能影响用户对驾驶操纵的感知的那些。

数据库124可以进一步存储控制模型116。控制模型116可以是与决策模块110c的控制模型相对应的控制模型116。可以基于反馈记录126根据这里公开的方法生成和修改控制模型116。如根据本文描述的方法产生或更新的控制模型116可以被传播到各种自主车辆,然后可以根据控制模型116执行自主驾驶。在一些实施例中,控制模型116可以对应于车辆的特定制造商和型号(例如福特翼虎(fordescape))或车辆的特定类别(例如跨界suv(运动型多功能车辆))。

如下文所述,用户可以借助于诸如移动电话、平板电脑或可穿戴式计算机的移动设备130来提供反馈。这里归于移动设备130的功能也可以由台式或膝上型计算机或任何其他类型的计算设备来执行。在一些实施例中,移动设备130可以直接与服务器118通信或者通过控制器102或一些其他中间计算设备进行通信。或者,可以通过控制器102输入反馈。例如,触摸屏可以联接到用户提供反馈所使用的控制器102,诸如车载信息娱乐(ivi)系统。或者,可以使用任何其他输入设备,诸如按钮、检测口头反馈的麦克风、键盘、光学检测器等。

图2是示出示例计算设备200的框图。计算设备200可以用于执行各种程序,诸如在此讨论那些。控制器102、服务器系统118和移动设备130可以具有计算设备200的一些或全部属性。

计算设备200包括一个或多个处理器202、一个或多个存储设备204、一个或多个接口206、一个或多个大容量存储设备208、一个或多个输入/输出(i/o)设备210和显示设备230,所有这些都联接到总线212。处理器202包括执行存储在存储器设备204和/或大容量存储设备208中的指令的一个或多个处理器或控制器。处理器202还可以包括各种类型的计算机可读介质,诸如高速缓冲存储器。

存储器设备204包括诸如易失性存储器(例,随机存取存储器(ram)214)和/或非易失性存储器(例如只读存储器(rom)216)的各种计算机可读介质。存储器设备204还可以包括可重写rom,诸如闪存。

大容量存储设备208包括各种计算机可读介质,诸如磁带、磁盘、光盘、固态存储器(例如闪存)等等。如图2所示,特定的大容量存储设备是硬盘驱动器224。大容量存储设备208中还可以包括各种驱动器,以使得能够从各种计算机可读介质读取和/或写入各种计算机可读介质。大容量存储设备208包括可移动介质226和/或不可移动介质。

i/o设备210包括允许将数据和/或其他信息输入到计算设备200或从计算设备200检索的各种设备。示例i/o设备210包括光标控制设备、键盘、小键盘、麦克风、监视器或其他显示设备、扬声器、打印机、网络接口卡、调制解调器、镜头、ccd(感光元件)或其他图像捕捉设备等。

显示设备230包括能够向计算设备200的一个或多个用户显示信息的任何类型的设备。显示设备230的示例包括监视器、显示终端、视频投影设备等。

接口(一个或多个)206包括允许计算设备200与其他系统、设备或计算环境交互的各种接口。示例性接口(一个或多个)206包括任意数量的不同网络接口220,诸如到局域网(lan)、广域网(wan)、无线网络和因特网的接口。其他接口包括用户接口218和外围设备接口222。接口206还可以包括一个或多个外围接口,诸如用于打印机、定点设备(鼠标、跟踪板等)、键盘等的接口。

总线212允许处理器202、存储器设备204、接口206、大容量存储设备208、i/o设备210和显示设备230彼此通信,以及与联接到总线212的其他设备或部件通信。总线212表示几种类型的总线结构中的一个或多个,诸如系统总线、pci总线(外围设备互连总线)、ieee(电气与电子工程师协会)1394总线、usb总线(通用串行总线)等等。

为了说明的目的,程序和其他可执行程序部件在本文中被示出为离散块,但是应当理解,这样的程序和部件可以在各种时间驻留在计算设备200的不同存储部件中,并且由处理器(一个或多个)202执行。可选地,这里描述的系统和程序可以用硬件或硬件、软件和/或固件的组合来实现。例如,一个或多个专用集成电路(asic)可以被编程以执行在此描述的一个或多个系统和程序。

参照图3,所示出的方法300可以由服务器系统118与一个或多个乘客的移动设备130以及一个或多个乘客已经行进或正在行进所处于的一个或多个自主车辆的控制器102协作来执行。

方法300可以包括接收302关于将成为测试主题的环境和乘客的一个或多个决策。步骤302可以包括从人类操作者接收这些决策。例如,操作者可能希望改善自主车辆的转弯执行。因此,测试的环境可能包括唯一转弯或大量的转弯。对于乘客,可以指定一个或多个人口统计属性(年龄、性别、职业、收入等)的一系列值。同样地,可以指定与驾驶有关的行为属性的范围,即保守的、风险规避的、冒险的等等。

方法300然后可以包括通过执行304实验设计(doe)算法来选择用于评估的一组乘客和/或位置。覆盖位置、人口统计和行为属性的所有组合是不可能的。因此,执行304doe旨在确保测试数据的多样性。下面参考图5更详细地描述执行步骤304的方法。

方法300可以进一步包括收集306用于训练和验证控制模型116的数据。如上所述,这可以包括收集关于反馈记录126的上述数据中的一些或全部。如上所述,这可以包括收集传感器数据以及用户反馈。

图4示出了用户可以提供关于驾驶操纵的反馈所使用的示例界面。该界面可以包括示出街道、地标、街道和地标的标签以及可以被包括在本领域中已知的地图中的任何其他信息的地图400。如本领域中已知的,地图可以叠加在由地图表示的区域的卫星图像上。

界面可以包括用户可以选择的界面元件404,以便提供驾驶操纵或整个驾驶的评级,例如正或负的评级、从1到n的值的选择,其中n表示没有问题并且1表示质量差。在一些实施例中,可提供多个界面元件404以用于接收关于驾驶操纵的多个方面的反馈,例如舒适度、安全性、感知的平顺性等。

界面可以包括叠加在地图上的乘车期间车辆的路径的渲染402。界面可以接收指定在乘车期间发生异常的位置406、408的用户输入。在一些实施例中,界面可以接收乘客指定的异常类型。例如,界面元件410可以使乘客能够标记乘车异常的位置。例如,在选择界面元件410之后,路径102上的后续选择可以被解释为用户指定的乘车异常。该界面还可以接收用户对乘车异常类型的指定,即乘客感觉不能很好地执行的车辆的自主行为,例如离开车道、转弯太快或偏离适当的路径等。

界面可以包括界面元件412,其使得乘客能够指定路径地图400上的选定点对应于道路异常,例如坑洼、关闭车道、道路建设、堵塞的道路、事故等。

在一些实施例中,界面可以请求关于特定位置的反馈,例如在步骤304选择的位置以供调查。因此,地图400可以包括指示哪里需要反馈的高亮部分。或者,曲线或其他路段的图像可以与用于接收关于经过所示路段的反馈的界面一起显示。

图4的界面可以在乘车之后或整个乘车过程中显示给乘客。例如,紧接经过感兴趣位置的路段之后,可以提供图4的界面,以便向用户征求关于自主车辆在该路段上的表现的反馈。

如上所述,界面可以显示在用户的移动设备130上,或者显示在与自主车辆一体的屏幕上,例如车载信息娱乐系统的触摸屏。

再次转到图3,方法300可以包括建立308一个或多个随机响应表面模型(srsm)。srsm将期望的输出、用户正反馈与诸如传感器数据的输入(车辆状态和环境因素)以及自主车辆采取的控制动作相关联。下面参考图6a和6b以及图7a和7b来描述产生srsm的方法。

方法300可以包括根据验证数据评估310srsm。具体而言,可以在步骤308使用在步骤306收集的数据的一部分来生成srsm。来自步骤306的数据的一部分,例如反馈记录126的10%或一些其他部分,可以被保持并在步骤310处被用于评估srsm。特别地,将评估310srsm对给定输入集合的用户反馈的预测能力。

如果发现312验证数据指示srsm在预测用户反馈方面不够准确,则可以重复步骤306-312,即可以收集306更多的数据以获得更准确的srsm。可以根据人的判断来设定足够准确的标准。例如,大于90%的准确度可能就足够了。例如,对于验证数据中的至少90%的输入数据集(或某个其他阈值百分比),如果srsm正确地预测反馈高于或低于某个好评性阈值(例如10个中的6个),,则可以认为srsm足够准确。

如果发现验证数据指示srsm足够准确,则方法300可以包括通过执行314考虑不确定性的多目标优化来生成控制模型116。如下面关于图8所述,步骤314可以包括生成控制模型116,以考虑用于模拟用户对给定状态(例如指示车辆状态和环境因素的传感器数据)的响应的srsm中的不确定性来优化期望属性(例如用户正反馈)的实现。以下参照图8描述执行步骤314的方式。

作为步骤314的结果的控制模型然后可以被上传316到一个或多个自主车辆,该一个或多个自主车辆然后将使用控制模型来自主地控制自主车辆。接收更新的控制模型的自主车辆可以包括在步骤306从其收集数据的相同的自主车辆,并且可以附加地或可选地包括其他自主车辆。

参考图5,均匀doe(实验设计)是一类寻求在有关区域(由输入因子的上限和下限定义)上产生均匀样本以进行物理实验的技术。它旨在尽可能多地收集整个有关区域的信息,同时使用有限的数据,并应具有以下属性:

·采样点应覆盖输入因子形成的广泛空间。

·采样点应均匀分布在输入空间上,而不会出现明显的聚集。

·如果投影到系统输入因子子集所涵盖的任何子空间中,那么采样点仍然应保持均匀分布而不聚集。

在这种情况下,执行304doe试图获得广泛范围的环境条件、广泛范围的用户类型(例如人口统计学和行为属性)以及广泛范围的控制行为(例如保守的以及侵略的)的测试数据。

执行304doe可以包括使用拉丁超立方体采样(lhs)和自适应采样(as)的组合来设计实验的输入设置,例如天气、道路状况、乘客属性等。图8提供了在二维输入空间{x1,x2}上具有16个采样点的lhs设计的说明性示例。采样点散布在空间上而没有聚集,如果投影到x1轴或x2轴上,它们形成均匀分布的分布。另一方面,由lhs提供的设计可能太受限制,因为它们可能不能从例如邀请的大量的潜在乘客中直接获得。因此,as也被执行。例如,根据lhs确定的分布可以被调整以匹配测试能力(例如大量的可用乘客),同时保持如上概述的lhs的优选属性(不聚集、均匀间隔分布等)。

例如,可以使用lhs来提供待测试的设计的初始分布(例如参数的组合)。那些不可行的,例如由于有限的乘客,可能会被过滤掉。as可以基于剩余的设计和可用的测试能力的集合来进行执行,以便在迭代过程中优化新的设计,直到找到足够数量的设计。

如上所述,执行304doe可以包括在一系列用户属性(人口统计和行为)和多个环境因素之间执行doe。因此,二维网格被替换为n维网格,n是大于3的整数,具有实现如上所述的非聚集分布的相同目标。在一些实施例中,可以对doe网格中的特定点进行一次或重复测试。在进行多个测试的情况下,可以将洞察力纳入实验变量中。

参照图6a和图6b,可以使用基于所收集的数据来建立输入因子x(例如传感器数据和在测试期间由控制器102采取的控制动作)和输出响应y(x)(例如用户反馈和/或控制效率)之间的关系{xi,yi:i=1,…,n}的方法来实现构建308srsm,其中在一些离散的采样点xi(i=1,…,n)处,yi=y(xi)。在这种情况下,每个采样点可以是在给定位置的一个驾驶操纵。构建308srsm旨在将诸如乘客安全性s、乘客舒适度c和控制效率e的期望输出与包括传感器数据128d(反映由外部传感器104检测到的车辆状态和环境因素)和控制动作数据128e的各种输入相关联。通常,控制效率e难以量化,但可以近似为执行驾驶操纵所需的时间量。因此,用户反馈128b可以被用作用于s、c和e中的一些或全部的代理。

这些收集的数据被称为训练数据。通常可以将rsm(响应表面建模)技术分类为(严格)插值(参见图6a)和回归(参见图6b)。两者都旨在建立一个函数响应作为y(x)的近似;然而,严格的插值方法构造的模型恰好通过所有的训练数据,而用回归方法构造的模型通常在匹配训练数据和生成平滑的rsm之间取得平衡。

根据它们的不同特性,它们被用于不同的目的:因为计算机模拟通常不涉及噪声和变化,所以应用插值方法来生成昂贵的计算机模拟(其导致“元模型”,意思是“计算机模型的模型”)的rsm;另一方面,回归方法适用于构建不可避免地受测试条件、系统变异性、人为错误等影响的物理实验的rsm。当面对嘈杂的实验数据时,通过每一个训练数据点不再有意义(实际上是困难的),否则以高度波动的(“之字形”)函数结束。

不管类别如何,开发rsm技术都与两个主要挑战相关联,第一个是函数形式的灵活性和适应训练数据的能力。大多数传统文献中的现有方法都假设了一些基本函数y(x)的参数函数形式。例如,线性回归假定响应是输入因子的线性组合,即y=atx+b,其中a和b是根据线性回归过程确定的因子,多项式回归假设y和x之间的多项式关系等。这样的假设极大地简化了rsm的构建,但是另一方面却缺乏适应实际工程应用的能力,在许多情况下,这些应用涉及无法用简单的函数形式来描述的复杂响应。

在现有文献中极其少见的另一挑战是量化预测中的不确定性的能力。不确定性源于缺乏知识/信息,例如在输入设置模拟或物理测试尚未进行时;并从物理变化,例如其水平几乎不可能完全知道的实验变化。在存在不确定性的情况下,工程师有必要了解构建的rsm可能“怎样错误”以及实际测试数据可以脱离模型预测的程度。然而,很少有方法可以解决这个问题。具有量化不确定性的rsm基本上表示一系列可能是基本物理函数的函数,并且在本文中被称为随机rsm,与确定性rsm相比,仅在特定输入设置x处提供单个预估式(参见图7a和7b)。

在一些实施例中,使用高斯过程回归(gpr)作为srsm方法,因为它不限于任何特定的函数形式并且可以处理有噪声的实验数据。它还有利地具有一个很好的特征,即它提供了量化预测中的不确定性的预测分布(其也可以被解释为预测方差、预测区间等)。该方法的详细描述如下。

高斯过程(gp)是特定类型的空间随机过程(srp),其可以被看作是分布在(即被索引)一些空间输入空间x的随机变量的集合。实验响应y(x)可以分解为:

y(x)=yt(x)+ε,(1)

其中yt(x)表示潜在的“真实”响应(没有实验变化的影响),是ε~n(0,λ)一个零均值的正态随机变量,其方差λ(通常假定是未知的)表示实验的变化性。yt(x)的gp模型表示为:

yt(x)~gp(m(x),v(x,x′)),(2)

其中m(x)和v(x,x')分别是gp的均值函数和协方差函数。

均值和协方差函数的常用形式是:

m(x)=h(x)tβ,(3)

其中p是x的维数,即x=(x1,x2,…,xp)t。h(x)是用于表示先验均值的用户预定义的多项式函数的矢量。β是与用于均值多项式回归的h(x)相关的系数向量,σ是随机过程中单个随机变量的先验标准差,以及ω=[ω1,ω2,…,ωp]t是粗糙度参数的矢量,用来捕捉过程的非线性。

构建实验响应y(x)的gp相当于通过最大似然估计(mle)方法来估计gp的未知参数,即φ={β,σ,ω,λ},因此可以使用数值优化策略来解决。

在上面的一般讨论中,x可以被解释为操纵中的传感器数据和控制动作的组合,并且y是用户反馈。ε是一个随机项,它说明了测试的变化(例如各种用户的偏好、我们无法捕捉到的测试条件…)。其他变量(例如m、v、h)都是构造y和x之间关系所需的潜在变量。

参考图8,在确定了φ的最可能的值之后,gp被完全确定并且可以随后用于预测其他设计处的值。使用gpr的益处在于它可以量化尚未测试的位置处的内插不确定性以及由图8中的阴影区域所描绘的预测区间表示的实验变化性。

由于与输出响应的预测相关联的不确定性被量化,所以在图3中的步骤314的优化公式中引入不确定性是有帮助的。针对ouu的高级方法的一系列研究旨在提高设计性能的稳健性,并降低其对不确定性的敏感度,这就是所谓的稳健设计优化(rdo)。ouu的另一类是基于可靠性的设计优化(rbdo),旨在以一定的置信度满足约束条件。在此公开了rdo和rbdo的组合,其中前者使乘客的舒适度c和控制效率e最大化(等同地使-c和-e最小化(min)),而后者满足安全s要求。数学公式是:

min-μc(x)+kcσc(x)

min-μe(x)+keσe(x)

满足pr[s(x)≥s目标]≥α%(5)

xl≤x≤xu

其中x是输入变量的向量,被定位在由下边界xl和上边界xu限定的有关区域内部。μ和σ分别是其下标的均值和标准差。s目标是安全要求,α%是满足安全要求的置信水平,以及kc和ke是预定义的加权因子,代表减少优化变异的相对重要性。

如本文所使用的,优化指的是寻求接近最佳解决方案并且跨越多次迭代而改进的改进过程,尽管为了获得上面公开的方法的益处,不需要获得实际的最佳解决方案。类似地,(5)的表达式指的是求最小值约束,使得对于多次迭代,“最小化”表达式中的值减小,尽管为了获得上面公开的方法的益处,实际上不需要达到“最小化”表达式的绝对最小可能值。

等式(1)-(4)详细说明如何使用gpr来构建任何输出y与输入x之间的关系,即其不是特定于任何特定应用。将这种方法应用于反馈记录126,可以构造用户的舒适度c(其等于等式(1)-(4)中的y)和输入x之间的关系。同样,我们可以得到e(在等式1-4中也可以看作是y)和x之间的关系。

在应用该方法之后,获得与图8的曲线图相似的关系。因此,μc(x)和μe(x)是图8中c和e的“均值预测”,σc(x)和σe(x)是c和e的不确定性的量化(图8中的“预测区间”)。

为了获得安全性s和输入变量x之间的关系,可以进行测试周期的计算机模拟(即使用在反馈记录126中指示的传感器数据和控制动作),并确定是否发生任何不安全的状况。

在上面的公开中,已经参考了构成其一部分的附图,并且其中通过图示的方式示出了可以在其中实施本公开的具体实施方式。应该理解的是,可以利用其他实施方式,并且可以在不脱离本公开的范围的情况下进行结构改变。说明书中对“一个实施例”、“实施例”、“示例实施例”等的引用指示所描述的实施例可以包括特定的特征、结构或特性,但是每个实施例可能不一定包括特定的特征、结构或特性。而且,这样的短语不一定是指相同的实施例。此外,当结合实施例描述特定特征、结构或特性时,认为无论是否明确描述,结合其他实施例来影响这样的特征、结构或特性在本领域技术人员的知识范围内。

本文公开的系统、设备和方法的实施方式可以包括或利用包括计算机硬件的专用或通用计算机,诸如例如一个或多个处理器和系统存储器,如本文所讨论的。在本公开的范围内的实施方式还可以包括用于携带或存储计算机可执行指令和/或数据结构的物理和其他计算机可读介质。这样的计算机可读介质可以是可以被通用或专用计算机系统访问的任何可用介质。存储计算机可执行指令的计算机可读介质是计算机存储介质(设备)。携带计算机可执行指令的计算机可读介质是传输介质。因此,作为示例而非限制,本公开的实施方式可以包括至少两种截然不同的计算机可读介质:计算机存储介质(设备)和传输介质。

计算机存储介质(设备)包括ram、rom、eeprom(电可擦可编程只读存储器)、cd-rom(只读光盘驱动器)、固态驱动器(“ssd”)(例如基于ram)、闪存、相变存储器(“pcm”)、其他类型的存储器、其他光盘存储器、磁盘存储器或其他磁存储设备、或者可用于以计算机可执行指令或数据结构的形式存储期望的程序代码手段并可由通用或专用计算机访问的任何其它介质。

这里公开的设备、系统和方法的实施方式可以通过计算机网络进行通信。“网络”被定义为能够在计算机系统和/或模块和/或其他电子设备之间传输电子数据的一个或多个数据链路。当通过网络或其他通信连接(硬连线、无线、或硬连线或无线的组合)将信息传输或提供给计算机时,计算机将该连接正确地视为传输介质。传输介质可以包括网络和/或数据链路,其可以被用来以计算机可执行指令或数据结构的形式携带期望的程序代码手段,并且可以被通用或专用计算机访问。上述的组合也应该包括在计算机可读介质的范围内。

计算机可执行指令例如包括指令和数据,所述指令和数据在处理器处执行时使通用计算机、专用计算机或专用处理设备执行特定功能或功能组。计算机可执行指令可以是例如二进制文件、诸如汇编语言的中间格式指令、或者甚至是源代码。虽然已经用结构特征和/或方法动作专用的语言描述了主题,但是应当理解,所附权利要求中限定的主题不一定限于上述描述的特征或动作。相反,所描述的特征和动作作为实施权利要求的示例形式被公开。

本领域的技术人员将认识到,本公开可以在具有许多类型的计算机系统配置的网络计算环境中实践,包括车载计算机、个人计算机、台式计算机、膝上型计算机、消息处理器、手持设备、多处理器系统、基于微处理器或可编程消费电子产品、网络pc、小型计算机、大型计算机、移动电话、pda(个人数字助理)、平板电脑、寻呼机、路由器、交换机、各种存储设备等。本发明还可以在分布式系统环境中实施,其中本地和远程计算机系统都执行任务,其通过网络进行连接(通过硬连线数据链路、无线数据链路或通过硬连线和无线数据链路的组合)。在分布式系统环境中,程序模块可能位于本地和远程内存存储设备中。

此外,在适当的情况下,本文描述的功能可以以下中的一个或多个执行:硬件、软件、固件、数字部件或模拟部件。例如,一个或多个专用集成电路(asic)可以被编程以执行在此描述的一个或多个系统和过程。整个说明书和权利要求中使用了某些术语来指代特定的系统部件。如本领域技术人员将认识到的,部件可以通过不同的名称来引用。本文档不打算区分名称不同但功能相同的部件。

应该注意,上面讨论的传感器实施例可以包括计算机硬件、软件、固件或其任何组合以执行其功能的至少一部分。例如,传感器可以包括被配置成在一个或多个处理器中执行的计算机代码,并且可以包括由计算机代码控制的硬件逻辑/电路。这里提供这些示例性设备是为了说明的目的,而不是限制性的。本公开的实施例可以在其他类型的设备中实现,如相关领域的技术人员将会知道的。

本公开的至少一些实施例已经针对包括存储在任何计算机可用介质上的这种逻辑(例如以软件的形式)的计算机程序产品。当在一个或多个数据处理设备中执行时,这样的软件使得设备如本文所述进行操作。

尽管以上已经描述了本公开的各种实施例,但是应当理解的是,它们仅通过示例而不是限制的方式呈现。对于相关领域的技术人员显而易见的是,在不脱离本公开的精神和范围的情况下,可以在其中进行形式和细节上的各种改变。因此,本公开的广度和范围不应该被任何上述示例性实施例限制,而是应该仅根据权利要求及其等同范围来限定。前面的描述是为了说明和描述的目的而提出的。这并不意图是穷尽的或将本公开限制为所公开的确切形式。鉴于上述教导,许多修改和变化是可能的。此外,应该注意的是,可以以期望的任何组合来使用前述替代实施方式中的任一个或全部,以形成本公开的另外的混合实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1