用于训练多面体分类器的设备和方法与流程

文档序号:24178921发布日期:2021-03-09 11:17阅读:205来源:国知局
用于训练多面体分类器的设备和方法与流程

1.本公开涉及用于训练多面体分类器的设备和方法。


背景技术:

2.多面体分类器允许对传感器数据进行分类,即,对为自主驾驶而拍摄的图像中的对象或者对以时间序列形式可用的传感器信息进行分类。与用于分类的神经网络相比,多面体分类器可以典型地在更短得多的时间内被训练,并且因此例如也可以在诸如嵌入式系统的具有较低计算能力的设备中被训练。
3.m. anthony的出版物“generalization error bounds for threshold decision lists”(在机器学习研究杂志(journal of machine learning research)5:189

217, 2004中)给出了用于学习(换言之,训练)多面体分类器的切割平面方法的概述。
4.合期望的是用于多面体分类器的训练方法,其以低计算努力实现经训练分类器的高准确性(借助于经训练分类器进行训练和分类这二者)。


技术实现要素:

5.具有独立权利要求1(第一示例)和15(第十八示例)的特征的方法和设备提供了一种用于快速和准确的二元分类的方法。
6.根据实施例,一种用于训练多面体分类器的方法包括:获得数据空间中的训练数据,所述训练数据包括与第一标签相关联的多个第一数据点和与第二标签相关联的多个第二数据点;以及通过基于使得所述多个第一数据点位于超平面之间的超平面对之间距离关系于使得所述多个第一数据点和所述多个第二数据点这二者均位于超平面之间的超平面对之间距离的最小化来确定超平面对的定向,从而确定超平面对;以及确定超平面对的位置,使得所述多个第一数据点位于超平面对之间,并且所述多个第二数据点通过超平面对至少部分地与所述多个第一数据点分离。本段中提到的方法提供了第一示例。
7.所述关系可以是使得所述多个第一数据点位于超平面之间的超平面对之间距离与使得所述多个第一数据点和所述多个第二数据点这二者均位于超平面之间的超平面对之间距离的比率。本段中提到的特征与第一示例组合提供了第二示例。
8.确定超平面对可以包括确定将数据空间映射到实数的线性函数的表示以及其端点给出超平面在数据空间中的位置的间隔。本段中提到的特征与第一示例至第二示例中的任何一个组合提供了第三示例。
9.超平面对之间的距离可以由间隔的长度给出。本段中提到的特征与第三示例组合提供了第四示例。
10.获得数据空间中的训练数据可以包括借助于从原始数据空间到数据空间的变换映射,将原始数据空间中的原始训练数据点集合映射到数据空间。本段中提到的特征与第一示例至第四示例中的任何一个组合提供了第五示例。
11.原始数据空间和数据空间可以是欧几里德空间,并且数据空间的维度可以高于原
始数据空间的维度。本段中提到的特征与第五示例组合提供了第六示例。
12.数据空间的维度可以比原始数据空间的维度更高一维。本段中提到的特征与第六示例组合提供了第七示例。
13.变换映射可以被配置为将原始数据空间映射到数据空间中的严格凸集的边界。本段中提到的特征与第五示例至第七示例中的任何一个组合提供了第八示例。
14.变换映射可以被配置为将原始数据空间映射到数据空间中的球面。本段中提到的特征与第一示例至第七示例中的任何一个组合提供了第九示例。
15.所述方法可以进一步包括从训练数据中移除不位于所确定的超平面之间的第二数据点。本段中提到的特征与第一示例至第九示例中的任何一个组合提供了第十示例。
16.所述方法可以包括确定将所述多个第一数据点与所述多个第二数据点分离的超平面对的序列,所述确定包括对于每个超平面对,基于使得所述多个第一数据点位于超平面之间的超平面对之间距离关系于使得所述多个第一数据点和尚未通过前一超平面对与所述多个第一数据点分离的所述多个第二数据点这二者均位于超平面之间的超平面对之间距离的最小化,来确定超平面对的定向;以及确定超平面对的位置,使得所述多个第一数据点位于超平面对之间,并且所述多个第二数据点通过超平面对至少部分地与所述多个第一数据点分离。本段中提到的特征与第一示例至第十示例中的任何一个组合提供了第十一示例。
17.确定超平面对的定向可以包括选择候选定向,并在一个或多个定向搜索迭代的过程中改进所述定向。本段中提到的特征与第一示例至第十一示例中的任何一个组合提供了第十二示例。
18.可以选择候选定向以将至少一个第二数据点与所述多个第一数据点分离。本段中提到的特征与第十二示例组合提供了第十三示例。
19.选择候选定向可以包括随机选择第二数据点并确定候选定向,以至少将所选的第二数据点与所述多个第一数据点分离。本段中提到的特征与第十二示例至第十三示例中的任何一个组合提供了第十四示例。
20.在每次定向搜索迭代中,可以通过所述定向与不同定向的加权组合来改进定向。本段中提到的特征与第十二示例至第十四示例中的任何一个组合提供了第十五示例。
21.对于要针对其训练多面体分类器的分类,第一数据点可以是正例,并且第二数据点可以是反例。本段中提到的特征与第一示例至第十五示例中的任何一个组合提供了第十六示例。
22.每个数据点可以表示传感器数据。本段中提到的特征与第一示例至第十六示例中的任何一个组合提供了第十七示例。
23.根据一个实施例,分类器训练设备被配置为实行第一示例至第十七示例的方法。本段中提到的特征提供了第十八示例。
24.根据实施例,分类设备包括根据第一示例至第十七示例的方法训练的多面体分类器。本段中提到的特征提供了第十九示例。
25.根据实施例,一种车辆包括提供输入传感器数据的至少一个传感器和包括多面体分类器的驾驶辅助系统,所述多面体分类器被训练成根据第一示例至第十七示例中的任何一个对输入传感器数据进行分类,其中驾驶辅助系统被配置为基于由多面体分类器分类的
输入传感器数据来控制车辆。本段中提到的特征提供了第二十示例。
26.一种计算机程序可以具有程序指令,所述程序指令被配置为当由一个或多个处理器执行时,使所述一个或多个处理器执行根据第一示例至第十八示例中的一个或多个的方法。
27.所述计算机程序可以存储在机器可读存储介质中。
附图说明
28.在附图中,贯穿于不同的视图,同样的参考字符一般指代相同的部分。附图不一定是为了图示比例。相反,一般将重点放在说明本发明的原理上。在以下描述中,参考以下附图描述了各个方面,其中:图1示出了自主驾驶场景中分类任务的示例;图2示出了图示用于训练多面体分类器的方法的流程图;图3图示了针对原始欧几里德空间是一维的情况的数据点变换;图4示出了借助于超平面对将训练数据集的正例与反例分离的二维图示;图5示出了图示根据实施例的用于训练多面体分类器的方法的流程图。
具体实施方式
29.以下详细描述涉及随附附图,随附附图通过图示的方式示出了本发明可以在其中实践的本公开的具体细节和方面。在不脱离本发明的范围的情况下,可以利用其他方面,并且可以进行结构、逻辑和电气改变。本公开的各个方面不一定是互斥的,因为本公开的一些方面可以与本公开的一个或多个其他方面组合以形成新的方面。
30.在下文中,将更详细地描述各种示例。
31.图1示出了用于自主驾驶场景中的分类任务的示例100。
32.在图1的示例中,车辆101(例如汽车、货车或摩托车)被提供有车辆控制器102。
33.车辆控制器102包括数据处理组件,例如处理器(例如cpu(中央处理器))103和存储器104,存储器104用于存储车辆控制器102根据其操作的控制软件和处理器103对其进行操作的数据。
34.例如,所存储的控制软件包括当由处理器103执行时使处理器实现多面体分类器107的指令。
35.存储在存储器104中的数据可以包括来自一个或多个图像源105的图像数据,例如由一个或多个相机获取的图像数据。图像可以包括表示一个或多个对象或模式的数据集合。一个或多个图像源105可以例如输出车辆环境的灰度或彩色图片。一个或多个图像源105可以响应可见光或非可见光,非可见光诸如例如红外光或紫外光、超声波或雷达波、或其他电磁或声波信号。
36.车辆控制器102可以基于图像数据确定对象的存在,例如固定对象(诸如交通标志或道路标记)和/或移动对象(诸如行人、动物和其他车辆)。
37.然后,车辆控制器102可以根据对象确定的结果来控制车辆101。例如,车辆控制器102可以控制致动器106来控制车辆的速度,例如,诸如当多面体分类器107已经将示出车辆前方环境的图像上的对象分类为行人时,致动车辆的制动器。
38.为此,自主车辆101需要知道它在道路上看到什么(行人、汽车、卡车、动物等相对于例如仅仅街道上的水坑),并对其进行正确分类,以确定适当的动作。
39.为此,多面体分类器107可以被训练至其可以准确地对对象进行分类并在对象之间进行区分(例如,行人相对于水坑)的程度。
40.多面体分类器107借助于多面体分离对数据(即,示出对象的图像)进行分类。应当注意,在以下解释中,假设数据点(例如图像)被分类,例如图像被分类为示出行人。然而,例如在自主驾驶场景中,图像(例如由相机105拍摄的)典型地包括多个对象。因此,在这样的应用中,要分类的图像例如可以是示出大的图像的单个对象的部分图像。部分图像例如可以通过将较大图像分割(例如,通过边界框的确定)成示出单个对象的部分(例如,通过相应地训练的神经网络)而从较大图像生成。
41.多面体分离也以学习线性/神经决策列表和阈值函数之名为人所知。应用是众多的,范围从视觉对象检测和分类(如图1中的自主驾驶场景中)到文本分类。为了学习(即训练)多面体分类器,可以利用切割平面过程的变化,其中找到将训练反例的子集与所有训练正例分离的超平面;该过程被迭代地执行,直到每个训练反例通过所构造的超平面中的至少一个与训练正例分离。
42.根据各种实施例,提出了被称为smm(sequential margin maximizer,顺序边缘最大化器)的独立于仿射的方法。它可以被视为位于切割平面框架内,但是基于在每次训练迭代中(至少近似地)求解优化问题,该优化问题是可处理的并且其最优值在仿射变换下是不变的,这导致smm的有保证的性能和仿射独立性。训练迭代的数量由与训练数据的几何特性和给定准确性相关的参数中的多项式来界定,所构造的多面体的边界应当以该给定准确性近似在训练数据中将正例和反例分离的集合的边界。该复杂度结果可以一般化到其中不假设训练数据的凸可分性的情况。在该一般情况下,由根据实施例的smm找到的二元多面体分类器可以由仅牵涉线性、二次和平方根项的约束的系统来描述。
43.根据各种实施例,多面体分类器(例如,用于自主驾驶的多面体分类器107)被训练成在欧几里德空间中分离两个数据点集合。这些集合包括具有第一标签的第一数据点集合(下文中的正例)和具有第二标签的第二数据点集合(下文中的反例),并且形成因此包括正例和反例的训练数据。借助于合适的数据变换,这些数据点的分离可以简化为凸多面体分离,其中目标是要找到包含所有正例并且没有反例的凸多面体。
44.表1总结了下文中使用的符号。
45.表1。
46.令d是欧几里德空间的子集。假设,其中d
+
和d-是不相交的集合。真决策边界、或者简单地真边界是在如下意义上将d
+
与d-分离的相应欧几里德空间的子集的边界:没有连续的路径在不与该边界相交的情况下将d
+
中的点与d-中的点连接。清楚的是,一般而言,存在无限多的真边界。
47.令s
+
和s-分别是d
+
和d-的子集。s
+
和s-是训练集,即包括欧几里德空间中的数据点的训练数据。一般而言,s
+
和s-可能不可被凸集分离。然而,以下陈述成立:如果x
+
和x-是位于严格凸集边界上的紧凑集合,那么存在多面体,使得并且,即p将x
+
与x-分离。
48.鉴于该陈述,根据一个实施例,给定(原始)训练数据s
+
和s-,即包括正例和反例的(原始)训练集,首先执行数据变换以确保来自训练集的所有点位于球面上。
49.图2示出了图示用于训练多面体分类器的方法的流程图200。
50.在201中,如上面提到的,来自初始欧几里德空间的初始训练数据被映射到(变换的)欧几里德空间中的(变换的)训练数据。
51.变换被标示为τ,并且(原始)训练数据集的所得子集被标示为和。在下文中,x
+
和x-简称为训练数据(包括正例的集合x
+
和反例的集合x-)。基于上面的陈述,假设τ是到严格凸集边界中的映射,则x
+
和x-可以被凸多面体分离。变换τ可以是任何合适的内射映射。
52.例如,可以使用变换(1)。
53.容易验证所有τ(x)属于以单位向量e
n+1
为中心的单位球面,该单位向量e
n+1
的前n个分量等于0,并且最后一个分量等于1。
54.另一种可能性是引入参数γ,使得参数γ可以保持为低的(例如,如在方程式(1)中为1),或者也可以取高值(诸如106)以减少由投影到球面上引起的失真。
55.图3图示了针对包括原始训练数据s
+
和s-的原始欧几里德空间是一维的情况的变换τ。
56.原始训练数据集被指示为表示原始欧几里德空间的轴303上的圆点301(正例)和圆圈302(反例)。
57.原始训练数据被映射到由球面306上的圆点304(正例)和圆圈305(反例)表示的(变换的)训练数据x
+
和x-。
58.示出了三角形307,其图示了用于(变换的)训练数据x
+
和x-的凸分离器。
59.除非根据上下文不清楚,否则分离τ(d)与τ(d-)的边界也将被称为真边界。
60.令是包含x
+
和x-的欧几里德空间之上的线性函数集合:考虑由一列函数和的间隔i
k
(其中)给出的以下线性不等式系统:(2)如果x对于方程式系统(2)是可行的,则令φ(x) = 1,并且否则φ(x) = 0。当且仅当对于所有,φ(x)=1,并且对于所有,φ(x)=0时,映射φ被称为用于x
+
和x-的(凸)多面体分类器。这意味着φ是由方程式系统(2)定义的多面体的指示函数。
61.根据实施例,在多面体分类器的训练处理的每次迭代中,方程式系统(2)的线性不等式之一可以视为被确定。
62.为此,在302中,至少近似地求解优化问题:(3)。
63.在迭代k处,优化问题(3)被求解,其中是正例的集合,并且是反例
的当前子集。找到的解是类的非零线性函数z,其(至少近似地)最小化目标函数f。给定方向z,令h1和h2是界定正例的集合x
+
的平行超平面。
64.进一步地,令g1和g2为与h1和h2平行的整个训练集平行的整个训练集的支撑超平面。
65.如图4中所图示的,边缘标示位于g1和h1或h2和g2之间的点的集合。
66.图4示出了借助于超平面对401、402将正例(由圆点表示)与反例(由圆圈表示)分离的二维图示。
67.超平面对401、402是超平面h1和h2。超平面g1和g2对应于整体训练集的“边界框”的界线。
68.直观地,在每次迭代中,确定方向,使得仅包含反例的相应边缘404相对于该方向上的整个训练集的宽度被最大化。
69.优化问题(3)的解是对应于以下集合的非零线性函数:上面形式的集合称为板(slab)。在第k次迭代中,相应的线性不等式(其中)被添加到在训练迭代内针对被相继建立的当前系统(2)。
70.(3)的目标函数不是凸的,但是如可以示出的,优化问题(3)在多项式时间内仍然是可求解的。此外,根据问题公式表述,得出其最优值在线性变换下被保持,并且最优集的图像是变换的问题的最优集。
71.对于优化问题(3)的重新表述,在下文中解释几个几何术语。紧凑集合s在方向h上的宽度是法线为h的s的两个平行支撑超平面之间的距离。该方向宽度由w(s, h)标示:所有方向之上的最小宽度简称为s的宽度并且由w(s)标示。s的高度是s在所有方向之上的最大宽度,其由h(s)标示。集合s的凸包由ch(s)标示。
72.为了方便起见,线性函数也被当作其分量的向量。例如,如果,其中a是向量,那么这也写成z = a。
73.在上面的宽度定义的情况下,(3)的函数f可以就和在相应方向上的宽度而言写出:(4)最小化函数f等同于1
ꢀ-ꢀ
f(z)的最大化,其可以被解释为的支撑板未覆盖的区域相对于整个训练集的支撑板的最大化。该区域是边缘,并且优化问题(3)也相应地被称为边缘最大化问题。
74.换言之,通过确定(至少近似地)求解优化问题(3)的线性函数z,确定超平面对h1和h2,其定义了包括正例的板405。
75.当在第k次迭代中已经找到超平面对、或者等同地线性函数、或者进一步等同地超平面方向(即,超平面法向量)时,在203中,从未分类的反例集合中消除不在相应板中的
反例,并且在202中基于该更新的训练集(即,不具有第k次迭代中消除的反例(即,不在第k次迭代的板中的反例)的第k次迭代的训练集)执行下一次迭代。
76.换言之,在每次迭代之后,位于边缘404内的所有反例都被移除,并且优化问题利用更新的训练集再次(至少近似地)被求解。
77.当在203中消除了不在当前板中的反例之后,在训练集中没有留下反例时,该过程结束。
78.图2的训练过程可以表达为如下算法。
79.。
80.在while循环的每次迭代处,通过从移除不在板中的所有点来构造下一个训练集,其中通过(至少近似地)求解(3)来找到。
81.训练处理的迭代对应于算法1的while循环的迭代。
82.对于算法1的变体,由于具有不同真标签的两个点不能距彼此零距离,因此假设对于每个训练示例,在某个距离ρ > 0内的所有点都具有相同的标签。然后,根据各种实施例,为了确保对于每个正例,在迭代k处找到的板的边界不比ρ更接近,可以在算法中引入对i
k
的以下修改:由于预先不知道合适的ρ,因此可以向算法1添加以下步骤:如果,则。
83.也就是说,如果在当前迭代中没有反例可以消除,则ρ除以2,这保证了算法终止并且将正例与反例分离。ρ的起始值例如是0.01或0.001。
84.可以示出,算法1的每次迭代在多项式时间内运行。
85.令(相应地,)标示在s之上由最小化的(相应地,最大化的)的的函数集合:更正式地,如果s是d的有限子集并且具有有限维度,例如固定次数的多项式集合,那么和是多面体锥。
86.应当注意,对于任何非零γ,f(z) = f(γz) 。因此,存在最优解z,使得(5)考虑中的f并且令和(相应地,和)是相应集合上f的最小化器(相应地,最大化器)。然后可以借助于求解(6)来找到不比f差的函数:(6)这里,方程式由(5)得出。边缘最大化问题可以简化为像优化问题(6)一样的许多优化问题。正式地,可以示出以下陈述:令x0和x1是有限集合。然后问题(3)简化为形式(6)的问题。
87.这是因为对于每一个,可以写出问题(6),该问题(6)的解不比f差。然后陈述通过将x1和x0的所有可能选择考虑在内而得出。
88.基于此,可以示出优化问题(3)在多项式时间内是可求解的。
89.应当注意,根据优化问题(3)的公式化表述,直接得出,线性变换不改变最优值,并且最优集的图像是变换的问题的最优集。
90.多面体分类器的重要方面可以在它们的紧凑性中看出,即,典型地优选其决策基于较少数量超平面的分类器。定义由上述训练处理构造的多面体分类器的不等式的数量等于所执行的迭代的数量。因此,训练处理的迭代复杂度实际上就是所得分类器的复杂度。
91.利用每次迭代,当前的线性不等式系统为训练集提供了比在先前步骤处考虑的分离器更准确的分离器。因此,复杂度的问题是为了实现给定的准确性需要多少次迭代。
92.对训练处理的分析产生了对于迭代数量的受保证的复杂度估计,直到当前不等式系统定义了近似二元分类器,即,以给定的准确性近似将反例与正例分离的边界的二元分类器。更精确地,如果二元函数仅在训练集中的点与真边界之间的距离不大于ε的情况下给该点分派错误标签,则该二元函数是用于正例和反例的集合的ε-近似(二元)分类器。
93.使用微积分和解析几何的方法,可以示出,对于任何固定的维度,由上述训练处理构造的ε-近似二元分类器的复杂度由与训练数据的几何特性相关的参数中的多项式和1/ε来界定。
94.此外,复杂度结果可以一般化到不假设凸可分性的情况。在该情况下,近似分类器由仅牵涉线性、二次和平方根项的约束的系统来描述。如同在凸情况下一样,仅仅取决于给定的准确性和与训练数据的几何特性相关的参数,所找到的约束的数量由多项式界定。
95.在实际应用中,尽管(3)可以在多项式时间内求解,但是搜索优化问题(3)的精确解在计算上可能过于昂贵。鉴于此,在上面示例中,已经陈述了优化问题至少被近似求解。这,以及边缘的最大化,或者换言之,基于使得多个第一数据点位于超平面之间的超平面对之间距离关系于使得多个第一数据点和多个第二数据点这二者均位于超平面之间的超平面对之间距离的最小化的对超平面对的定向的确定,可以理解为基于最大化边缘/最小化超平面对之间的相对距离的目标来确定线性函数z/确定方向/确定超平面对。这可以理解为在迭代中,执行对线性函数z/方向/超平面对的搜索,其中搜索旨在最大化边缘/最小化超平面对之间的相对距离,并且在搜索过程中至少存在某种改进(即使没有达到全局最优)。这意味着执行对最优解的搜索,但是典型地将不会确定全局最优解。至少,例如,可以在每次迭代中近似确定局部最优。
96.在下文中,作为基于这样的近似优化的实施例的示例,在下文中描述了用于搜索优化问题(3)的解的随机化启发式算法。
97.直到没有对f的当前值的改进的连续迭代数量不超过给定的限制(例如,该限制是1,即在一次迭代中没有改进,或者该限制是例如3;应当注意,这些迭代是对优化问题的解的迭代的搜索(即定向搜索迭代),而不是算法1的while循环的迭代):1.从x0中随机选取x,并且令。x是f在之上的独特的最大化器,其保证在当前迭代将从移除至少一个示例;2.可以执行需要求解线性规划(即线性优化问题)的可选步骤:确定x
i
和,使得和(i = 1,2),并且找到对于(6)的(至少近似的)最优解z;3.从[-1,1]之上的均匀分布中随机选取方向r。尝试沿着r和-r改进f(z):如果是改进方向,从z移动直到与锥和之一的边界的交点;在该方向上。令z为新的点。对此重复,直到没有找到任何改进或者超过这样的局部搜索迭代的给定数量(例如,5个这样的局部定向/方向搜索迭代的限制);4.返回。
[0098]
应当注意,即使跳过了步骤2,上面的启发法也起作用。如果对其主循环迭代数量的限制足够大,那么倘若包括步骤2,则启发法有高概率找到最优解。如果步骤2被跳过,并且步骤3处的迭代数量足够大,那么启发法有高概率找到在给定的近似误差内的解。
[0099]
为了使分类结果更准确,根据一个实施例,采用以下方法来预测一个对象(例如,图像或一般地不属于训练数据集的传感器数据元素)或多个对象的标签:找到多面体p
+
,使得p
+
包含x
+
并且不包含x-的任何点(使用所描述的训练方法);找到多面体p-,使得p-包含x-并且不包含x
+
的任何点(即,借助于上面具有x
+
和x-的“反向角色”的训练方法学习第二多面体;通过以下方式定义分类器(用于预测对应于数据点的对象的标签,如果必要则该数据
点被映射到变换的空间):计算从数据点到定义p
+
的半空间(例如,到经训练多面体的所有超平面对的“板”)的距离之和ρ+以相同的方式,为p-计算ρ-如果ρ+ < ρ-则返回1(标签为正),否则返回0(标签为反)。
[0100]
训练多面体分类器可以对训练数据集使用n折交叉验证(例如,10折交叉验证)。
[0101]
实验示出的是,上面的方法在准确性方面表现优于常规的凸多面体机(cpm)。更进一步地,当包括可选步骤2时,多面体的描述的复杂度可以保持得更低得多。
[0102]
总之,根据各种实施例,提供了如图5中所图示的方法。
[0103]
图5示出了流程图500,其图示了根据实施例的用于训练多面体分类器的方法。
[0104]
在501中,在数据空间中获得训练数据,该训练数据包括与第一标签相关联的多个第一数据点和与第二标签相关联的多个第二数据点。
[0105]
在502中,通过确定超平面对的定向来获得(至少基本平行的)超平面对。基于使得多个第一数据点位于超平面之间的超平面对之间距离关系于使得多个第一数据点和多个第二数据点这二者均位于超平面之间的超平面对之间距离的最小化来确定定向。确定超平面对的位置,使得多个第一数据点位于超平面对之间,并且多个第二数据点通过超平面对至少部分地与多个第一数据点分离。
[0106]
根据各种实施例,换言之,搜索超平面对(例如,在多次迭代中的每次迭代中),使得该超平面对之间的相对距离尽可能低。超平面对由它们的定向(例如,在法向量方面)和它们的位置(其特别地定义它们的距离,例如沿着法向量)给出。
[0107]
该(第一)超平面对中的超平面之间的相对距离是相对于第二超平面对中的超平面(其可以被视为相同的超平面,即具有相同定向但在不同位置处的超平面)之间距离的距离,该第二超平面对具有与(第一)超平面对相同的定向,但是其被隔开,使得(当前迭代的)所有训练数据点位于它们之间。换言之,第一超平面对包围具有第一标签的所有数据点,并且第二超平面对包围所有数据点(即,具有第一标签和第二标签这二者)。在每个超平面对中,超平面尽可能彼此接近。第一对超平面之间的相对距离是第一对超平面的距离与第二对超平面的距离之间的比率。
[0108]
确定超平面的定向以使该相对距离尽可能低(其中最小化典型地受可用于确定的有限时间的限制)可以被视为等同于如上所述最大化(尽可能远)边缘,或者说明性地,在当前迭代中(在包含被当前超平面对“切断”的反例的空间方面)最大化多面体分离器“得到的空间”。
[0109]
如上面所解释的,图5的方法可以用于训练在自主驾驶场景中用于对象分类的分类器。然而,该方法一般可以用于训练多面体分类器,以用于分析任何种类的传感器信息(例如传感器信息的时间序列),特别是在嵌入式系统中的传感器信息。
[0110]
当输入数据集(包括训练数据)是时间序列时,图5的方法尤其快速和准确。在该情况下,通过权利要求1的训练方法找到的近似分类器的复杂度由参数中的多项式界定,该参数仅与给定准确性和所讨论的时间序列的几何特性相关。相应的多项式的次数是常数,其独立于数据的维度。
[0111]
图5的方法可以由一个或多个处理器来执行。术语“处理器”可以理解为允许处理
数据或信号的任何类型的实体。例如,可以根据由处理器执行的至少一个(即,一个或多于一个)特定功能来处置数据或信号。处理器可以包括模拟电路、数字电路、复合信号电路、逻辑电路、微处理器、中央处理单元(cpu)、图形处理单元(gpu)、数字信号处理器(dsp)、可编程门阵列(fpga)集成电路或其任何组合,或者由其形成。实现相应功能的任何其他方式(将在下面对其进行更详细的描述)也可以理解为处理器或逻辑电路。应当理解,本文详细描述的方法步骤中的一个或多个可以由处理器通过该处理器执行的一个或多个特定功能来执行(例如,实现)。
[0112]
尽管本文已经图示和描述了特定的实施例,但是本领域普通技术人员应当领会,在不脱离本发明的范围的情况下,各种替代和/或等同的实现方式可以代替所示出和描述的特定实施例。本申请旨在覆盖本文讨论的特定实施例的任何改编或变型。因此,本发明旨在仅由权利要求及其等同物来限制。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1