生成车辆内部的至少一个状态的置信值的系统和方法与流程

文档序号:18167071发布日期:2019-07-13 09:41阅读:161来源:国知局
生成车辆内部的至少一个状态的置信值的系统和方法与流程
本申请涉及一种用于生成车辆内部的至少一个状态的置信值的系统和方法。
背景技术
:不同级别的车辆自动化需要不同级别的驾驶员意识。只要车辆没有完全自动化并能够处理所有交通状况,就仍需要人类驾驶员能够收回控制权。响应时间可以基于从几秒到几分钟的自动化级别而不同。为了评估驾驶员意识水平,车辆配备有不同的传感器,例如,座位内部的用于检测座位中人的存在的传感器、方向盘中的用于检测手是否在方向盘上的传感器,以及驾驶员面对的用于分析头部和眼睛的移动或眼睛关闭率的摄像机。然而,所有上述系统都有局限性,并且可能容易出错,或者在输出中不明确。例如,座位中的压力传感器可能无法正确区分座位中的人与物体,方向盘传感器例如不能区分手或膝盖的接触,并且可能被其它物体误导,例如,轻敲方向盘的一罐苏打水可能被识别为手。驾驶员面对的摄像机在视野方面受到限制,并且系统的可用性取决于面部的取向以及例如眼睛或其它面部特征点的可见性。融合这些传感器中的一个或更多个的信息使得能够增加驾驶员状态估计的置信水平。监测车辆内部的汽车级飞行时间摄像机传感器(例如,用于手势控制系统)自2015年起在市场上销售。该传感器提供用于像素阵列的距离信息(即,深度图)和幅度测量。利用这样的传感器数据,例如能够在3d空间中定位人手,包括手掌心、手指的位置和取向,以及这些位置的3d轨迹,例如先前位置的历史。另外,可以导出手上的特征点的3d速度矢量或者沿着食指的3d指向矢量。然而,可以将相同的传感器用于许多不同的应用。除检测开放空间手势外,例如,还可以将该信息用于传感器视野内的高级接近感测,例如,靠近显示器或其它控制部件的手、放在方向盘上的手等,并且尤其用于监测车辆中的人的状态。例如,如果传感器的视野完全或部分覆盖包括驾驶员和/或乘客在内的车辆的前排座位区域,则可以将手部检测和跟踪的特征范围扩展至其它身体部位,如头部和肩部、臂部、躯干、腿部等。一个突出的示例是头部姿势(即,3d位置和取向)的估计,例如用于预测这个人在看向哪里。存在几种方法来基于3d图像或点云数据提取例如人体模型的3d骨架。该模型可以将测量数据与人体解剖结构的约束相结合,以在存在含噪输入数据的情况下稳定姿势估计结果。这样的模型可以逐帧地(单个时间步长)拟合数据,或者在多个帧(时间系列)上跟踪,以考虑到结果的一些时间平滑化。身体部位(例如,手)相对于车辆部件(例如,方向盘)的相对位置可以被用来实现像检测方向盘上的手一样的特征。另外,该数据可以用于估计座位中人的尺寸(或重量)或人与安全气囊的距离。全身姿势估计方法通常需要大量处理功率以在实时帧速率下实现高性能并且不适于低成本嵌入式平台。技术实现要素:本发明的一基本目的是,提供一种用于生成车辆内部的至少一个状态的置信值的系统,其中,该系统生成具有高准确度的结果,而不需要人员、车辆内部的详细模型或对不同身体部位相对于车辆内部的位置的明确了解。而且,该系统应当不需要大量传感器。另外,本发明的一目的是,提供一种包括用于生成车辆内部的至少一个状态的置信值的系统和方法的车辆。基于本发明的目的由独立权利要求的特征来满足。本发明进一步的有利开发和方面在从属权利要求中加以阐述。在本应用的第一方面,提供了一种用于生成车辆内部的至少一个状态的置信值的系统。所述系统包括成像单元和具有经训练的卷积神经网络的处理单元。而且,给出了可能存在于车辆内部的多个预定的可能状态。例如,预定状态中的一个可以描述驾驶员座位被占据的状态,预定状态中的另一个可以指有人占据驾驶员座位的状态,而第三状态可以描述驾驶员将手放在方向盘上的状态。所述成像单元被配置成拍摄车辆内部的至少一个图像。所述处理单元被配置成接收来自所述成像单元的所述至少一个图像,并且将所述至少一个图像输入到卷积神经网络中。所述卷积神经网络被配置成使用所述至少一个图像,以便生成车辆内部的所述多个可能状态中的每个状态各自的似然值。各个状态的似然值表示车辆内部存在该状态的可能性。例如,在观察到状态“驾驶员座位被占据”的情况下,针对该状态的似然值给出驾驶员座位被占据的可能性。另外,所述处理单元计算针对车辆内部的多个预定状态中的至少一个状态的置信值。该置信值根据由所述卷积神经网络生成的一个或几个似然值来计算。所述系统生成具有高准确度的结果,而不需要人员、车辆内部的详细模型或对不同身体部位相对于车辆内部的位置的明确了解。代替在第一步骤中检测和跟踪各个身体部位或估计身体模型以在第二步骤中导出所述置信值,在本发明中,在一个步骤中直接从输入图像导出针对车辆中状态的一个或更多个置信值。为了生成所述置信值,所述系统仅需要作为传感器的成像单元。其它传感器(诸如座位内的座位占据传感器或方向盘传感器)不是强制性的。针对车辆内部的一个或更多个状态的置信值可以用于导出高级特征,诸如驾驶员注意/分心。置信值可以与来自其它传感器(例如,驾驶员面对的摄像机、方向盘传感器以及座位占据传感器)的数据相融合。潜在地存在于车辆内部的状态可以选自下面的状态组:驾驶员座位被占据、有人占据驾驶员座位、成年人占据驾驶员座位、驾驶员把手放在方向盘上、驾驶员处于驾驶位置、驾驶员与物体交互、驾驶员座位以外的预定座位被占据、人与预定物体交互、以及驾驶员座位被预定物体占据。在一个实施方式中,可以选择多个前述状态,并且将所述卷积神经网络配置成,使得其根据由所述成像单元拍摄的所述至少一个图像生成每个所选状态的似然值。在一优选实施方式中,所述成像单元是3d(三维)成像单元。所述3d成像单元例如可以是飞行时间摄像机。飞行时间摄像机基于已知光速,针对图像中的每个点测量摄像机与该主体之间的光信号的飞行时间,来解析距离。飞行时间摄像机例如可以包括发出红外光(尤其是脉冲红外光信号)的红外发光二极管,以及在该红外光被主体反射之后接收该红外光的摄像机传感器。飞行时间摄像机具有抑制环境光(例如,日光)的优点。因此,仅拍摄来自有源红外照明的红外光。另选3d成像单元例如包括立体视觉摄像机或结构化光摄像机或雷达系统。所述3d成像单元还可以通过颜色敏感图像传感器来增强。作为3d成像单元的另选方案,可以使用其它成像单元,例如,没有深度信息的2d摄像机,如灰度或彩色成像器。潜在存在于车辆内部的状态可以被布置成包括多个层级的分层结构(如分层树结构),如下面结合图2至图5的描述更详细地讨论的。处理单元可以被配置成,通过将所述车辆内部的所述多个状态中的各个状态的似然值乘以比该状态的层级更高的每个层级中的同一状态的似然值,来生成该状态的置信值,其中,所述似然值的乘积包括来自贡献所述乘积的每个层级的同一似然值。针对车辆内部的多个状态中的每一个,可以预定用于计算所述似然值乘积的处于更高层级的状态。用于计算所述似然值乘积的这些状态可以由分层树结构中的特定路径给出,如下面结合图2说明的。在一个实施方式中,在所述分层结构中存在包括不互斥的两个或更多个状态的至少一个层级。这意味着可能同一层级中的两个或更多个状态可以同时存在于车辆内部。例如,层级中的一个可以包括状态“驾驶员与物体交互”和状态“驾驶员不在其位置”。对于驾驶员与诸如智能电话的物体交互的情况以及驾驶员不在驾驶员位置(例如,他看着智能电话)的情况来说,这两种状态可以同时为真。在一个实施方式中,最高层级包括状态“驾驶员座位被占据”。尤其是,第二高层级包括状态“有人占据驾驶员座位”,并且第三高层级包括状态“成年人占据驾驶员座位”。在一个实施方式中,借助于示出了车辆内部场景的预定图像来训练所述卷积神经网络。由所述预定图像示出的场景是已知的。所述预定图像被输入到所述卷积神经网络中,并且针对所述预定图像中的每一个,所述卷积神经网络生成所述多个状态的似然值。而且,因为所述预定图像示出的场景是已知的,所以可以为所述预定图像中的每一个提供注释矢量,其中,所述注释矢量表示理想目标函数,并且针对相应预定图像的注释矢量表示所述多个状态中与所述相应预定图像相关的状态。例如,如果所述预定图像中的一个示出了放置在驾驶员座位上的盒子,那么注释矢量表示状态“驾驶员座位被占据”和状态“有人占据驾驶员座位”与该图像相关,但状态“成年人占据驾驶员座位”与该图像无关。此外,针对所述预定图像中的每一个计算损失函数或成本函数,其中,仅与所述对应预定图像相关的状态的似然值贡献该损失函数。因此,在上面的示例中,由所述卷积神经网络计算出的针对状态“驾驶员座位被占据”和状态“有人占据驾驶员座位”的似然值贡献所述损失函数,而针对状态“成年人占据驾驶员座位”的似然值不贡献所述损失函数。训练所述卷积神经网络的任务是最小化损失函数的输出。可以提供训练单元,其将所述预定图像输入到所述卷积神经网络中并计算所述损失函数。根据本应用的第二方面,提供了一种包括如上所述系统的车辆。根据本应用的第三方面,提供了一种用于生成车辆内部的至少一个状态的置信值的方法,该方法包括以下步骤:拍摄车辆内部的至少一个图像;将所述至少一个图像输入到卷积神经网络中;借助于所述卷积神经网络,生成所述车辆内部的多个状态中的每一个各自的似然值,其中各个状态的似然值表示所述车辆内部存在该状态的可能性;以及根据由所述卷积神经网络生成的似然值,来生成所述车辆内部的所述多个状态中的至少一个状态的置信值。根据第三方面的方法可以包括与上面结合根据第一方面的系统描述的相同的实施方式。附图说明下面将参照示例性实施方式并且参照附图,以示例性方式对本发明进行更详细的描述。所述附图示出如下:图1是用于生成车辆内部的至少一个状态的置信值的系统的示例性实施方式的示意图;图2是分层树结构的示例性实施方式;图3是包括车辆内部的预定状态的分层树结构的示例性实施方式;图4是包括车辆内部的预定状态的分层树结构的另一示例性实施方式;图5是包括车辆内部的预定状态的分层树结构的又一示例性实施方式;图6是包括针对车辆内部的驾驶员座位和乘客座位的预定状态的分层树结构的示例性实施方式;以及图7是用于训练卷积神经网络的分层树结构的示例性实施方式。具体实施方式图1例示了根据本应用的第一方面的用于生成车辆内部的至少一个状态的置信值的系统10的示例性实施方式。根据本应用的第二方面,系统10可以安装在车辆中。下面,作为根据本应用的第三方面的用于生成车辆内部中的至少一个状态的置信值的方法的示例,描述了系统10和系统10的功能。系统10包括成像单元11和具有卷积神经网络13的处理单元12。成像单元11安装在车辆上并且拍摄车辆内部的图像14。图像14被提供至处理单元12。处理单元12将图像14输入到卷积神经网络13中。卷积神经网络13输出针对车辆内部的可能状态的似然值,其中,各个状态的似然值表示车辆内部存在该状态的可能性。所述状态被布置成分层结构。在图2中例示了包括多个层级的这种分层结构的示例。图2的分层结构示例性地包括四个层级,其中,最高层级被表示为“级别1”,第二高层级被表示为“级别2”,第最高层级被表示为“级别3”,而第四最高层级被表示为“级别4”。在每个层级中,布置一个或更多个判定节点。判定节点在图2中具有椭圆形形状并且用dn1至dn6表示。每个判定节点描述可能存在于车辆内部的相应预定义状态。每个判定节点后面跟着具有图2中矩形形状的恰好两个结果节点。由于将恰好两个结果节点指配给每个判定节点,因而可以使用二元答案来回答判定节点,如布尔值,或者是真还是假,或者是或否。结果节点表示相应状态是否存在于车辆内部。在图2的实施例中,每个结果节点都表示“是”或“否”。因此,判定节点中的问题的答案描述了待分析车辆内部的给定场景。每个结果节点都是父级判定节点问题的具体答案。相应父级判定节点问题的答案创建了可以指配给判定节点的标签。例如,如果判定节点中的一个表示状态“驾驶员座位被占据”,那么该状态可以存在于所拍摄到的图像14中所示的给定场景中,即,答案为“是”,或者该状态不存在于给定场景中,即,答案为“否”。如果针对给定场景的答案为“是”,那么可以将标签“驾驶员座位被占据”指配给判定节点。在另一情况下,如果该答案为“否”,那么可以将标签“驾驶员座位为空”指配给判定节点。结果节点可以使判定节点作为下一较低层级中的子级节点。在上面给出的示例中,指配给表示状态“驾驶员座位被占据”的判定节点的结果节点“是”例如可以使判定节点“有人占据驾驶员座位”作为子级节点。由于子级节点,因而判定节点和结果节点的结构是树结构。该树结构不一定是二元树结构,即,结果节点可以再次使多个判定节点作为子级节点。结果节点也可以是树中的叶级节点,即,结果节点没有进一步的子级节点。卷积神经网络13生成判定节点所描述的每个状态的相应似然值。因此,卷积神经网络13的输出层是1维矢量,其中该矢量的每个组元都表示一个判定节点,即,一个状态。在一个实施方式中,卷积神经网络13的输出值可以被映射至0到1的范围,其中,0对应左侧结果节点(“否”),而1对应右侧结果节点(“是”)。卷积神经网络13输出0到1之间的标量值,其可以被解释为针对给定判定节点的可能性,即,由判定节点所描述的状态存在于由成像单元11拍摄的场景中的可能性。卷积神经网络13的每个输出值直接对应于右侧结果节点的可能性,即,1意指针对给定判定节点中的问题的答案在右侧节点中的最大可能性,而0意指该答案极不可能在右侧结果节点中。模拟针对左侧结果节点的可能性可以被计算为1减去针对右侧结果节点的可能性。其可以被解释为“不是”右侧。可以另选地选自其它输出范围(例如,从-1到1),因此必须调整成针对似然值的映射。用于将卷积神经网络13的输出值映射到似然值的映射函数可以是线性或非线性函数,例如,s形函数。处理单元12生成判定节点所描述的状态中的至少一个状态的置信值15。为了生成给定判定节点的置信值15,将该判定节点的似然值乘以其父级节点的似然值。例如,通过将判定节点dn1、dn2以及dn3的似然值相乘来计算判定节点dn3的置信值15。通过将判定节点dn1、dn2、dn3以及dn4的似然值相乘来计算判定节点dn4的置信值15。通过将判定节点dn1、dn2、dn3以及dn5的似然值相乘来计算判定节点dn5的置信值15。通过将判定节点dn1、dn2、dn3以及dn6的似然值相乘来计算判定节点dn6的置信值15。因此,针对由所述判定节点中的一个表示的每个状态,通过将该状态的似然值乘以比该状态更高的预定数量层级的同一状态的似然值来生成相应置信值,其中,该预定数量的状态由图2中所示的树结构给出。此外,针对布置在特定层级中的给定状态,该似然值乘积包括来自以高于该特定层级布置的每个层级的同一似然值。与标准卷积神经网络相比,输出矢量中的单个组元(即,单个输出神经元)没有完全反映针对给定问题的答案。针对不是根节点的所有判定节点,所得出的可能性必须与从该给定判定节点到其所有父级节点的路径上的所有其它判定节点的可能性相结合。所得出的组合可能性与给定结果中的置信度成比例。置信度越高,可能性就越大。如果针对给定结果节点的置信度超过可配置阈值,那么对应场景标签被指配。图3示出了图2的、其中将预定义状态指配给判定节点dn1至dn6的树结构。由于分层结构,因而状态可以以分层方式组织。该判定指明dn1被指配给高级状态“驾驶员座位被占据”。该状态可以存在于车辆内部,即,驾驶员座位实际上被占据,否则驾驶员座位是空的。从指配给判定节点dn1的高级状态开始,在下一较低层级中的结果节点“驾驶员座位被占据”之后,判定节点dn2可以增加信息的级别。在本示例中,状态“有人占据驾驶员座位”被指配给判定节点dn2。如果在场景中检测到坐在驾驶员座位上的人则该状态可以为真,或者如果物体占据驾驶员座位则为假。结果节点“有人占据驾驶员座位”在下一较低层级中通过指配给判定节点dn3的状态“成年人占据驾驶员座位”来进一步细化,这可能是真的(即,成年人占据驾驶员座位),或者是假的(即,一个儿童占据驾驶员座位)。结果节点“成年人占据驾驶员座位”之后是判定节点dn4的状态“驾驶员与物体交互”,判定节点dn5的状态“驾驶员不在位置上”以及判定节点dn6的状态“驾驶员双手在方向盘上”。指配给判定节点dn4至dn6的每个状态可以在车辆内部存在(“是”)或不存在(“否”)。图3中所示的层级4的状态dn4至dn6不是互斥的。例如,如果驾驶员与物体交互并且未处于驾驶位置上,那么指配给判定节点dn4和dn5的两个状态同时存在。此外,如果驾驶员将手放在方向盘上,但不是处于驾驶位置(例如,他透过侧窗看),那么指配给判定节点dn5和dn6的两个状态同时存在。换句话说,通过分层树结构可以存在可以同时为真的两条或更多条路径。例如,包括判定节点dn1、dn2、dn3以及dn4的路径和包括判定节点dn1、dn2、dn3以及dn5的路径可以同时为真。通常来说,本应用中描述的分层树结构可以在跟随下一更高层级中的同一结果节点的至少一个层级中包含多个判定节点。每个结果节点都可以没有或具有恰好一个或一个以上判定节点作为子级节点,其中每个子级节点都通过分层树结构创建新路径。每个判定节点都独立于其同属,而由同属创建的路径彼此独立。图3的树结构可以进一步细化,如图4和图5所示。在图4中,结果节点“一个物体占据驾驶员座位”链接至判定节点dn7的子状态“儿童座椅占据驾驶员座位”、判定节点dn8的“其它小物体占据驾驶员座位”以及判定节点dn9的“其它大物体占据驾驶员座位”。判定节点dn7至dn9中的每一个都可以通过是或否来回答。图5中所示的树结构基于图4的树结构。在图5的树结构中,结果节点“驾驶员与物体交互”链接至判定节点dn10的子状态“驾驶员与智能电话交互”、判定节点dn11的“驾驶员与报纸交互”、判定节点dn12的“驾驶员与瓶子交互”以及判定节点dn13的“驾驶员与其它物体交互”。判定节点dn10至dn13中的每一个都可以通过是或否来回答。在一另选树结构中,可以将判定节点“驾驶员与物体交互”、“驾驶员不在位置上”以及“驾驶员双手在方向盘上”链接至结果节点“有人占据驾驶员座位”。在这种情况下,判定不取决于人的年龄,即,无论占据驾驶员座位的人是成人还是儿童。其主要取决于后来的使用情况以及对某个问题陈述感兴趣的组合。可以基于所提出的概念进一步扩展该概念。可以为一个或几个乘客座位分配单独的树。这种树的结构可以与图3至图5所示的树结构不同,因为并非所有节点都可以应用于乘客座位。通过引入公共根结果节点,可以将用于驾驶员的树和用于乘客的树两者组合成一个公共树。如果各个判定节点之间没有依赖关系,则所有判定节点都可以是根结果节点的子级节点。在图6中例示了包括针对驾驶员座位和乘客座位的预定状态的这种分层树结构的示例。图6的分层树结构组合了图6左侧所示的针对驾驶员座位的树和图6右侧所示的针对乘客座位的树。针对驾驶员座位的树与图5的树相同。针对乘客座位的树包括判定节点dn14到dn19,它们被指配给类似于针对驾驶员座位的判定节点dn1至dn3和dn7至dn9的状态的状态,并且适合于乘客座位。通过添加针对一个或更多个后座的树结构,可以进一步扩展图6的分层树结构。在一个示例性实施方式中,成像单元11包括3d成像传感器,例如飞行时间摄像机、立体视觉摄像机、结构光3d摄像机,或类似的3d摄像机。3d成像传感器输出所拍摄场景的2d强度图像(灰度或颜色)和该场景的对应2d深度图。2d强度图像是像素的2d网格,并且每个像素具有表示由相应像素接收的光信号的强度(或信号强度或幅度)的值。2d深度图是与2d强度图像大小相同的图像,其中2d深度图中的每个像素反映距从通过给定像素的光线看到的场景中的物体的距离。2d深度图可以包含笛卡尔距离,即,平行于图像平面的物体与摄像机原点之间的距离;或者径向距离,即,物体与摄像机原点之间的欧几里德距离。例如,摄像机可以定位在车辆的车顶中(从而能够实现俯视图)或后视镜处。其它可能位置例如包括车辆的a柱、中央控制台(centerstack),或提供车辆座位和座位上的人的视图(特别是驾驶员座位)的任何其它位置。成像单元11的光学系统(例如包括透镜和有源照明)必须正确拍摄和照亮座位区域。如果可以使用环境光,那么可能会跳过有源照明。在系统10中,深度神经网络拓扑被用于评估指配给分层树结构中的判定节点的状态。输入数据是来自成像单元11(例如,飞行时间摄像机)的数据,尤其是场景的2d强度图像和2d深度图。输入数据被提供到卷积神经网络13中,该卷积神经网络13例如可以包括多个卷积层、池化层(poolinglayer)、非线性层或完全连接的层。基于输入图像和注释矢量对来训练卷积神经网络13。注释矢量表示理想的目标函数。并非输出树中的所有节点都可以应用于给定场景。在一个实施方式中,注释以二元方式完成。在针对每个判定节点的树的根节点开始,存在对问题的二元答案,即,状态是否存在于给定场景中。该判定确定沿树的路径,即,仅有效结果节点得到激活。为了激活判定节点的右侧子级结果节点,将注释矢量中针对该节点的条目设定成1,并激活树中左侧子级结果节点,将其设定成0。在下文中,忽略结果节点的未激活的子级节点。通过将注释矢量中的对应条目设定成大于1的某个定义值或者无穷大,来标记作为未激活判定节点的子级节点的所有判定节点。可以通过将示出车辆内部的预定义场景的图像和对应注释矢量输入到卷积神经网络13中来训练卷积神经网络13。例如,一图像示出了驾驶员座位被物体占据的场景。在图7中例示了对应分层树结构,其中,对应注释矢量为判定节点dn1至dn5中的每一个指配一标签。在当前示例中,当驾驶员座位被占据时,判定节点dn1的标签是1,而当一物体占据驾驶员座位时,判定节点dn2的标签是0。因此,判定节点dn1和dn2描述了与图像相关的状态,即,判定节点dn1和dn2中的每一个的结果节点中的一个被激活。此外,分层树结构的分支中不属于包括判定节点dn1和dn2的当前分支的所有判定节点(即,判定节点dn3至dn5)通过注释矢量设定成值“inf”。判定节点dn3至dn5描述与给定图像无关的状态,因此判定节点dn3至dn5的结果节点均未被激活。代替“inf”,可以使用小于0或大于1的任何其它值。在图7中用阴影表示不属于当前分支的分层树结构分支。此外,卷积神经网络13输出针对每个判定节点的似然值预测,如下表1中示例性地示出的。dn1dn2dn3dn4dn5预测0.90.810.50.420.21标签10infinfinffmse(predi,labi)-0.10.81000表1在下文中结合方程(4)和(5)对函数fmse(predi,labi)进行进一步说明。对于卷积神经网络13的训练,利用表1的条目计算损失函数(或成本函数)。训练所述卷积神经网络13的目标是最小化损失函数的结果。如果损失函数的结果接近0或低于预定值,则可以终止卷积神经网络13的训练。损失函数可以通过方程(1)计算为均方误差emse:其中,n是分层树结构中判定节点的总数,在当前示例中n=5,并且predi和labi分别是针对由卷积神经网络生成的预测的值和由判定节点i的注释矢量给出的标签的值。另选地,交叉熵ece可以被用于由方程(2)给出的损失函数:在实践中,方程(2)可以按标签0在总和中不贡献为零的方式扩展,以测量lab与pred之间的相似性:在一个实施方式中,通过利用忽略这些节点的特殊损失函数来忽略未激活判定节点,即,卷积神经网络13可以在给定输出神经元处输出任何内容,但结果不会贡献在反向传播步骤中操纵适应网络权重的损失。在该实施方式中,改变方程(1)的损失函数emse以忽略未激活判定节点。改变的损失函数e'mse由方程(4)和(5)给出:其中,m是具有“inf”以外的标签的激活判定节点的数量。对于标有值“inf”的所有未激活判定节点来说,函数fmse(predi,labi)的结果为0,这意味着具有“inf”值作为标签的判定节点不贡献损失函数。在表1中给出的示例中,方程(4)的损失函数计算如下:在忽略未激活判定节点的本实施方式中,方程(2)的损失函数ece可以按与方程(1)的损失函数emse相同的方式改变,这导致由以下方程(7)和(8)给出的改变的损失函数e'ce:其中,m是具有“inf”以外的标签的激活判定节点的数量。对于标有值“inf”的所有未激活判定节点来说,函数fce(predi,labi)的结果为0。可以修改方程(7)和(8),使得值得标签labi的值0在总和中不贡献为零:该注释可以扩展成非二元版本。在这种情况下,可以向左侧和右侧结果节点指配0与1之间的值,其中两个节点的总和应始终为1。如果结果节点的值高于可配置阈值,则认为该结果节点已激活。如果树结构仅包含一级判定节点,并且所有这些节点都附属于根结果节点,那么所得到的注释矢量对应于广泛使用的“独热(one-hot’)”表示,即,每个决定一个不依赖于任何其它神经元的输出神经元。具有一级以上判定节点的分层方法的不同之处在于,必须为所有可能的判定节点“判定”其是真还是假。利用该分层方法,可以忽略一些节点,这可能对某些使用情况有益。树的分层结构进一步增加了一些冗余并连接属于一起的状态,而分离彼此相互不依赖的状态。标号列表10系统11成像单元12处理单元13卷积神经网络14图像15置信值dn1到dn19判定节点当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1