从数字摄像头图像确定停车场占用情况的方法与流程

文档序号:11971369阅读:371来源:国知局
从数字摄像头图像确定停车场占用情况的方法与流程
本发明涉及从数字摄像头图像确定停车场占用情况的方法和系统。

背景技术:
作为背景情况,对可用停车位的检测在世界范围内都是非常重要的,这是因为它与燃料消耗和交通拥堵高度相关。研究表明,在人口密集的美国城市中,比如旧金山和纽约市,相当大比例的交通量与找寻(cruise)空停车位相关。例如,据估计,旧金山大约三分之一的交通量和二分之一的所使用燃料是因为搜寻空停车位的车辆而导致。一项在布鲁克林完成的关于停车位相关问题的研究表明总交通量的45%和本地交通量的64%是在寻找可用的停车位。因此,停车场占用情况的自动估计以及空位的检测能够解决繁忙地段的燃料消耗和交通量的问题。停车的进行通常只有非常少的自动化技术,这使得该过程效率低下且常常失效。需要廉价的自动和半自动的停车执行系统(parkingenforcementsystem)。虽然已有基于停车传感器的系统,但是它们往往牵涉到大的安装和部署成本,以及安装许可的获取、不是没有困难的过程。由成组的摄像头组成的系统不仅可提供易于部署的廉价解决方案,而且可支持会给消费者提供附加值的其它任务,比如交通执法和监督。对基于摄像头的执行系统而言,主要的挑战之一是从图像和视频确定占用率和空位位置。需要一种执行停车场占用情况估计并检测空位的自动化系统。该信息转而可经由无线电、因特网、路标和/或GPS辅助信号转达给司机。

技术实现要素:
在一实施方式中,提供了一种从数字图像确定停车场占用情况的方法。该方法包括构建程序,该构建程序包括如下步骤:获得具有多个停车位的停车场的布局且针对至少一个视角估计停车位的体积并估计观察的像素属于所述停车位的体积的概率。该方法进一步包括如下步骤:从至少一个数字摄像头获取所述停车场的一或多个图像帧;利用至少一个车辆检测器在所获得的所述一或多个图像帧上执行像素分类以确定像素属于车辆的可能性;基于空间变化的成员概率密度函数(PDF)和相关区域(aregionofinterest)内车辆像素的可能性计算停车位被车辆占用的概率;以及通过比较计算出的停车位被车辆占用的所述概率和预定阈值确定停车场的空位。在另一实施方式中,提供了一种从数字图像确定停车场占用情况的系统。该系统包括数据库和图像处理单元,所述数据库存储数字图像以及与数字图像处理相关的数据,所述图像处理单元包括处理器、系统存储器和系统总线,所述系统总线连接系统存储器和处理单元。所述图像处理单元是可操作的以:获得具有多个停车位的停车场的布局;针对至少一个视角估计停车位的体积并估计观察的像素属于所述停车位的体积的概率;从至少一个数字摄像头获取所述停车场的一或多个图像帧;利用至少一个车辆检测器在所获得的所述一或多个图像帧上执行像素分类以确定像素属于车辆的可能性;基于空间变化的成员概率密度函数(PDF)和相关区域内车辆像素的可能性计算停车位被车辆占用的概率;以及通过比较计算出的停车位被车辆占用的所述概率和预定阈值确定停车场的空位。在又一实施方式中,提供了一种存储指令的非暂时的计算机可读的数据载体,所述指令当被计算机执行时,使得所述计算机执行从数字图像确定停车场占用情况的方法。该方法包括构建程序,该构建程序包括如下步骤:获得具有多个停车位的停车场的布局且针对至少一个视角估计停车位的体积并估计观察的像素属于所述停车位的体积的概率。该方法进一步包括如下步骤:从至少一个数字摄像头获取所述停车场的一或多个图像帧;利用至少一个车辆检测器在所获得的所述一或多个图像帧上执行像素分类以确定像素属于车辆的可能性;基于空间变化的成员概率密度函数(PDF)和相关区域内车辆像素的可能性计算停车位被车辆占用的概率;以及通过比较计算出的停车位被车辆占用的所述概率和预定阈值确定停车场的空位。附图说明图1是图解适于实施从一或多幅摄像头图像确定停车场占用情况的示例性方法的数字图像处理装置的框图;图2是从摄像头图像确定停车场占用情况的示例性方法的流程图;图3是用于详细说明停车场布局的示例性用户界面(UI);图4示出了使用示例性车辆体积建模方法对停车位体积的估计;图5示出了使用LBP-SVM车辆分类器的像素分类结果;图6示出了局部二元模式编码方案;图7示出了停车位的成员概率密度函数;以及图8示出了具有样本停车场图像经示例性方法分析得出的占用结果的UI。具体实施方式这里所记载的是一种用于从一或多幅摄像头视图标记停车场占用检测的方法和系统。在合意的高度安装摄像头的常用方法是安装在灯柱上;但要理解的是,摄像头的任何架高安装(例如,高于8英尺)会是适合的。示例性实施方式专注于从灯柱摄像头视图而标记的停车场占用检测,但它也涉及沿街停车,尤其是用于具有画线的街道(即,划出的“停车位”)。在更高层面上,示例性实施方式的一个方面是从静态图像确定占用率和占用/空闲位置的一系列图像处理步骤。具体而言,该示例性实施方式一般包括(1)利用用户标记线确定停车场布局的半手动规则系统(algorithm),(2)执行车辆/背景区分的切分规则系统(algorithm),以及(3)利用车辆体积模型的占用确定规则系统(algorithm)。图1概略地示出了用于实施示例性方法的数字图像处理装置100。根据示例性实施方式形成的数字图像处理装置100包括用于执行数字图像处理和其它电子计算操作的图像处理单元(IPU)102。计算机是用于IPU102的一种可行的硬件配置。要知道的是,虽然图示了独立架构,但可以根据本实施方式采用任何合适的计算环境。例如,根据本实施方式可采用的计算架构包括但不限于独立的、多处理器的、分布式的、客户端/服务器的、小型计算机的、大型计算机的、巨型计算机的、数字的和模拟的。虽然没有特别显示在该图中,但就本领域技术人员所知,IPU102通常包括处理单元、系统存储器和连接各种系统部件(包括连接系统存储器和处理单元)的系统总线。处理单元可以是市场上可获得的各种处理器中的任何一种。双微处理器和其它多处理器架构也可被用作为处理单元。系统总线可以是若干类型的总线结构中的任何一种,所述若干类型的总线结构包括使用市场上可获得的各种总线架构中的任何一种的存储总线或存储控制器、外设总线和局部总线。计算机存储器包括只读存储器(ROM)和随机访问存储器(RAM)。ROM中存储基本输入/输出系统(BIOS),BIOS包含有助于比如在启动期间、在计算机中的元件之间传递信息的基本例程。IPU102可进一步包括硬盘驱动器、磁盘驱动器(例如,用于从可移动磁盘读取或者写入可移动磁盘)和光盘驱动器(例如,用于读取CD-ROM盘或者从其它光学介质上读取或者写入其它光学介质)。IPU102通常包括至少某种形式的计算机可读介质。计算机可读介质可以是能够被计算机访问的任何可获得的介质。示例而不是限制地,计算机可读介质可包括计算机存储介质和通信介质。计算机存储介质包括在用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法和技术中使用的易失和非易失、可移动和不可移动的介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其它存储技术、CD-ROM、数字通用光盘(DVD)或其它磁存储设备,或者可用来存储所需信息且可被计算机访问的任何其它介质。许多程序模块可被存储在驱动器和RAM中,包括操作系统、一或多个应用程序、其它程序模块和程序非中断数据(programnon-interruptdata)。IPU102中的操作系统可以是市场上可获得的许多操作系统中的任何一种。如本领域中所公知的,IPU102被可操作地连接于数字图像输入设备104,比如数字摄像头,数字图像输入设备104接收作为输入的图像并取得代表该图像的数字图像数据。IPU102从图案输入设备104接收数字图像数据。IPU102还被可操作地连接于一或多个输出设备106,输出设备106从IPU102接收数字图像数据。图像输出设备106可包括存储用于后续检索的数字图像数据的数字数据存储设备(例如,CD-ROM、磁介质或其它存储介质)、和/或基于该数字图像数据产生视觉图像的视频显示终端。如此处所图示的,IPU102可选地被连接到计算机网络112。如此,IPU102可发送数字图像数据给其所连接的任何网络或者从该网络接收数字图像数据。IPU102可工作在使用到一或多个远程计算机的逻辑和/或物理连接的网络环境中。远程计算机可以是工作站、服务器计算机、路由器、个人计算机、基于微处理器的娱乐性电器、对等设备或其它常见的网络节点,且通常包括所描述的与计算机相关的许多或全部元件。所描绘的逻辑连接包括局域网(LAN)和广域网(WAN)。这样的网络环境在办公室、企业级计算机网络、内联网和因特网中是常见的。当被用于LAN网络环境中时,计算机通过网络接口或适配器被连接到本地网络。当被用于WAN网络环境中时,计算机通常包括调制解调器,或者被连接到LAN上的通信服务器,或者具有用于在WAN(比如因特网)上建立通信的其他装置。在网络环境中,所描绘的与计算机相关的程序模块或其部分可被存储在远程存储设备中。要知道的是,此处所描述的网络连接是示例性的且可使用建立计算机之间的通信链路的其它装置。IPU102还被可操作地连接于数字图像数据库108,数字图像数据库108存储与数字图像处理相关的数据。该数字图像数据库108可以是简单的固定磁盘驱动器和/或可移动磁盘驱动器、接纳光学存储介质的光学介质读写器(例如,CD-ROM输入设备)、和/或包括和/或适于接收和读取数字图像存储介质的任何其它合适的数字图像数据存储设备。图1的装置100可任选地包括用户界面(UI)110,UI110被可操作地连接于IPU102。UI110包括任何合适的输入/输出设备,被用户用于从图像处理单元102接收信息和将信息输入图像处理单元102。合适的用户界面设备包括键盘/小键盘、机械按钮/开关、具有图形用户界面的视频显示终端、诸如操纵杆或鼠标之类的指点设备、语音命令输入设备、触摸屏、和/或可被用户用来从IPU102接收信息和将信息输入IPU102的任何其它合适的输入/输出设备。本领域普通技术人员会意识到在UI110和输出设备106之间可能存在一些重叠。例如,输出设备106的视频显示终端或屏幕也可以是UI110的部件且提供视觉信息给用户。本领域普通技术人员还会意识到根据图1制成的包括IPU102的装置可通过各种已知系统进行提供。现在参考图2,在更具体的层面上,示例性方法的步骤可包括:(1)接收和/或确定(不然获取)讨论中的停车场的布局(201);(2)针对一或多个视角根据观测像素属于给定停车体积的概率(即,成员概率密度函数,或者PDF)估计停车位体积(202);(3)从优选地安装在诸如灯柱之类的架高结构上的至少一个数字摄像头获取停车场的一或多个图像帧(203);(4)利用至少一个车辆检测器(或车辆检测规则系统(algorithm))在所获取的图像帧上执行像素分类以确定给定像素对应于车辆的可能性(204);(5)基于空间变化的成员PDF以及相关区域内车辆像素的可能性计算停车位被车辆占用的概率(205);以及(6)通过比较计算出的概率和预定阈值(Th)确定停车场的空位(206)。要注意的是,如图2中所示,可引入反馈回路207以强调步骤(203-206)中的至少一些通常可随着时间的推移且根据需要被重复,但是其它步骤(201和202)对于给定的停车场和摄像头安装而言一般只执行一次。下面将更详细地说明这些步骤中的每一个。第一步骤(201)是接收和/或确定相关停车场的停车位布局。为了确定停车场中的空位(即,多少车位是可用的且更重要的是它们的位置在哪里),拥有关于相关停车场的布局的一些知识是有益的。有多种方式收集这种信息。例如,可使用现有的停车场蓝图加上摄像头安装设置的知识来推断停车场布局。还可通过将每天收到的停车场占用情况的部分信息放在一起来学习随着时间推移的停车场布局。另一方法是直接从已获取的图像(理想地从该停车场大部分空置时获取的图像)检测限定停车位的标记(或者线)。关于示例性实施方式,利用UI300的半手动方法可被用来执行这个任务(参见图3)。例如,通过UI300,可要求用户画线(不然输入),其中这些线的交叉可限定停车位的角落。注意:由于每个摄像头安装只需要限定一次停车位布局,所以这种方法对该实施而言是适当地准确和有效的。注意:对某些停车场而言,适当时候也可使用曲线来限定停车位。如图3中所示,示例性UI300一般包括至少一个停车场图像画面302。此外,UI300可包括其它种种功能,比如“打开图像”(304)、“画线”(306)、“加载线”(308)、“保存线”(310)、“像素分类”(312)、“选择方法”(314)(例如,LBP、TextonBoost、LBP+TextonBoost)、“占用估计”(316)、“地面实测”(318)、“保存地面实况”(320)和/或“评估”(322)。但要理解的是,其它UI布局也是可行的且其它功能也可被包括。现在参考图2,该方法的第二步骤(202)是查明摄像头的透视图,估计停车体积。也就是说,由于摄像头的透视图,停放的车子看起来会占用比单个停车位更大的空间(或者延伸越过限定的停车线)。在这一点上,图4示出了利用提议的车辆体积建模方法针对停车场的给定图像/视图402的停车场体积的估计。在该步骤,估计与图像402中的停车位相关的体积,即,与成像的停车位相关的三维(3-D)区域,在该区域中可观察停放的车辆。该体积可例如通过使停车位逼近平行六面体来估计。这可通过使用来自第一步骤201的停车位标记线(404)以及将高度估计为例如四条底边(406和408)的平均长度的一半来完成。从给定摄像头角度看到的平行六面体面层(mask)可通过简单的几何操作获得,所述几何操作针对给定停车位产生相关3-D区域(确切地说是体积)的投影(408)。接下来,针对该区域内的每一个像素,指定是给定停车位的像素成员的概率。这是优选的,因为考虑到代表3-D场景的二维(2-D)图像像素的位置有固有的不确定性。这种成员PDF是距相关区域的中心的距离(中心的像素具有较大的权重)和可与相邻停车位重叠的区域(408中吸藏的、色彩编码的区域)的数量的函数。这种成员PDF的细节在第五步骤(205)中进行描述。在该方法的第三步骤(203)中,从安装在例如灯柱或类似架高结构上的至少一个数字摄像头获取停车场的至少一个图像帧l(x)。该图像会在后续的步骤中被进一步处理以确定停车场和/或该停车场内相关停车位的占用情况。该方法的第四步骤(204)是利用至少一种类型的车辆检测器(或车辆检测规则系统(algorithm))执行像素分类。更具体地,在所获得的图像上利用至少一个车辆检测器执行像素分类以确定像素属于车辆的可能性。在优选的实施方式中,两种不同的对象识别规则系统(algorithm)(即,车辆检测器或分类器)的分类/输出被整合。例如,可以采用使用旋转不变的局部二元模式(LBP)作为输入特征的支持向量机(SVM)分类器和/或TextonBoost(TB)分类器。但要理解的是,该示例性方法可使用其它车辆检测器。该步骤的输出是概率图Pv(x),其表明像素x属于车辆的可能性(从而提供车位已被占用的证据)。图5示出了对图像502应用LBP-SVM车辆分类器时的取样结果504。参考图6,下面将更详细地描述使用旋转不变的LBP作为输入特征的SVM分类器。一般而言,局部二元模式是良好的图像纹理描述符且已被成功地运用于人脸识别领域。因此,针对该图像中的每一个像素,考虑了大约按选定半径r远离中心的周围的邻近像素,如图6的第一幅图602中所示。具有大于或等于给定像素(例如,中心像素)的值的每一个邻近像素被分配编码1,具有较低值的每一个邻近像素被分配编码0。然后遍历所得的二进制码序列,如第二幅图604中所示。所以,当考虑8个邻近像素时,该8个二进制值串在一起形成一个字节(606)。该二进制值被转换为十进制(例如,11010011),从而获得一个数字(211)。该数字是给定像素的LBP码值。这个过程针对该图像中的每一个像素进行重复,从而获得编码图像。一致收敛的(uniform)局部二元模式是在比特序列中的0和1之间具有至少2次转变的模式。例如,下面的模式是一致收敛的:00001100、11110011、111111111、00000000、00011111。而下面的模式是不一致收敛的:00110011、01010101。旋转不变的模式将只是由于循环偏移而有所不同的所有序列视为等同方式。例如,下面的模式列举了00110000的所有可能的旋转不变的版本:00011000、00001100、00000110、00000011、10000001、11000000和01100000。在本实施例中,可以指定旋转不变的该组序列的每一个成员中具有最小十进制值的序列。该图像可被分成m×m像素(例如,m=15)的网格,且可计算每一个块中的旋转不变一致收敛的LBP值的直方图。每一个块可基于地面实况被标注(即,人工标注的数据,假定完全正确,用于训练和评估目的)为属于各种类型对象中的一种,比如车辆、人行道、树木、天空、建筑物和/或空白(以上都没有)。但要理解的是,可根据停车场的位置以及其它环境因素采用对象类型。每一个块内的值的直方图可被用作为特征向量以训练SVM分类器。例如,可以利用停车场环境(setting)中的5种最常见对象,即使一般而言,主要相关的是车辆类。因此,分类器的输出通常被视为二进制输出(这种类型的分类器被标记为“硬分类器”),表示像素x是否属于车辆:接着,将更详细地描述TextonBoost分类器。TextonBoost是对象识别方法,由JamieShaton在《TextonBoostforImageUnderstanding:Multi-ClassObjectRecognitionandSegmentationbyJointlyModelingTexture,Layout,andContext》(2007)(《用于图像理解的TextonBoost:通过共同建模的纹理、布局、和背景的多类目标识别与分段》(2007))中进行了介绍。它使用条件随机场模型来学习对象类标签在整个给定图像中的条件分布。该模型利用纹理布局、色彩、位置和边缘特征。TextonBoost基于前述的类(即,车辆、树木、人行道、天空、建筑物和/或空白)。类似于LBP,TextonBoost的硬输出可被用作为表示像素x是否属于车辆的二进制分类器:注意:当只使用一个硬像素分类器时,只计算硬分类输出。但是,为了更佳的车辆像素检测,整合多个像素分类器的输出以产生最后的分类判定是有利的。在这种情况下,可以使用由加权整合一或多个分类器的输出而获得的软分类输出。例如,车辆检测模型可合并LBP和TextonBoost分类器二者。具体地,对于TextonBoost分类器而言,针对像素属于“车辆”类的概率用于替代硬分类。进一步地,计算每一个类标签的概率的熵,熵是每一个像素处的判定的不确定性的程度。通过按比例调节这个值以达到最大值1并从1中减去该结果,可获得每一个像素处的判定的确定性的程度。在像素x处的判定的确定性ηx的范围在0(低确定性)和1(最大确定性)之间。注意:还可以类似的方式整合LBP-SVM分类器的软概率输出和TextonBoost分类器的硬输出下面将说明一种关于像素x是车辆的概率的模型,该模型利用整合了LBP硬输出的TextonBoost软输出:其中是由TextonBoost输出的像素对应于车辆的软概率,而是由具有作为输入的LBP值的SVM分类器提供的像素对应于车辆的硬分类输出。替代地,利用TextonBoost的硬输出和LBP的硬输出的关于像素x是车辆的概率的模型可包括下面的一者:或者其中是由TextonBoost给出的像素对应于车辆的硬分类,而是由具有作为输入的LBP的SVM分类器给出的像素对应于车辆的硬分类。虽然已经详细描述了TextonBoost和LBP的特征,但是在分类过程中可使用其它图像处理功能。例如,可使用梯度方向直方图(HOG)、旋转不变特征变换(RIFT)、广义RIFT(G-RIFT)、加速鲁棒特征(SURF)、梯度位置和方向直方图(GLOH)、SIFT(比例不变特征变换)和/或哈里斯角落(HarrisCorners)特性。在该方法的第五步骤(205)中,可基于每一个停车位的相关区域内的车辆像素的概率的加权总和(参见第二步骤(202))计算停车位被车辆占用的概率。此处所使用的术语“相关区域”是指可潜在地属于停在给定停车位中的车辆的像素。在此,空间变化的权重对应于第二步骤(202)中所介绍的成员PDF。更具体地,使用以停车位的相关区域的质心为中心且以沿着相关区域的主导方向为方向的高斯内核。这对位于朝相关区域的中心的像素赋予更大的权重。这些权重根据相邻停车位的相关区域的可能的重叠区域(可能的吸藏区域)的数量被进一步扩展(scale)。可以假定大部分车辆被停放在每一个停车位的中心附近。因为不是所有的车辆都是相同尺寸,所以在车辆体积的中心权重较大是有道理的据此,可使用加权函数,比如下面所示的这个函数:其中x0是停车位体积(相关区域)的中心,Σ(a2×2矩阵)包含表示高斯内核的旋转和权重随像素到中心的距离增加而急降的速率的参数。由于可用的摄像头安装位置所提供的有限选择,会出现一些吸藏区域(occlusion)。所述吸藏区域本身表现为例如停车位体积(相关区域)的重叠3-D模型。因此,每一个相关区域可被分为许多子区域,其中每一个子区域以与相邻停车位的可能的重叠(吸藏)的数量为特征:没有吸藏、可被一个吸藏、可被两个吸藏,等等。对可出现吸藏的子区域中的像素而言,一或多个通常毗邻的车位可有助于确定像素属于车辆的概率(若不恰当处理,这会导致多个计数)。为了对这种限制进行完善,以的形式规定了子区域的权重,其中k表示打折(discount)的一个会强加到潜在的吸藏子区域,n是拥有(claim)这种子区域(重叠)的停车位的数量。结合上述两个权重(高斯内核权重和吸藏补偿权重),每一个像素x的最终空间变化权重被规定为w(x)=wg(x)w0。在每一个相关区域(即,每一个停车位)内,这些值被正规化为总计为1,从而代表成员PDF(参见图7)。图7示出了样本停车场的车辆体积(702)、样本车辆体积(704)、样本车辆体积的对应的具有高斯内核的成员PDF(706)、以及样本车辆体积的对应的具有高斯内核和吸藏补偿的最终成员PDF(708)。直观地说,靠近车辆体积的中心的像素和位于针对每一个3-D车辆体积停车位没有吸藏的子区域内的像素权重较高。停车位s被占用的概率由属于s的每一个个体像素被占用的概率的总和给出。因此,这个概率可由像素x被分类为车辆以及像素x是停车位s的成员的联合概率给出。可假定这两者是独立的,从而该联合概率等于像素x是车辆的概率(由第四步骤(204)给出)和像素x属于停车位s的概率(由成员PDF给出)的积。数学上这可表示为:(5)代表占用的概率的一个这样的值针对每一个停车位s被获取。然后,将该值与阈值进行比较,作出二元判定。在该方法的第六步骤(206)中,通过计算出的每一个停车位的概率和预定阈值(Th)的比较,确定停车场空位。一种简单的选择是,例如,Th=0.5。但要理解的是,其它值也是可行的。更复杂的方法可基于分类器的特征和/或通过训练被使用。可选地,预定阈值可基于额外信息进行调整,该额外信息包括进出所述停车场的车辆的总数和空停车位的总数中的至少一者。所得信息可进而通过无线电、因特网、路标和/或GPS辅助信号转达给司机或其它相关人员。为了说明示例性实施方式的可行性和性能,收集各种停车场图像以形成数据集。该数据集由三组图像组成。第一组62幅图像由大约五个不同停车场的在一天的大约两个不同的时间拍摄的各种视图组成。这些图像的大部分是在晴天拍摄的,但有一些受到雾的影响。第二数据集由一个停车场在一天的各个时间在不同照明条件下获取的图像组成。这些图像全部从十分相似的角度拍摄。第三组图像由从谷歌图片搜索收集的10幅图像组成。这是最多样化的数据集,因为每一幅图像在照明条件、视角等方面都不同于其余图像。用于对象分类的像素级地面实况针对第一组中的32幅图像被手动创建。这些在车辆检测器的训练中被使用。剩余的图像(即第一组中的30幅、第二组中的15幅以及第三组中的10幅)被用于测试该系统。由用户输入为这些图像创建停车位标记线,以及每一个停车位的占用地面实况。下面展示的是该数据集的以下性能分析。下面的表1示出了在不同数量的图像(9、25和32)上训练的半径为1和2的LBP的性能以及在第一数据集中的32幅图像上训练的TextonBoost的性能的概要,全部在吸藏参数k=2的情况下作出。这些值代表贯穿整个图像集合的已占停车位和空停车位的正确检测的百分率。正如所料,这些方法通常在第一数据集上效果最好,因为训练数据和测试数据类型相同。在更现实的方案中,训练数据和测试数据彼此类似,因为一旦系统建立,训练便从停车场的相似视图完成。第一数据集由大约5个停车场的不同视图组成,从而在只有一个停车场、从一个视图观察的情况下工作时预计性能提升。其它两个数据集上的结果探索了推广这种方法的可行性。注意:在9幅图像上训练的半径为1的LBP通常表现最好。较多训练图像反而降低了性能的可能原因是发生在SVM分类器阶段的潜在的过度拟合。表1车辆检测器的分类准确度接着,考虑吸藏参数k的影响。由下面的表2可知,k=2时,该规则系统(algorithm)通常表现最好。本实验使用在9幅图像上训练的r=1的LBP方法。表2吸藏参数对分类准确度的影响的探索测试数据集k=1k=1.5k=2k=3k=4第一组8183858485第二组6464636564第三组8381817979平均76.076.076.276.276.0一般而言,增加图像尺寸(从而增加车辆对象的分辨率)会将在9幅图像上训练的r=1的LBP的准确度从85%增加到88%。接着,考虑最佳LBP方法(r=1、在9幅图像上训练)和TextonBoost的整合,使用k=2。下表3的结果显示,LBP和TB分类器的整合相较于单个分类器在结果上有少许改进。直观地,整合方法会试图在细到像素级在多个分类器中选出最佳的。整合策略部分实现了所需效果。表3具有最佳参数的各个分类器的分类准确度测试数据集LBPTBLBP+TB第一组888187第二组607372第三组836176平均76.871.378.1最后,出于说明目的,图8中示出了具有停车场图像802和占用(或者中间)结果804的UI800的一个实施例。中间结果804表示:(1)对每一个类进行色彩编码的分类器输出(806),(2)从用户引导线估计的停车位(808),(3)停车位的叠加体积(810),以及(4)色彩代表对具体像素而言可能的吸藏数量的吸藏示意图(812)。如先前所述,UI800可包括其它种种功能,比如打开图像(814)、画线(816)、加载线(818)、保存线(820)、像素分类(822)、选择方法(824)(例如,LBP、TextonBoost、LBP+TextonBoost)、占用估计(826)、地面实测(828)、保存地面实况(830)和/或评估(832)。示例性实施方式参照轿车(car)进行描述。但是,可在其它车辆(比如摩托车和卡车)上训练该规则系统(algorithm),因为它们显示出类似的特征。可以考虑用于结合LBP和TB(TextonBoost)结果的其它整合方法。例如{LBP∧TB},根据该方法,如果LBP和TB二者的结果均表明车位被占用,则车位被视为占用。另一示例为{LBP∨TB},根据该方法,如果LBP或TB的结果之一表明车位被占用,则车位被视为占用。除非车位被占用的确定性高,否则前一方法的输出偏向空位判定。后一方法的输出偏向车位被占的判定。判定偏向不同组合的选择由具体的应用需要驱动。当可获得给定停车场的原始统计时,比如停车容量、进出车辆的数量,等等,这些信息可被用来完美我们的方法中的参数。一个简单的例子,设定的概率阈值(例如,LBP和TB分类器为0.5,LBP+TB分类器为0.3)可被设置在占用和空置输出之间使得占用的总数和空置的总数最接近停车场的给定的原始统计。示例性方法可在计算机程序产品中被实施,该计算机程序产品可在计算设备上被执行。该计算机程序产品可以是非暂时的计算机可读的其上记录控制程序的记录介质(比如磁盘、硬盘驱动器),或者可以是传输载波(在其中,控制程序被体现为数据信号)。计算机可读介质的常规形式包括,例如,软盘、软磁盘、硬盘、磁带、或者任何其它磁性存储介质、CD-ROM、DVD、或者任何其它光学介质、RAM、PROM、EPROM、闪存EPROM、或者其它存储芯片或存储匣、传输介质(比如声波或光波,比如无线电波和红外数据通信期间产生的那些,诸如此类)、或者计算机可读并可用的任何其它介质。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1