基于cuda并行计算及wcf架构的人体检测方法

文档序号:6371826阅读:300来源:国知局
专利名称:基于cuda并行计算及wcf架构的人体检测方法
技术领域
本发明涉及一种基于CUDA并行计算及WCF分布式架构的视频监控人体检测的方法,属于智能计算机视觉及模式识别和图像处理领域。
背景技术
无论是在计算机视觉研究领域或智能视频监控的应用领域,人体检测一直是一个热点的研究课题,是计算机视觉、模式识别、机器学习、图像处理、人工智能等多个学科交叉的产物,是人体行为分析、危险预警等应用的基础。人体检测在多个领域都有广泛的应用,在室外及道路环境下,人是道路交通的主要参与者,对人体的检测定位可有效地应用于汽车安全辅助驾驶领域,及时警告驾驶员可能与车辆附近的行人发生碰撞。在室内监控安防领域,对人体的定位和监控可以有效的防止异常情况的发生,对可能出现的违法情况产生预警,对疑难案件的侦破提供有力的支持。 然而由于光照、行人自身姿态的变化、遮挡等因素,造成了人体检测是一个非常困难的问题,目前有很多方法用于行人检测,如基于运动物体检测和模板匹配的方法、基于Haar特征的方法、基于HoG特征的方法等,其中目前广泛使用的基于运动物体检测的方法受光照的影响较大,摄像头不可移动,且人体姿态各异导致建模困难,无法达到良好的检测效果;基于Haar特征的方法成功运用于人脸检测,并拥有较高的检测率和检测速度。但Haar特征是一种基于灰度分布的区域特征,人体不同于人脸,由于衣着的影响,在灰度分布上没有明显特征。基于HoG特征的方法描述了局部图像的梯度强度和梯度方向的分布,对人体的外观有很好的表征,采用SVM分类器训练分类,经证明能取得较好的检测效果,但特征维数太高,计算复杂,造成了应用困难。在此情况下,研究创新的基于HoG特征的人体检测加速算法,突破其实时性瓶颈,具有极大的商用价值。研究成果可应用于智能交通监控、辅助驾驶和室内监控等多个领域。在此发明以前,基于视觉的人体检测系统通常采用单一计算机,基于CPU的方式进行开发,基于运动物体检测和模板匹配等方法,虽然降低了系统开发的难度,但也大大限制了其应用场景。2007年,NVIDIA推出了 CUDA (统一计算设备架构)。在CUDA架构中,GPU(图形处理器)成为了数据并行计算的硬件设备,取代了 CPU的部分功能,实现了 CPU+GPU异构编程。GPU拥有远超过CPU的核心数量和并行计算能力,对通用计算的加速效果非常明显。将基于HoG特征的人体检测过程转移到GPU运行,可以大大增加系统的运行速度,使这一项技术的应用成为可能。然而CUDA架构需要NVIDIA显卡的支持,如果采用单一计算机的模式,会大大增加终端的成本,在这种情况下,分布式架构是一个很好的选择,这样能够将全部或者主要的计算需求从视频采集的设备端转移到服务器端,降低了设备端的性能要求,同时也实现了远程识别,便于管理和维护以及数据的统计和分析
发明内容
本发明目的就在于克服上述问题,提出一种基于CUDA并行计算及WCF架构的人体检测方法,使得在该架构下开发基于HoG特征的人体检测系统具有良好的实时性、兼容性及可扩展性。本发明采用的技术方案是一种基于CUDA并行计算及WCF架构的人体检测方法,包括以下步骤
(I)采用CUDA架构对基于HoG特征及SVM(支持向量机)分类器的人体检测算法进行加速,CUDA架构对通用计算具有良好的加速效果,并且已经在分子动力学、量子化学、生物信息学、计算流体力学、计算机构力学等方面得到了广泛的应用和验证。借助CUDA架构,可以将在传统CPU上运行的人体检测算法转移到GPU运行,利用GPU的多核心、高带宽、高浮点计算能力等特性,实现一个数量级以上的算法加速,从而解决制约人体检测系统开发最大的制约-实时性问题,使得人体检测技术可以在所有提供CUDA支持的终端运行。 (2) WCF架构是进行分布式计算的有效方式,并被证实效率仅次于分布式过程调用。在本发明中,采用WCF架构,将单一终端的结构转化为终端与服务器的云状结构,终端只负责视频数据的采集,数据通过网络传输到服务器进行处理和分析。为了减少网络数据传输的延时,采用了 MPEG-4的视频压缩算法,减少数据传输的冗余,提高传输速度,节省带宽。(3)采用WCF架构之后,人体检测系统的检测过程将在客户端和服务器两部分进行,本发明中采用了流水线的结构,将系统的时间利用率最大化,当服务器处理一帧数据的同时,客户端可以对下一帧数据进行压缩和传输,两者流水线合作,降低时间开销。本发明的有益效果
I.采用CUDA架构,提升了人体检测算法的运行速度近20倍,使得在CPU架构下无法满足实时性的人体检测算法提速,达到并超过实时性的要求,使得系统集成和应用成为可倉泛。2.使用WCF架构,将数据的采集和处理过程分离,大大降低了对于终端的硬件要求,提升了系统的兼容性和可扩展性,可适应嵌入式摄像头、PC监控终端、移动监控终端等各种复杂情况,在服务端采用NVIDIA GPU服务器或服务器集群,便于管理和维护。3.采用MPEG-4视频压缩,通过网络传输数据,并在终端完成计算。通过初步处理视频,减少冗余数据传输的方式提高网络传输的性能并节省带宽。4.提出流水线的处理流程,将客户端和服务端的处理过程并行,大大增加了系统资源的利用率,减少了时间开销。


图I为HoG特征提取流程 图2为传统的人体检测算法流程;
图3为基于GPU的人体检测算法流程;
图4为在各分辨率下CUDA加速的效果;
图5为基于WCF的分布式网络架构;
图6为基于网络传输的人体检测算法结构;
图7为流水线并行的系统架构;图8为采用流水线并行的加速效果。
具体实施例方式下面结合附图和具体实施方式
对本发明作进一步说明
一、使用CUDA对基于HoG特征及SVM分类器的人体检测算法加速 I. I基于HoG特征及SVM分类器的人体检测算法
HoG特征描述了图像局部像素区域的梯度强度和梯度方向的分布,用来表征人体的外观和形状。其提取流程如图I所示。对于每个像素点的梯度定义如下
权利要求
1.一种基于CUDA并行计算及WCF架构的人体检测方法,其特征在于包括以下步骤 (1)采用CUDA架构进行基于计算机视觉的视频监控人体检测系统开发,利用GPU图形处理器的并行计算能力,对基于HoG特征及SVM分类器的人体检测算法并行加速; (2)采用WCF架构进行分布式计算,将视频数据采集与数据分析处理分别在监控终端与GPU服务器进行; (3)采用流水线架构优化系统实现流程,将监控终端与GPU服务器的工作并发处理,减少时间开销,优化系统资源配置。
2.根据权利要求I所述的一种基于CUDA并行计算及WCF架构的人体检测方法,其特征在于所述步骤(2)中对视频数据采用MPEG-4的压缩传输以减少带宽需求。
全文摘要
本发明公开了一种基于CUDA并行计算及WCF架构的人体检测方法,包括以下步骤采用CUDA架构进行基于计算机视觉的视频监控人体检测系统开发,利用GPU图形处理器的并行计算能力,对基于HoG特征及SVM分类器的人体检测算法并行加速;采用WCF架构进行分布式计算,将视频数据采集与数据分析处理分别在监控终端与GPU服务器进行;采用流水线架构优化系统实现流程,将监控终端与GPU服务器的工作并发处理,减少时间开销,优化系统资源配置。本发明使得在该架构下开发基于HoG特征的人体检测系统具有良好的实时性、兼容性及可扩展性。
文档编号G06K9/00GK102760053SQ20121020566
公开日2012年10月31日 申请日期2012年6月20日 优先权日2012年6月20日
发明者周晓阳, 郑文明 申请人:东南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1