智能视频监控方法及系统的制作方法

文档序号:7918194阅读:224来源:国知局
专利名称:智能视频监控方法及系统的制作方法
技术领域
本发明涉及监控方法及系统,更具体地说,涉及一种智能视频监控方法及系统。
背景技术
目前在教学、安防、工业生产等各种场合得到广泛使用的视频监控设备,
大部分基于闭路有线电视(CCTV)方式进行模拟视频信号传输。该类摄像机具有一定的局限性,表现为1、采用模拟视频信号传输时,由于信号在传输
过程中不可避免地受到各种干扰以及信号的衰减,使得在长距离传输方面存在一定的困难。通常采用中继放大的方式解决这一个问题,但是会增加系统
的成本。2、由于模拟信号传输通常采用基带方式进行,使得摄像机和监视终端的结构只能采用一对一的形式。这使得整个系统的拓扑结构变得复杂,增加了综合布线的成本。3、当摄像机接有可控制的云台、镜头或者其他输入输出信号时,通常需要外加控制线路,使得系统的结构更加复杂。特别是在安防场合,由于监控现场和监控室之间传输的图像不够清晰、实时交互性能可靠性不高,导致执勤中哨兵被坏人袭击、枪支被抢和个别哨兵睡岗、携枪离岗等难于及时发现的问题发生。另外,现有的监控系统精确度不高,容易发生由于蚊虫、飞蛾、小猫、小狗等小动物干扰以及树枝摆动,天气变化,阴影光影所产生的误报警。
当今社会各行各业的现代化管理需要运用先进的科学技术手段,将电子技术与计算机控制集成在一个完整的体系中。在部队里,安全是首要需保障的问题,使用现有的监控保安设备,可有效的加强对人员的管理,直观及时的反映重要地点的现场情况,增强安全保障措施,是部队现代化管理的有力工具。部队是一个特殊的场所,为了保护国家的财产安全及部队人员的人身安
全.为军队建设一套高度智能化的监控系统是非常必要的;所谓的智能视频分析监控技术,有时也称"行为监控技术",就是指采用智能化的视频分析算法,利用计算机对视野范围内的目标的特定行为进行分析和提取,当发现存在符合某种规则的行为(如定向运动、越界、游荡、遗留等)发生时,自动向监控系统发出提示信号,采取某种对应措施(如声光报警器报警)或通知监控人员进行人工干预等。
随着计算机技术、通信技术、图像处理技术的不断发展,基于视频的检测与跟踪系统越来越普及。本系统融合了计算机图像处理、模式识别、人工智能及自动控制等诸多相关领域的知识,采用国内外先进的算法,利用计算机视觉和视频分析的方法自动分析摄像机拍录的图像序列,实现对场景中目标的定位、识别和跟踪,并在此基础上分析和判断目标的行为。
目前,安防视频监控系统,多是以视频监控与报警联动为代表的治安防控体系,几乎沦为一种提供事后取证录像的工具。在这种安防监控系统中,一般采用传统的系统配置模式即集中式地建设监控中心,将视频数据上传至集中式设置的视频服务器,并在该集中节点进行数据存储;在视频采集点上, 一般采用视频采集器,控制多路视频摄像头。该视频采集器采用宽带线路,或是采用无线网卡,在带宽不足的情况下,可能会采用多路无线线路捆绑的方式连接公众互联网,与同样连接在互联网上的视频监控中心进行数据传输。但这种监控系统,都具有一些固有的局限性
1、 由于人类自身的弱点,易导致漏报
一般情况下,人类并非是一个可以完全信赖的观察者,他们在观察实时的视频流或观察录像回放的时候,由于监控人员个体条件的不同以及自身生理上的弱点,经常无法察觉到安全威胁,从而可能导致漏报(False Negatives)现象的发生。
2、 各个监控点不能每时每刻都处于监控
除了一些规模较小的电视监控应用之外,很少有电视监控系统会按照1:1的比例为监控摄像机配置监视器。因此,各个监控点并非每时每刻都处于监控当中。
3、 易引起误报和漏报
误报(False-Positive)和漏报是视频监视系统中最常见的两大问题。漏报指的是在监控点发生安全威胁时,该威胁没有被监控系统或安全人员发现。误报指的是位于监控点的安全活动被误认为是安全威胁,从而产生错误的报警。
4、 由于缺乏智能因素,使数据分析困难
报警发生后对录像数据进行分析通常是安全人员必须要做的工作之一,而误报和漏报现象则进一步加剧了对数据分析的需求。安全人员经常被要求找出与报警事件相关的录像资料,找到肇事者、确定事故责任或评估该事件的安全威胁。
由于传统视频监控系统缺乏智能因素,录像数据无法被有效的分类存储,最多只能打上时间标签,因此数据分析工作变得极其耗时,并且很难获得全部的相关信息,而经常发生的误报现象使无用数据进一步增加,从而给数据分析工作带来更大的难度。
5、 由于缺乏智能因素,响应时间长
对于安全威胁的响应速度关系到一个安全系统的整体性能。传统的电视监控系统通常都由安全工作人员对安全威胁作出响应和处理,这对于处理一般性的、实时响应要求较低的安全威胁来说已经足够。但是很多情况下,在威胁发生时,需要安全系统的多个功能部分,甚至多个安全相关的部门在最短的时间内协调配合,共同处理危机。这时候,监控系统的响应速度将直接关系到用户的人身或财产的损失情况。

发明内容
本发明要解决的技术问题在于,针对现有技术的上述图像不够情绪、实时交互性差、容易产生误报警等缺陷,提供一种智能视频监控方法及系统。
本发明解决其技术问题所采用的技术方案是构造一种智能视频监控方法,包括以下步骤Sl:检测运动目标
Sll:采集并预处理M帧图像序列,其中,M为自然数;S12:根据所述M帧图像序列,初始化背景模型;
S13:采集第M+1帧图像序列,基于所述背景模型,对所述第M+1帧
图像序列进行帧间差分和背景差分处理,检测出运动目标;S2:跟踪运动目标
S21:对检测到的运动目标,建立目标模型;
S22:根据所述目标模型,对检测到的运动目标进行连续K帧处理,建立目标跟踪信息表,其中K为自然数;
S23:建立相邻两帧之间的目标匹配矩阵,矩阵元素是相邻两帧间目标模型的匹配度,得到运动目标的匹配情况;
S24:根据目标模型和目标匹配矩阵,分析当前帧运动目标状态,并
更新目标模型。
在本发明所述的智能视频监控方法中,在所述步骤Sll中,所述预处理包括对M帧图像序列的灰度化处理和滤波去噪处理。
在本发明所述的智能视频监控方法中,在所述步骤S12中,还包括对背景模型中的每一个像素点进行高斯建模。
在本发明所述的智能视频监控方法中,在所述步骤S13中,对第M+l帧图像序列进行帧间差分处理时,将未发生变化的区域更新到背景模型中;将发生变化的区域与背景模型进行拟合,以区分出显露区和背景模型。
在本发明所述的智能视频监控方法中,在步骤S13中,还包括对检测出的运动目标进行去阴影处理。
在本发明所述的智能视频监控方法中,所述目标模型包括面积相似度函数、形状相似度函数、运动方向一致性函数、位移可靠性函数、以及模糊相似度函数。
根据本发明的另一个方面,提供一种智能视频监控系统,包括摄像头、第一报警装置、编码处理器、数据分析处理器、显示器;其中,摄像头和报警器分别与编码处理器连接,编码处理器和显示器分别与数据分析处理器连接;
编码处理器用于将摄像头发送的视频流进行压縮编码为视频信号; 数据分析处理器用于将编码处理器发送的视频信号发送到显示器进行显
示,并进行分析处理,在出现异常情况时,通过编码处理器将报警信号发送
到第一报警装置以进行报警。
在本发明所述的智能视频监控系统中,所述智能视频监控系统还包括
拾音器和音箱,其中拾音器与编码处理器连接,音箱与数据分析处理器连接; 编码处理器还用于将拾音器发送的音频流进行压縮编码为音频信号; 数据分析处理器还用于将拾音器发送的音频信号发送到音箱进行播放。 在本发明所述的智能视频监控系统中,所述智能视频监控系统还包括
脚踏报警器和第二报警装置;其中,脚踏报警器与编码处理器连接,第二报
警装置与数据分析处理器连接;
数据分析处理器还用于接收脚踏报警器通过编码处理器发送的报警信
号,并控制第二报警装置进行报警。
在本发明所述的智能视频监控系统中,所述智能视频监控系统还包括
麦克风和喇叭;其中,麦克风与数据分析处理器连接;喇叭与编码处理器连
接;麦克风通过数据分析处理器和编码处理器将采集到的音频流发送到喇叭
进行播放。
在本发明所述的智能视频监控系统中,第一报警装置和第二报警装置是 蜂鸣器、多音报警器、或声光报警器。
在本发明所述的智能视频监控系统中,编码处理器对图像信号进行 MPEG4、 H.263、 H. 264或M-JPEG压縮编码。
在本发明所述的智能视频监控系统中,摄像头包括至少一个镜头、以 及图像传感器。
在本发明所述的智能视频监控系统中,图像传感器是CCD图像传感器或 CMOS图像传感器。
实施本发明的智能视频监控系统,具有以下有益效果工程实施简便, 系统扩充方便;实现跨区域远程监控,使得图像监控不受距离限制,而且图像清晰,稳定可靠;并且监控现场和监控室可实时进行信息交换。并且监控 系统精确度高,可避免由于蚊虫、飞蛾、小猫、小狗等小动物干扰以及树枝 摆动,天气变化,阴影光影所产生的误报警。智能电视监控以普通的网络电 视监控为基础,除了具备广为人知的网络电视监控的优势外,智能电视监控 系统还能为用户带来更大的收益。其主要的优点是
1、 可进行24X7全天候可靠监控
智能电视监控系统,彻底改变了以往完全由安全工作人员对监控画面进 行监视和分析的模式,它通过嵌入在网络摄像机或视频服务器等前端设备中 的智能视频模块,对所监控的画面进行不间断分析,并采用智能算法与用户 定义的安全模型进行对比, 一旦发现有安全威胁,立刻向监控中心预警或报 警。
2、 由于有强大的智能特性,能提高报警精确度
智能电视监控系统,能够有效地提高报警精确度,大大降低误报和漏报 现象的发生。因为智能电视监控系统的网络摄像机或视频服务器等前端设备, 集成了强大的图像处理、识别与跟踪能力,并运行高级智能算法,使用户可 以更加精确地定义安全威胁的特征。从而能有效地降低误报和漏报现象,以 减少无用数据量。如用户可以定义一道虚拟警戒线,并规定只有跨越该警戒 线进入或走出时才产生报警,从警戒线旁边经过则不产生报警。也可以说, 如用户定义只有穿越房门的活动才产生报警,而经过房门的活动不产生报警 等。
3、由于有强大的智能特性,能提高响应速度
智能电视监控系统,拥有比普通网络电视监控系统更加强大的智能特性, 它能够识别可疑活动,如有人在公共场所遗留了可疑物体(爆炸物),或者有 人在敏感区域停留的时间过长等,因此在安全威胁发生之前就能够提示安全 人员关注相关监控画面,使安全部门有足够的时间为潜在的威胁做好准备工 作。此外,还可以使用户更加确切的定义在特定的安全威胁出现时,应当采 取的动作,并由监控系统本身来确保危机处理步骤能够按照预定的计划精确 执行,有效地防止在混乱中由于人为因素而造成的延误。4、能有效扩展视频资源的用途
无论是传统的电视监控系统还是网络电视监控系统,其所监控到的视频 画面都只能应用在安全监视领域,而在智能电视监控系统中,这些视频资源 还可以有更多的用途。如可将视频资源应用到非安全领域银行大堂的监视 录像可以用来加强对客户的服务,智能电视监控系统可以自动识别VIP用户 的特征,并通知客服人员及时做好服务工作;发现人群中有人不慎跌倒时, 及时通知附近的工作人员提供帮助;智能电视监控系统,还可以帮助统计当 天光顾的客户数量,用以分析营业情况等。


下面将结合附图及实施例对本发明作进一步说明,附图中
图1是本发明智能视频监控系统的结构框图2是本发明智能视频监控方法的流程图3是本发明智能视频监控方法的采集到的原始图像;
图4是图3背景建模图5是图3所示运动物体检测图6是图3所示运动物体分割图7是图3所示运动物体去阴影后检测图8是图3所示运动物体去阴影后分割图9是图3所示运动物体轨迹图。
具体实施例方式
如图l所示,在本发明的智能视频监控系统中,包括摄像头31、第一报 警装置33、编码处理器2、数据分析处理器l、显示器42;其中,摄像头31 和第一报警装置33分别与编码处理器2连接,编码处理器2和显示器42分 别与数据分析处理器1连接;编码处理器2用于将摄像头31发送的视频流进 行压縮编码为视频信号,特别地,编码处理器2对图像信号进行MPEG4、H. 263、 H. 264或M-JPEG压縮编码;数据分析处理器1用于将编码处理器2发送的视频信号发送到显示器42进行显示,并进行分析处理,在出现异常情况时,通 过编码处理器2将报警信号发送到第一报警装置33以进行报警。另外对于摄 像头31、第一报警装置33以及显示器42的数量可根据实际需要和用户要求 灵活配置。
在具体设计时,本系统采用C/S模式和B/S模式结合的运行方式。开发 环境为操作系统Microsoft Windows XP。数据库软件Microsoft SQL Server 2005、 Microsoft Access 2003。开发工具Microsoft Visual C++ 2005、 Microsoft Asp. Net 2005。软件需求DirectX 9.0、 DonetFramwork 2.0。 硬件环境为CPU: Pentium IV 3.0以上,RAM 1G以上。其他设备视频采集 摄像机,数字硬盘录像机,智能跟踪高速球,报警控制单元及报警探测器、 警灯警号,现场显示设备。
另外,摄像头31实施为防暴PTZ半圆摄像机,具有PTZ自动跟踪功能, 全方位的安全站点布置克服监控盲区,当有目标侵入时,PTZ自动跟踪模块能 够自动的对准目标,使目标保持在监控范围内,当目标躲入障碍物背后时, 摄像机会一直对准障碍物,相关人员可以迅速赶赴现场进行处理。工作人员 可以手动操作PTZ控制杆,或者通过软件的自动化操作模块进行自动化监控 跟踪。当目标离开了某个摄像机的监控范围,周围其他的摄像机或者传感器 会对其进行接力,只要特定目标没有离开整个布防区域,目标会一直处于监 控范围。这不同于以往的监控模式,当有犯罪事件发生时,不需要工作人员 手动的进行操作,对目标进行跟踪。本系统能够自动的创建报警事件,并自 动的对目标进行跟踪,可以快速的显示报警发生地点的具体的位置。另外, 编码处理器2可实施为视频图像采集卡,以将模拟视频信号转换成数字视频 信号的专用设备。其可以接收来自视频输入端的模拟视频信号,对该信号进 行采集、量化成数字信号,然后压縮编码成数字视频,它是CCD摄像机与计 算机的接口,本图像采集系统选择的是大恒DHCG300视频采集卡,它秉承了 PCI图像卡的特点,即图像采集传输基本不占用CPU时间,在工作过程中,视 频图像经多路切换器、解码器、A/D变换器,将数字化的图像数据送到数据缓 冲器。经裁减、比例压縮及数据格式转换后,由内部DSP控制图形覆盖与数据传输,数据传输目标位置由软件确定,可以直接传送到计算机内存或显存。 它适于图像处理,工业控制,多媒体监控,办公自动化等领域。
在数据分析处理器和外围设备之间的串口通信方面,当数据从串行端口
发送出去时,字节数据转换为串行的位;接收数据时,串行的位被转换为字节 数据。在Windows环境下,串口是系统资源的一部分。应用程序若要使用串 口进行通信,必须在使用之前向操作系统提出资源申请要求打开串口,通信 完成后必须释放资源关闭串口。本系统利用WindowsAPI函数实现通信功能。 API是附带在Windows内部的一个极其重要的组成部分。Windows的API主要 是一系列很复杂的函数和消息集合。它可以看作是Windows系统为在其下运 行的各种开发系统提供的开放式通用功能增强接口 。
数据分析处理器1是利用计算机视觉技术,对视频画面进行分析、处理、 应用的过程, 一般包括以下四个层次移动目标提取、移动目标的跟踪、目 标识别、以及行为分析;其中,移动目标提取的目的是有效地排除外界干扰, 找到并抽取出画面中移动的物体,换句话说,它是一个取证的过程,取得我 们视频分析所需的证据。正是因为如此,他的稳定性与鲁棒性直接决定了后 面的跟踪、识别,以及行为分析的表现,可以说它是数据分析分析处理器1 的最基础数据分析。从技术实现的角度讲,它可以分成三个层次视频画面 的变化分析、过滤噪声、以及区域提取。视频画面的变化分析是对原始视频 流(压縮或非压縮)进行简单的视频分析,得到一些随着时间发生相对变化 的区域。通常采用的算法包括相邻帧做差或建立背景模型做差,以及光流法 等等。过滤噪声的目的在于排除光线变化以及自然与非自然环境变化的扰动, 因此如何消除这些噪声的干扰是有效抽取移动目标的一项重要任务。大体上, 噪声出现的原因可以分为三种。其一,摄像头自噪声,信号干扰,摄像机抖 动,如前景图中的一些细小而又不是很连续的亮点基本属于这一类。其二, 光线变化包括室内,外光线的变化。室外的光线变化变化包括天气变化(由 阴天转晴天,晴转阴,太阳位置移动)、昼夜变化、阴影(云、建筑等)的移 动;室内光线变化包括灯光的明暗变化、光源的位置及方向的变化。而光线 变化所造成的噪声往往比较明显,在前景图中会表现成大片面积的误报。其三,自然环境干扰。它包括树叶的摇动水面的波纹、海浪、浮动的云朵、雨、 雪;还有一些非自然的环境的干扰包括旗子、条幅、窗帘的飘动,以及建筑 物玻璃墙的反射等等。因此经去噪处理过的前景图,与源前景图相比较将有 很大的改善,特别是行人和车的大体形状已经趋于明显,整体的噪声也小了 很多。在区域提取步骤,由上两个环节处理过所得到的前景图像往往是以像 素为单位的,没有一个"物体"的整体概念。另一方面,这样处理过的前景 区域内部很可能存在许多空隙,给描述物体的形状带来不便。在这一环节, 区域提取的主要目的就好似利用一些基本的二值图像(黑与白)的处理算法 对得到的前景图进行加工,填补空隙,并将连接好的区域区分,最后作为一 个整体,其内容可以包括区域大小、位置、形状、颜色、图案等等关键特征 描述信息,供下一步有针对性的分析。经过这一步骤物体里面包含的大部分 空隙将被添上,而且物体的整体形状变得更加平滑。
接着,对目标的跟踪是实现任何一项智能视频分析功能(越界、入侵、 遗留、盗窃、徘徊、流量统计等等)所需要的前提,因为我们必须知道是哪 个物体,在什么时间,什么地点出现过,出现了多久,运动的方向怎样,等 等信息,而这些都只能通过跟踪得到。通过区域提取得到了移动目标的一系 列与表象相关的静态描述,如形状、颜色等等。然而,要跟踪目标以及了解 他们的运动信息,必须利用这些描述建立运动模型,即进行目标表示,建立 运动模型的方法有很多,要根据不同需要而定。最简单的可以是目标的中心 点或质心点,它的好处是可以很明确的地观察到目标运动的周期性。另外还 可以将目标边缘的外接图形(矩形,椭圆等等),用来简单描述目标物体的形 状、大小和位置,这样分解成许多相接的矩形,从而能够很好地描述肢体的 运动情况,用来分析个体的动作行为。具体说,移动目标的提取与跟踪其实 是两个互惠互利的过程。 一方面,如果提取做的很精确,跟踪就会变得很简 单,只要选择目标的中心就可以;另一方面,如果跟踪做的很理想,我们就 可以在移动目标在下一个时间点可能出现的地方着重提取,这样得到的结果 会更加精确。然而,正是由于这方面都存在很大的不确定性,我们需要权衡 双方已得到最好的表现。当然, 一个稳定的跟踪算法是得到最好表现的前提。跟踪的算法有很到,有基于物体颜色位置的,有根据物体运动方向,有级联 其他物体辅助跟踪的,还有采用模板的等等。但言而总之,目的只有一个, 那就是根据移动物体以前的运动状态(包括速度,加速度,方向等)来推测 它可能的下一个位置。再通过前面提取到的移动区域信息进行更正补偿,然 后确认最终位置并更新物体的运动状态以供下一个时间点处理。
以上是一些跟踪的简单情况,往往只涉及到对一个或者几个独立目标的 跟踪。然而,现实情况要复杂很多。这包括单个目标的遮挡、消失、重现、 以及多个目标的聚合、和分离等等。我们不仅需要实现个体的稳定跟踪,而 且需要对这些复杂情况做出判断,从而采取相应的措施以保证不会出现混淆、 纰漏、重复等错误现象。前面所涉及到的视频监控的大前提是单个的静止摄
像头,另外,把视频分析技术应用于多个或者是PTZ摄像机也是一个很热门 的方向。其中,自主式PTZ跟踪能够实现对感兴趣目标的自主对焦、移动及 拉伸,而不需要其它摄像机的辅助。用到的算法与前面我们介绍过的非常相 似,只是需要额外地调节PTZ参数以及考虑PTZ马达移动所需的延时等等。 此外,还有多个摄像机的接力式跟踪和主从式摄像机跟踪等等,这里不再一 一赘述。
对移动目标的识别是重要的过程,它不仅可以增强系统的稳定性、减少 误报率、提高效率,而且为下一步的行为分析打下基础。识别包括两个过程, 一个是机器学习的过程,另一个是基于学习后的结果对新出现的目标的辨识 过程。机器学习包括训练和测试。训练是利用已经知道的信息来指导机器, 使其具有分辨物体的能力。而测试是利用已知的结果测试学习好的机器,评
价其表现并在必要时经过调整后再重新学习。例如车和人的识别(归类),首 先我们需要车和人的样本集,从样本中在分出训练集合测试集分别做训练和 测试。机器学习的方法有很多,包括神经网络、支撑向量机、数据分类(线 性的和非线性的)、概率(贝叶斯、贝叶斯网络、马尔可夫模型、CRF、 g raphical model等等)。分类的依据可以是目标物体的形状、 大小、颜色、图案、对称性,也可以是目标物体的运动方向、速度、加速度, 运动的刚性、周期性。经过学习的机器会构建出相应的模型、模板、分布或子空间以供辨识使用。
在辨识过程中,对于给定一个新的物体,系统将它与已经建立的模型进 行比对,选择最接近的匹配作为它的标签(人、车等)。或者可以把它映射到 学好的空间或者分布之中,选择概率最大或者距离最近的类别做标签。行为 分析的目的是利用识别的结果,对于不同的目标(人,车等),进行有针对性 的行为判断。它是依照一个或者多个目标的出现时间、方向、位置、速度、 大小、目标间距离与相对方向等,通过不同的规则实现不同的功能。其可以
实现的基本功能包括越界,潜伏,超速,遗失,遗留,滞留等等;高级功能 包括流量统计,人的个体行为例如速摔倒,弯腰,坐下;以及一些人与其他 人或物体的交互,例如交接物品、交通事故、上下车等。行为分析没有一个 固定的实现模式。简单的可以是一条规则,如速度上限、方向限制复杂的可 以是一个模型,如人的肢体模型,多人交互模型。
以上的系统结构实现了监控室对监控现场传输的视频进行分析处理,一 方面可以通过显示器42将监控现场的视频图像显示后,由有关人员进行判断; 另一方面通过数据分析处理器1进行智能分析后进行判断;然后如果是有关 人员或数据分析处理器1判断出现异常情况时,可向监控现场的第一报警装 置33发送控制信号,以启动报警。
另外,为了进一步增强本系统的功能,还可根据实际需要或用户要求进 行外围设备的扩展,例如,智能视频监控系统还包括拾音器32和音箱43, 其中拾音器32与编码处理器2连接,音箱43与数据分析处理器1连接;编 码处理器2还用于将拾音器32发送的音频流进行压縮编码为音频信号;数据 分析处理器1还用于将拾音器32发送的音频信号发送到音箱43进行播放。 在这种配置情况下,不仅可以对现场的视频进行采集分析,还可以对音频进 行采集分析,从而避免了摄像头未捕捉到视频图像而实际却发生事故的情形, 从而进一步完善了本系统。
在另一实施例中,智能视频监控系统还包括脚踏报警器35和第二报警 装置44;其中,脚踏报警器35与编码处理器2连接,第二报警装置44与数 据分析处理器1连接;数据分析处理器1还用于接收脚踏报警器35通过编码处理器2发送的报警信号,并控制第二报警装置44进行报警。在该配置情况 下,进一步增强了监控现场在出现异常情况时,主动向监控室进行报警,从 而进一步增强系统的智能性能。
在进一步的实施例中,该智能视频监控系统还包括:麦克风41和喇叭34; 其中,麦克风41与数据分析处理器1连接;喇叭34与编码处理器2连接;
麦克风41通过数据分析处理器1和编码处理器2将采集到的音频流发送到喇 叭34进行播放。在该实施例中,如果监控室的有关人员发现特别紧急的情况 时,可以通过麦克风提醒监控现场的人员,以采取相关的措施,从而避免事 故发生。
另外,对于系统中各种配件的设置,第一报警装置33和第二报警装置44 是蜂鸣器、多音报警器、或声光报警器。摄像头31包括至少一个镜头、以 及图像传感器,并且图像传感器是CCD图像传感器或CMOS图像传感器。编码 处理器2对图像信号进行MPEG4、 H.263、 H. 264或M-JPEG压縮编码。
在本发明的智能视频监控方法中,主要包括两个步骤即运动目标的检 测和运动目标的跟踪,其中检测运动目标包括Sll:采集并预处理M帧图像 序列,其中,M为自然数;S12:根据所述M帧图像序列,初始化背景模型; S13:采集第M+1帧图像序列,基于所述背景模型,对所述第M+1帧图像序列 进行帧间差分和背景差分处理,检测出运动目标;另外,跟踪运动目标包括 S21:对检测到的运动目标,建立目标模型;S22:根据所述目标模型,对检 测到的运动目标进行连续K帧处理,建立目标跟踪信息表,其中K为自然数; S23:建立相邻两帧之间的目标匹配矩阵,矩阵元素是相邻两帧间目标模型的 匹配度,得到运动目标的匹配情况;S24:根据目标模型和目标匹配矩阵,分
析当前帧运动目标状态,并更新目标模型。
如图2所示,在整个监控方法的实施过程中,可分为三大部分,即采集、 检测和跟踪;其中,由高分辨率CCD摄像机拍摄图像序列,采用视频采集卡 将视频图像信号转换成数字图像序列并输入数据分析处理器l。接着,通过视 频流的前M帧提取背景,然后经过当前帧与背景的差分二值化操作后,用形 态滤波对目标的分割结果进行后处理,消除噪声和背景扰动带来的影响。最后进行连通区域检测,准确的标定运动目标。然后,提取运动区域的中心位 置和区域大小信息,建立目标链表,然后通过卡尔曼滤波对目标链表中的被 跟踪目标区域运动趋势进行位置预测,在预测位置范围内进行目标区域匹配 搜索,以建立目标的关联关系,并且用最佳匹配的运动区域对卡尔曼滤波进 行实时更新。
如图4 8所示,在初始化背景模型时,比较相邻帧图像会发现背景像素 点是随时间缓慢变化的,在一定的时间里差别不大。而物体运动变化区域对应 的像素点变化很大。因此可以对选取的背景帧的每一个像素点利用高斯模型 建模。这里我们把RGB模式转化成了HSV颜色模式,用^(R+G+B)/3做为均 值,而方差在一第帧中为0,以后根据光线的变化,计算得到不同的值。
在图像预处理过程中,进行灰度化处理时,图像的GRB分量取相等的值, 图像由原来的三维特征降到灰度化后的一维特征必然丢失部分信息常见的灰 度化方法有最大值法、平均值法、加权平均值法等。可以看出不论采取那种 方法,其原有的颜色特征往往被改变或丢失,使得同一种二值化方法因为一 幅彩图不同的灰度化处理过程常常得到不同的结果。
^"虑妾IJ)l^i^合^i+O^^F面的公式进行灰度转换
其中Gray表示图像中像素的灰度值,R表示该像素的红色分量,G表示 绿色分量,B表示蓝色分量0.30、 0.59、 0.11分别为实验和理论推导证明得 出的最合理灰度图像的权值。
进行图像的二值化处理时,将图像简单的分成背景和目标物体,最常用
的方法就是选取一个阈值;,用5将图像分成两大部分,大于S区域(通常为
目标物体)和小于&的区域(通常为背景),若输入图像为/",力,输出图像为 g"力,贝lj
进行图像的滤波去噪处理时,将输入的图像进行滤波去除噪声,增强图 像,锐化。视频图像一般经过预处理后,使得感兴趣的区域可视化效果得到改善,有利于图像的进一步工作。主要有均值滤波,中值滤波,形态学滤波 等。
在变化区域的检测过程中,帧间差分能够检测出相邻两帧间发生了变化 的区域。这个域实际上包括运动物在前一帧所覆盖的区域即显露区,运动物 体现在所覆盖的区域即在当前帧中就是运动物体本身。
将这两帧图像进行差分处理,作差分的量可以是灰度、亮度、色度值或 其他参数,我们采用灰度值进行差分。首先设定一个阈值,当前一帧的灰度 值减后一帧灰度值的小于这个阈值,则是背景,反之,则是前景。此阈值包 括两部分, 一部分是灰度阈值,另一部分表示光线的变化,它是所有像素灰 度值得平均值,用这个灰度的平均值,使这个差分阈值能适应光线的变化。 若运动物体在场景中静止下来,在相邻两帧中这个物体位置没变,所以在差 分处理中被检测为背景中的点。不会进入到后续处理之中,也就不会被误检 为运动物体。由于变化区域需与背景帧进行进一步的处理来分割出运动物体, 因而这里对阈值的选取不必精确,适应范围很宽。
图像运动意味着图像变化。运动目标检测算法中的一个基本依据是图像
强度的变化,可以用图像序列中相邻时间的一对图像的差来表示强度的相对
变化,图像差运算定义为
力(/^"2) = /(户,,2)-/(/^)
式中厶是差分图像,^ ="力。上式运算涉及对应象素强度的相减运算, 因此这种算法是相当简单的,并且适合于并行实现,图像差分在某种程度上 反映了景物的较高层次性质或蕴含在图像平面上的传感器运动的变化。如果 景物中存在几个相对独立的运动物体和一个移动的传感器,差分图像是这些 运动的组合。对差分图像的分析可得出如下结论
(1) 图像差分可以作为对图像函数进行时间求导的一种逼近。 一个简单 的两点有限差分是对时间区间,2—^的中间点处^^的一种逼近。
(2) 差分图像具有边缘图像的性质,这是由于图像的差分算法与图像梯 度函数算子具有类似的性质。
(3) 在实际图像中,差分图像与静止边缘图像一样,并不是由理想封闭的轮廓区域组成,而往往是表示出不完整的变化信息。例如,当一个物体在 与其图像平面强度(或纹理)类似的背景里运动时,就不能得到有用的差分 图像信息。差分图像所携带的信息并不恰好是绝对的图像强度变化,它涉及 到变化的类型。
差分图像反映了前后两帧图像强度的变化,还能简单的估计运动的方向。
但是差分图像也存在如下的局限性;第一,前后两帧的差分图像只能反映该 两帧图像中运动物体的相对位置变化;第二,它也忽略了缓慢运动目标和运 动着的小物体。
在运动目标的检测过程中,将分割出来的运动变化区域中的像素点与各 自的高斯模型去拟合。我们用像素点的灰度来度量这点的特性,若灰度小于一 特定的阈值,则判断为是显露区,否则为运动物体。
假设所研究的视频序列为(AOc,力L (K为帧序,N为视频序列的总帧数),

A 0,力=^u+i (x,力+ fl (:c,力+ & (x,力+ "t (x,力 A+i (A " = (x,力+ + Ax, _y + Ay) + vw (x,力
其中^+1"力表示第k, k+l帧之间的共同背景区,""力,^ + Ax,"A力分
别对应第K, K+l帧中的运动目标区域,(&, )表示运动目标从第K帧到第K+1
帧的位移失量,"4",力,v"i",力分别表示由运动目标引起的在第K, K+l帧中被 覆盖和显露的背景区域,"^,力,"w(x,力分别表示第K, K+l帧中的噪声。
相邻帧之间的差分图像
D (x,力=(x,力—(x,力
=+ Ax, y + Ay) - a (x,力]+ vi+1力-vt (x,力
上式中,伞+ Ax,"A力-"x,力,^(U)和v^,力均属于运动变化区域令 Mi (Jc,y卜["(x + Ax,少+ Ay)-"(x,力]+ Vw",力-、",力表示运动变化区域, ""力=+ +1"力-"^,力表示相邻两帧之间的相对噪声,则可得到<formula>formula see original document page 20</formula>
由上式可知,差分图像中包括运动目标引起的运动变化区域和噪声两部 分,其中运动变化区域又包括真正的运动目标区域,被覆盖和显露的背景区 域三部分,为了准确地检测出运动目标,尤其是当目标的运动速度较快,在 相邻帧之间的运动位移较大而导致运动变化区域内的被覆盖和显露的背景区 域较大时,可以考虑运动目标的边界信息。运动目标的边界可联合当前帧边 缘检测的结果和运动变化区域而得到。最后,根据由运动目标边界填充得到 的运动目标区域检测出运动目标。
在背景更新的过程中,对显露区和背景区用不同的更新频率进行更新。
当然,显露区的更新频大于背景区。因为显露区为上一帧为运动物体覆盖的
区域,在当前帧被重新显露出来,所以要更快的得到更新。这种处理策略使
得在建模时即使有运动的物体存在,也会随着运动物体的移动而迅速得到干
净的背景帧模型。
为了反映光照变化、噪声等因素对实际背景的影响,可以周期性地执行 背景更新操作,背景更新可以采用此算法,设^为系统中当前保存的背景图
像,^为系统当前采集的图像,计算二者的差分图' 应计算4的阈值T,对其进行二值化得到7,^
/" 卩Y V、 = /',(W)",
固A、," — lo,/di","<r.
以7附aA为开关函数,构造即时背景^:
T ^ v、 — ^c60^),;a"",力^, 々— i/c"",力,/,^",力0.
然后以下式更新背景图像 乙(x,力=fl * /6 (x,力+ (/ - "" /c6 (x, _y). 其中,"为加权系数。
自适在噪声去除过程中,由于噪声的形式多种多样孤立噪声点,具有较小面 积的噪声,运动区域内部的噪声等。对于孤立噪声点和小面积的噪声可以采 用形态学腐蚀和膨胀去除,但对于部分运动物体运动区域内部的噪声及具有 一定面积的噪声块用作形态学腐蚀及形态学膨胀效果不理想,该部分噪声的 处理主要采用边通区域标记法,通过边通区域标记统计出二值图上所有连通 体的个数,并统计出每个连通体的面积,长宽等特征。根据这些统计特性滤 除噪声块,并填充车辆中可能出现的一些空洞。
二值形态膨胀和腐蚀是最基本的二值形态变换操作运算,由此可以构成复 杂的其它形态变换,如形态开运算,形态闭运算,骨架提取,细化等运算。 在预处理中用到形态府蚀、膨胀、开和闭运算,因此只针对这几种基本的形 态操作进行介绍。
将一个集合A平移距离X可以表示为A+X,其定义为
从几何上看如图(7—2)所示,A+X表示A沿矢量X平移了一段距离。
定义B为二值图像,S为给定的结构元素。由此得到基本的二值形态变换。 二值形态腐蚀
腐蚀可以通过将输入图像平移一s,并计算所有平移的交集而得到,其
中将结构元定义为扁平结构。
二值形态膨胀
5十S二u(5 + s;se6^ (7—12)
膨胀可以通过相对结构元素的所有点平移输入图像,然后计算其并集得 到,其中将结构元定义为圆盘结构。
二值形态开
BOS = (,^) S (7—13)
二值形态闭<formula>formula see original document page 22</formula>
二值形态变换中的腐蚀运算是一个收縮变换,它使得目标得到收縮,使得孔洞得到扩张,而膨胀运算是一个扩张变换,它使得目标得到扩张,孔洞得到收縮。因此将膨胀和腐蚀相结合, 一方面可以却除噪声点,另一方面可
以填充孔洞。即形态开和闭运算的效果和作用,具体效果如图(7—5)所示。先对输入图像进行腐蚀运算,再对腐蚀后的图像进行膨胀运算,则可以将一些小的噪声点、突起点等干扰却除。同时能很好地收縮区域内的孔洞,这也是形态开运算的结果。经上述处理后,背景中的噪声己去除,这样提取的运动目标更加合理。
在光照较强的情况下,检测出的运动物体会包含有它的阴影,对运动物体分割精确度要求高的场合还需要将阴影去掉。
在获取运动区域的过程中,本系统采用遗传优化阈值的类间方差法,步
骤如下
1、 参数编码由于遗传算法不能直接处理理解空间的解数据,因此必须通过编码将他们表示成遗传空间的基因型串结构数据,参数编码通常采
用二进制编码和实数编码两种形式。由于图像灰度值在0-255之间,故可用8位二进制码OOOOOOOO-llllllll来代表分阈值,候选阈值即在0 _255之间。
2、 种群初始化在0 —255之间随机产生20个体,将其按二进制的形式进行编码作为遗传算法的初始群体。
3、 种群适应性函数定义种群适应性函数为<formula>formula see original document page 22</formula>使适应性函数值取得最大的T即为差分图像的最优阈值r,用他将当前帧差分
图像分割为前景和背景两部分。
4、 选择操作选择操作是用来确定如何从父代群体中按某种方法选取
哪些个体遗传到下一代群体中的一种遗传算法,操作目的是为了避免基因缺失,提高全局收敛性和计算效率。比例选择采用了轮船赌方式实现。
5、 交叉操作首先对群估中的个体随机取出一对要配对的个体,根据位串长度,对要配对的个体随机选取交叉位置,根据交叉概率实施交叉操作, 随后对两个相互桎的染色体在交叉位置按单点交叉相互交换其部分基因,从 而形式两个新的个体。
6、 变异操作变异是以较小的概率随机地改变染色体串上的某些位。 这里的变异概率取O.Ol,对二进制串基因变异存在两种情况01, 10。
7、 结束条件遗传代数达到60时,结束当前帧差分图像的基于遗传算 法的动态阈值的确定,将获取的阈值作为最优阈值对差分图像二值化。
对二值图像中保留的连通区域进行分析,判断目标物体的属性,精确定 位运动物体位置。计算运动物体在图像平面中的重心,得到重心在图像平面 中的坐标。得到运动物体在图像平面中的坐标后,将其映射到真实环境中, 就可以得到行人在真实世界的位置。利用二值图像在水平方向和垂直方向上 对运动区域进行上下左右边界的定位,该方法能很好的定位出运动区域的范 围。
在目标特征提取过程中,在识别与跟踪过程中,为了有效识别和跟踪, 准确地确定目标特征是运动跟踪与匹配的关键,提取的目标特征质量直接影 响到目标识别的精度和速度。目标的主要特征包括目标的边界,其包括上 下左右四个边界,它是由目标在X轴和Y轴的投影确定的;目标的面积,其是
目标边界所包围的像素点数;目标的重心特征,其是运动目标在当前帧中的 位置;目标的惯性主轴,其方向是用来描叙目标的延伸方向。
目标模型的建立过程中,根据从二值图像中提取的目标特征,为检测出 的运动目标建立相应的特征模板。同一运动目标在相邻的两帧图像中,运动 位置、形状、面积等特征变化不大。利用些特点,可以为检测到的目标建立 特征模板。
如图9所示,对于运动目标进行Kalman滤波位置预测中,Kalman滤波器 具有简单、实时性好等众多优点,在工程中普遍应用。在目标跟踪系统中, 特别是在复杂背景情况下对地面目标的跟踪中,相关跟踪算法是常用的一种 算法。但问题是传统相关算法彩全局搜索的方法,使得计算量相当大,不易 实时实现,而且当发生目标局部遮挡时,目标容易丢失。为解决这个问题,该文采用一种基于Kalman滤波器的目标相关跟踪方法,充分利用Kalman滤波 器的预测功能来预测下一帧目标可能出现的区域,然后在较小的预测区域中 进行相关匹配运算,找到最佳相关匹配点,目标相关跟踪更具主动性。
其中,滤波器原理为Kalman滤波器是一个对动态系统的状态序列进行 线性最小方差误差估计的算法,通过动态的状态议程和观测议程来描述系统。 它可以任意一点作为起点开始观测,采用递归滤波的方法计算。
设线性系统的状态议程和观测议程分别为 状态方程&=A^-观测方程 %《=^^-i+『《-i
这里,XK是K时刻nXl维系统状态向量ZK是K时刻表mXl维观测向量;A是n Xn维系统状态转移矩阵;HK是mXn维系统观测矩阵;WKJ是K时刻过程的nX 1 维随机干扰噪声向量VK是K时刻mXl维的系统观测噪声向量。此处WK, VK通 常假设为互相独立的零均值高斯白噪声向量,我们令QK和RK分别为它们协方 差矩阵
由于系统已确定,贝IJA和HK已知,且WK-1和VK满足一定假设,也已知,设PK是 XK的协方差矩阵,《是XK和^的误差协方差矩阵。
Kalman滤波器方程Kalman滤波器把每个时刻点K的系统状态的后验估计 算的误差协方差减到最小,它分预测和修正两部分完成,Kalman滤波器方程 如下
状态修正方程
Kalman增益系数方程& ^^7^(^^^^ "^)一1
协方差修正方程^^^(7 —《^^)^^ 上述递归方程可由图8-2直观地描述,可以看出它非常有利于计算机编程实
状态修正方程:现。
Kalman滤波利用反馈控制系统估计运动状态,可以估计出某一时间的状 态,并获得该状态的预测值。Kalman滤波公式分出两部分预测和修正。其 中,预测部分负责得用当前的状态和误差协方差估计下一时刻的状态,得到 先验估计;修正部分负责反馈,将新的实际观测值与先验估计值一起考虑, 从而获得后验估计,在每次完成预测和修正以后,由后验估计值预测下一时 刻的先验估计,重复以上步骤,这就是Kalman滤波器的递归工作原理。
对于Kalman滤波器在轨迹预测中的应用,假设目标的运动状态参数为某 一时刻目标的位置和速度。在跟踪过程中,由于相邻两帧图像的时间间隔比 较短,目标在这么短的时间间隔内状态变化比较小,可以假设目标在单位时 间间隔内是匀速运动。
定义Kalman滤波器系统状态A为一个4维向量(^,巧,^^,7^, 。 , 巧,I" y^分别为目标在x轴和Y轴方向上的^和速度。通过图像匹配, 只能得到目标的位置住处所以定义二维观测向量i^K —^^'7^《)表示匹配 得到的坐标。
因为目标在单位时间间隔内是匀速运动的,定义状态转移矩阵A为
<formula>formula see original document page 25</formula>
其中表示连续两帧图像间的时间间隔。 由系统状态和观测状态的关系可知,观测矩阵^^为
<formula>formula see original document page 25</formula>
上文已经假设14^, 「《通常为互相独立的零均值高斯白噪声向量,因此、0 0 0— 0 0 0
0 0 0 1
在跟踪过程中使用Kalman滤波器估计目标的运动分为四个阶段,分别为 滤波器的初始化、状态预测、匹配和状态修正。具体实现步骤如下_
第一步初始化。在第一次使用Kalman滤波器时要对滤波器进行初始化, 将XO赋初值为目标的初位置和速度。在速度未知的情况下,可以设为0,并记 录当前图像时刻,同时设初始误差协方差P(^0。
第二步预测。在新输入的每帧图像中进行匹配搜索之前,记录与上一 帧图像的时间间隔At,预测当前目标的运动状态^。将预测的误差记为 A/^ = ^—用于下一帧中搜索区域的计算。进一步预测新的误差协方差。
第三步匹配。设定以^;'中的(xsk,ysk)为中心的区域为搜索区域, 在该区域内寻找最佳匹配位置,找到最适合的运动目标,将目标区域图像复 制给TK+1,而目标区域左上角第一个像素坐标即为二维观测向量(XWK, YWK), 代入状态修正方程得到(XSK+1, YSK+1),同时计算目标的测量速度VK+t (SK+1-SK) /AT。
第四步修正。求出Kalman滤波器增益系数。根据ZI^ (XWK, YWK),得 到由当前实际观测修正后的状态向量,同时修正误差方差矩阵。
对于目标模型的匹配,对识别跟踪的处理是特征,模板匹配来完成跟踪, 主要领先不同图像特征之间的相似度准则来进行匹配。提供以下几种相似度 评判面积相似度函数;形状相似度函数;运动方向一致性函数;位移可靠 性函数;模糊相似度函数;为此设定了一个综合评判函数,并不属于目标特 征函数。它表示连续两帧的两个目标为同一物体的可能性的大小。它的值, 取决于上面5个判定函数。
对于目标跟踪,根据目标模板匹配的结果,将视频图像中的同一运动目 标关联起来,在图像序列中的目标之间建立对应关系,建立目标键,得到各
1 0 0 1个目标完整的运动轨迹。跟踪包括如下步骤1、跟踪区域的设置,物体的运 动千变万化,而我们只需跟踪我们感兴趣的区域即可。设置跟踪区域要结合 CCD的拍摄情况和感兴趣区域的位置;主要考虑起始线的结束线之间的距离要 足够,确保可以对目标进行连续多帧的跟踪。其形状根据需要设置,可以是 矩形,也可是梯形或多边形。这样有利于排除干扰和提高处理速度。2、建立 跟踪信息表,目标跟踪就是根据目标提取结果,对进入跟踪区域的目标进行 连续帧处理,根据每一个帧图像中提取的检测目标位置,实现运动目标的行 为分析,因此需要建立目标跟踪信息表,保存跟踪信息记录每一帧图像中被 跟踪目标的特征信息,重构物体在跟踪区域的移动轨迹,以及跟踪区域内物 体不断变化,因此数据表的记录也必须随物体的变化而动态更新。
跟踪表每行中的特征根据需要确定,可以是跳跃目标序号、边界、长宽、 面积、重心及惯性主轴等特征信息和目标的位置、运动轨迹等信息。跟踪序 号表示物体进入跟踪区先后的排列序号,同一目标在跟踪过程中保持同样的 跟踪序号。
特征信息是为了确保目标可靠跟踪的重要信息。其中起始特征表示目标
首次进入跟踪区时提取的特征信息;由于目标运动的连续性,目标在每帧表 现的特性也有上结变化,因此需要在每帧图像中提取(或更新)目标特征, 保证跟踪的稳定性。轨迹信息是行为分析的基础,无论做运动预测、分析均 需要每一帧图像中目标的位置信息。目标的预测位置是根据它的历史位置信 息对下一帧中位置的预测值;目标的运动轨迹是由历史位置信息生成的,是 行为分析的最主要依据;目标状态是指目标在历史帧中的状态。利用目标在 本帧图像中的特征可获得目标在上一帧图像中的状态,目标的状态主要包括 正常状态和跳变状态。每帧图像处理完成后,需要更新跟踪信息表。将新进 入跟踪区域运动目标信息加入跟踪信息表,将驶出跟踪区域的目标从信息表 中删除。被跟踪的运动目标完成本帧跟踪后,将目标在本帧的特征信息加入 信息表;跟踪步数自动加l;根据当前跟踪的步数和目标在历史帧中的状态, 确定是否计算运动目标在下一帧中的重心预测值;确定该目标在上一帧的状 态。对于跟踪策略,我们采用了特征匹配加轨迹预测的方法进行跟踪。特征 匹配的跟踪方法搜索范围大,为了减小目标搜索范围,我们采用轨迹预测的 跟踪策略,大大减少了目标搜索时间,提高了跟踪的稳定性和可靠性。轨迹 预测通过运动目标的历史位置信息,预测下一帧图像中目标位置。当下一帧 图像采集完成后,首先在该位置附近的一个较小范围内搜索目标。如果找到
该目标,记录目标位置信息;如果没有找到,则扩大搜索范围。
当运动目标在连续两帧中有目标重叠时,需要做合并或分离处理。可将
需要做合并和分离处理的情况分为两种类型第一类是新老目标之间的合并
或分离,发生在上一帧中的目标和当前帧新目标之间;第二类是老目标间的
合并或分离,发生在上一帧中的老目标之间。
当上一帧目标在当前帧中跟踪消失,而且根据轨迹预测不应该离开跟踪
区域,这时我们可以初步判定有目标重叠,记录消失目标标识,并做如下处

在预测区域的一定范围内搜索位置目标,并根据诡计预测结果初步判断 该区域内有否多个已知目标消失;如果有,则同时赋予该未知目标多个消失 目标标识,留待目标分离后确认;若没有,则除赋予该未知目标新标识外, 还要赋予消失目标的标识。这里需要注意的是搜索区域的确定主要根据前 几步预测误差的最大值确定;这里只能做初步判断,最终结果还要待目标分 离后才能确定,可以称之为疑似合并现象。下几帧跟踪该疑似合并目标,重 点判断目标面积或长度是否快速膨胀,以此进一步判断疑似合并目标的属性。 如果膨胀剧烈,就可以断定有合并发生;否则仍然为疑似合并目标。
如果是合并目标,经过数帧跟踪后,合并目标必定分离。这时需要根据 标识确定的目标属性,通过特征匹配确定每个目标的性质(新、老目标);由 于新目标的特性未知,因此需要对这两种类型分别处理。对于新目标,提取 该目标的特征参数,并在跟踪信息表中增加新目标。对于老目标,需要更新 信息表中的特征信息。再进行新目标的跟踪处理。无论新、老目标,重新做 起始跟踪处理。在老目标匹配时,找到距合并最近的那一帧所对应的合并前 的该目标,计算它与分离后的目标之间的模糊相似度函数值,按最大模糊特征相似度函数值的原则,找到分离后目标和分离前目标之间的对应关系,并 把分离的新目标特征信息按对应关系加入到分离前的目标所在的信息行中。 本发明是通过几个具体实施例进行说明的,本领域技术人员应当明白, 在不脱离本发明范围的情况下,还可以对本发明进行各种变换及等同替代。 另外,针对特定情形或具体情况,可以对本发明做各种修改,而不脱离本发 明的范围。因此,本发明不局限于所公开的具体实施例,而应当包括落入本 发明权利要求范围内的全部实施方式。
权利要求
1、一种智能视频监控方法,其特征在于,包括以下步骤S1检测运动目标S11采集并预处理M帧图像序列,其中,M为自然数;S12根据所述M帧图像序列,初始化背景模型;S13采集第M+1帧图像序列,基于所述背景模型,对所述第M+1帧图像序列进行帧间差分和背景差分处理,检测出运动目标;S2跟踪运动目标S21对检测到的运动目标,建立目标模型;S22根据所述目标模型,对检测到的运动目标进行连续K帧处理,建立目标跟踪信息表,其中K为自然数;S23建立相邻两帧之间的目标匹配矩阵,矩阵元素是相邻两帧间目标模型的匹配度,得到运动目标的匹配情况;S24根据目标模型和目标匹配矩阵,分析当前帧运动目标状态,并更新目标模型。
2、 根据权利要求1所述的智能视频监控方法,其特征在于,在所述步骤 Sll中,所述预处理包括对M帧图像序列的灰度化处理和滤波去噪处理。
3、 根据权利要求1或2所述的智能视频监控方法,其特征在于,在所述 步骤S12中,还包括对背景模型中的每一个像素点进行高斯建模。
4、 根据权利要求3所述的智能视频监控方法,其特征在于,在所述步骤 S13中,对第M+l帧图像序列进行帧间差分处理时,将未发生变化的区域更新 到背景模型中;将发生变化的区域与背景模型进行拟合,以区分出显露区和背 景模型。
5、 根据权利要求4所述的智能视频监控方法,其特征在于,在步骤S13 中,还包括对检测出的运动目标进行去阴影处理。
6、 根据权利要求5所述的智能视频监控方法,其特征在于,所述目标模 型包括面积相似度函数、形状相似度函数、运动方向一致性函数、位移可靠性函数、以及模糊相似度函数。
7、 一种智能视频监控系统,其特征在于,包括摄像头、第一报警装置、编码处理器、数据分析处理器、显示器;其中,摄像头和第一报警装置分别与编码处理器连接,编码处理器和显示器分别与数据分析处理器连接;编码处理器用于将摄像头发送的视频流进行压縮编码为视频信号;数据分析处理器用于将编码处理器发送的视频信号发送到显示器进行显示,并进行分析处理,在出现异常情况时,通过编码处理器将报警信号发送到第一报警装置以进行报警。
8、 根据权利要求7所述的智能视频监控系统,其特征在于,所述智能视频监控系统还包括拾音器和音箱,其中拾音器与编码处理器连接,音箱与数据分析处理器连接;编码处理器还用于将拾音器发送的音频流进行压縮编码为音频信号;数据分析处理器还用于将拾音器发送的音频信号发送到音箱进行播放。
9、 根据权利要求7或8所述的智能视频监控系统,其特征在于,所述智能视频监控系统还包括脚踏报警器和第二报警装置;其中,脚踏报警器与编码处理器连接,第二报警装置与数据分析处理器连接;数据分析处理器还用于接收脚踏报警器通过编码处理器发送的报警信号,并控制第二报警装置进行报警。
10、 根据权利要求9所述的智能视频监控系统,其特征在于,所述智能视频监控系统还包括麦克风和喇叭;其中,麦克风与数据分析处理器连接;喇叭与编码处理器连接;麦克风通过数据分析处理器和编码处理器将采集到的音频流发送到喇叭进行播放;第一报警装置和第二报警装置是蜂鸣器、多音报警器、或声光报警器;编码处理器对图像信号进行MPEG4、H. 263、 H. 264或M-JPEG压縮编码;摄像头包括至少一个镜头、以及图像传感器;图像传感器是CCD图像传感器或CMOS图像传感器。
全文摘要
本发明涉及一种智能视频监控方法及系统,该系统包括摄像头、第一报警装置、编码处理器、数据分析处理器、显示器;该方法包括运动目标的检测和跟踪,实施本发明的智能视频监控方法及系统,以普通的网络电视监控为基础,除了具备广为人知的网络电视监控的优势外,智能电视监控系统还能为用户带来更大的收益。其主要的优点是①可进行24×7全天候可靠监控;②由于有强大的智能特性,能提高报警精确度;③由于有强大的智能特性,能提高响应速度;④能有效扩展视频资源的用途。
文档编号H04N7/18GK101635835SQ20081014262
公开日2010年1月27日 申请日期2008年7月25日 优先权日2008年7月25日
发明者斌 唐, 施欣欣, 林锦松, 袁道仁, 黄远松 申请人:深圳市信义科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1