街面监控视频中搜索指定特征人像方法

文档序号：6523916阅读：221来源：国知局

专利名称：街面监控视频中搜索指定特征人像方法
技术领域：
本发明涉及地理信息系统、视频监控系统、视频服务器系统，尤其涉及视频传输及图像识别方法。
背景技术：
先简单描述一些与本发明有关的一些概念地理信息系统是地理数据输入、管理、分析和输出的计算机系统。英语Geographic Information System，缩写为GIS。
数字视频监控系统是视频数据采集、存储、管理的计算机系统。
数字视频服务器系统是视频数据采集、存储、管理、传输的计算机系统。
数字视频数据将视频的模拟信号数字化，并压缩存储成视频数据。
图像识别系统在现有图像中将需要的图像部分找出并与指定的图像进行比对的计算机系统。
GIS作为一种信息系统，是以现实世界为研究目标，以计算机内部的二进制数字世界为存储载体的。它将人们对于客观世界的理解，经过一系列处理后变成数字形式储存于计算机之中，并对储存的数据进行各种分析，挖掘出人们关心和有用的信息，并以直观的方式进行展现。目前，GIS技术已经越来越广泛的应用在各种领域，特别是GIS空间分析中的地理编码和最短路径分析技术，使用更是非常广泛，比如超市网点送货管理系统等，就是使用了客户地址实时定位以及送货最短路径搜索等技术。
数字视频监控系统是将摄像头拍摄的模拟视频信号转化为数字视频存储在计算机内部的二进制数字载体的。它将人们看到的客观世界，经过处理后变成数字形式储存于计算机中，并可以方便的展现。目前随着计算机存储体的大量普及和降价，以及数字存储安全不易丢失等特点，数字视频监控系统越来越普遍的代替原有的默认监控系统应用于道路、小区、楼宇、工厂等。
数字视频服务器系统是将数字视频数据压缩、分包，并通过网络传输到人们需要观看的地点，实现分布式多点传输。随着网络基础建设的完善，目前的网络设施已经可以满足视频传输的要求，因此人们开始越来越多的应用网络，来达到可以在任意地点进行监控的目的。
图像识别系统是以人们看到的图像世界为研究目标，采用智能图像比对技术，达到自动识别出相识或相近的部分，为人眼识别提供辅助，减少人类识别的工作量、并能够很好的克服人类易疲劳等缺点。随着安防形势的变化，目前指纹识别、掌纹识别、瞳孔识别、字体识别等已经被大量应用，面部识别由于技术仍然不够成熟以及计算机速度的影响等，还没有大量应用。
目前，在重要路口、人群聚集处以及重要企事业部门的主要门口安装有高清晰监控头，在基层公安机关建立监控指挥中心，负责监控指挥下辖的各监控点，在上级公安机关也建立指挥中心，与下属各部门指挥中心联网，实现跨区域协作指挥，通过数字光纤技术，组建光纤网络，专用于监控视频信号的传输，实现上述各监控点及各指挥中心间的高清晰视频信号的多点互传及互相操作，将分布在各个视频监视点的单台独立的摄像机组建成具有相互配合的摄像机网络，从而发挥摄像机群的强大成慑力和捕捉第一时间现场的多种优势。
但是，目前的街面监控图像中，现有的摄像机大都配有水平(355°)垂直(90°)云台和变倍镜头或高速球型摄像机，但是在路口同一时间只能看到的有效范围只有全方位的1/6甚至更少。虽然各指挥中心都配置了专人守候在指挥中心的大屏幕前，但人的疲劳和心理状态决定了无法有效的全程监控，看似场面很宏大、壮观但是其实际的作用是极为有限的，无法主动的从图像上发现谁是犯罪分子以及突发事件发生的地点。
由于只能采取一种守株待兔的录像方式，无法及时的捕捉到案发现场的清晰图像，即使有幸录到了，录像由于受到光线、视角以及现场环境的影响其清晰度及有效性已经大为降低。目前使用的录像资料大都体现不出其实用价值。在实际办案中只能处于极为被动的地位。
在目前的街面视频图像中，要应用面部识别仍然存在如下不足1视频景象过远，只有比较高级的摄像头才可以有效高速的扑捉面部图像；2使用者面部的位置与周围的光环境都可能影响系统的精确性；3大部分研究生物识别的人公认面部识别最不准确，也最容易被欺骗；4面部识别技术的改进有赖于提取特征与比对技术的提高，采集图像的设备比技术昂贵得多；
5对于因人体面部的如头发，饰物，变老以及其他的变化需要通过人工智能补偿，机器学习功能必须不断地将以前得到的图像和现在的得到的进行比对；以改进核心数据和弥补微小的差别；6很难进一步降低成本，必需以昂贵的费用去卖高质量的设备。
基于上述问题，目前虽然已经将各处的视频进行了联网传输和控制，但流行的监控视频系统中，都还没有使用图像识别。
总之，目前的街面监控图像中，普遍存在可视范围小、图像模糊、人体图像过小、无法有效识别的问题，很多情况下，人眼也无法识别，而在目前的面部识别技术较不成熟的状况下，自动识别更是困难重重。

发明内容
本发明的目的在于在目前的技术水平、计算机速度及视频质量基础上，提出一种实用的智能比对方法。
在街面实时视频及历史视频数据中，利用需要搜索对象的衣着特征、发型特征、以及体态特征等，在实时视频中找到该对象，或者在某段时间的历史视频中搜索，以便发现该对象的活动区域、时间等信息。
本方法的特征是比对时不再局限于面部，而是以人体的各种特征为参考依据，根据人体的衣着特征、发型特征、以及体态特征进行比对。

图1是发明中的算法用到的是HSV颜色空间示意图。
具体实施例方式
在各监控指挥中心的数字视频服务器系统中建立按指定摄像头及时间段传输的机制，将街面摄像头地理信息、控制信息、连接方式等存入关系型数据库，在GIS中加入街面摄像头地理信息，并在此基础上建立视频图像的人像搜索系统。
人像搜索系统的实施方法说明如下1、颜色空间及颜色距离一般来说，视频的截图是BMP格式的，象素由RGB值来表达。视频解码出的图片是32位位图，除了R，G，B三个通道外，还有一个未用到。RGB空间的颜色相似度(距离)通常是由欧氏距离来表达，如D＝(R1-R2)*(R1-R2)+(G1-G2)*(G1-G2)+(B1-B2)*(B1-B2)。当距离小于某个阈值时，认为两种颜色相似。缺点在于，此颜色空间的颜色相似性与人的视觉系统有一定的差异，即人眼觉得相似的，但可能欧氏距离会很大；欧氏距离小的，人眼感觉并不相似。在图像的检索中若用到直方图，可能RGB空间会比较适用。
因此本发明中的算法用到的是HSV颜色空间。此空间的特点是，考虑到了人眼的视觉感受同颜色相似的关联。参见图1Hue代表色度，Sature代表色饱和度，Value为亮度。
因此需要将RGB空间转换到HSV空间。有固定的转换公式。
v=max(r,g,b)s=[v-min(r,g,b)]/vh=5+b′if r=max(r,g,b)and g=min(r,g,b)1-g′if r=max(r,g,b)and g&NotEqual;min(r,g,b)1+r′if g=max(r,g,b)and b=min(r,g,b)3-b′if g=max(r,g,b)and b&NotEqual;min(r,g,b)3+g′if b=max(r,g,b)and r=min(r,g,b)5-r′otherwiser′=[v-r]/[v-min(r,g,b)]g′=[v-g]/[v-min(r,g,b)]b′=[v-b]/[v-min(r,g,b)]]]>其中r，g，b∈
，h∈
，and s，v∈
。
颜色距离1真彩色的图像有成千上万种颜色值，在实际的计算中没有必要对具体精确的值来处理。另外，人眼的感知有个模糊性，所以先做量化是比较好的选择。实际的HSV空间的量化有几种选择，这里选择量化成72级。量化算法如下
if(h＜＝20||h＞315)h＝0；if(h＞20&&h＜＝40)h＝1；if(h＞40&&h＜＝75)h＝2； if(s＜＝0.2)s＝0；if(h＞75&&h＜＝155)else if(s＞0.2&&s＜＝0.7)h＝3； s＝1；else if(s＞0.7&&s＜＝1.0)if(h＞15&&h＜＝190)s＝2；h＝4；if(h＞190&&h＜＝270)h＝5；if(v＜＝0.2)if(h＞270&&h＜＝295) v＝0；h＝6； else if(v＞0.2&&v＜＝0.7)v＝1；if(h＞295&&h＜＝315) else if(v＞0.7&&v＜＝1.0)h＝7； v＝2；h量化8级，s和v量化成3级。最后化为一个颜色矢量来代表此种颜色值。
I＝9*h+3*s+v；得到矢量后，就要考虑颜色的矢量距离以刻画相似程度。基本思路是两种颜色的矢量值相减得到绝对值差，然后与大的矢量值相除得到归一化的距离d1＝|I1-I2|/max(I1，I2)。此值在一定程度上能表示两种颜色的距离。
颜色距离2颜色距离1提到的HSV空间的量化，会造成一定的误差和漏检。这里的第2种颜色距离采用的是HSV空间标准的欧氏距离的一个变化形式。
d2=[(vi-vj)2+(sicos(hi)-sjcos(hj))2+(sisin(hi)-sjsin(hj))2]1/2/5]]>其中i和j代表两种不同的颜色。
距离合成颜色的量化是为了考虑到用户主观判断的模糊性，以及屏蔽这种主观差异。而实际上又要保持一定的颜色差的精确度。解决方法是将两种距离合成在一起，并根据实际的需要赋予不同的权值。D＝w1*d1+w2*d2。取w1＝0.8，w2＝0.2。得到合成后的距离，可以作为颜色相似程度的度量。搜索图片制定区域的所有象素，设定一个阈值T，如果距离D(Ci，C)，即指定要检索的颜色和象素的颜色差别小于阈值，就认为是同种颜色，在调试时，可以将对应的象素点值置为255，而大于阈值的点置为0，得到二值化图像。
结果输出根据经验值，累计的颜色相似象素点超过区域象素点的某个比率时，认为检测到具有该颜色特征的目标。目前此比率取为0.09。
2、背景处理背景的影响是不可忽视的。实验表明，当背景点的象素值与指定的颜色值很相似时，算法没有办法予以区分。
由于是监控视频流图像，因此总是假定初始的几帧图像是不包含运动目标的。但是，随着时间的推移，光照的变化，摄像头的移动，背景组成的变化等因素的影响，需考虑背景的更新。目前采取的是背景平均法。即在处理当前帧图片时，将当前图片于前面计算得到的背景图片象素值相加取二者的均值，这样会得到一定误差，但是只要阈值适当，误差可以部分消除。
B(i)＝(B(i-1)+Ti)/2。Bi为背景，Ti为当前帧。计算图像区域内每个象素点的灰度值，并与背景对应点的灰度值相减的到绝对差值，设定一个阈值T，当灰度差小于此阈值时，认为当前点是背景点，在相似象素点集合中予以剔除，反之保留。
下面以典型的公安处理报警的过程为例，详细说明如下在接到报警后，警员将嫌疑目标出现时间、位置，以及嫌疑目标的特征输入搜索系统，搜索系统根据GIS空间分析的结果，可以确定嫌疑目标下一时间可能出现的位置，以及上一时间可能的位置，从而确定要搜索的指定时间及指定地点的监控点的视频。
在实时视频中搜索嫌疑目标，如果找到嫌疑目标，则将实时图像提供给警员，供警员转动摄像头方位及缩放图像，以便于确认及得到更清晰的图像，并通知巡逻民警和跟踪嫌疑目标，更可以根据目标的位置预测嫌疑目标将来可能的移动方向，并控制摄像头转向较好的摄像角度，调度相应的出警。
在历史数据中搜索，将搜索结果图像标出，为以后在供目击人员辨认及到嫌疑位置调查等提供证据。
本发明是将图像识别与数字视频数据结合，提供了一种较为节省资源的识别方法，以此来在现有网络资源及计算机能力的基础上达到最好的智能处理方法。
权利要求
1.一种在街面监控视频中搜索指定特征对象的方法，其特征是比对时不再局限于面部，而是以人体的各种特征为参考依据，根据人体的衣着特征、发型特征、以及体态特征进行比对。实现在目前的技术水平、计算机速度及视频质量基础上，完成智能识别。
全文摘要
本发明提供在街面监控视频中搜索指定特征对象的方法，其特征是比对时不再局限于面部，而是以人体的各种特征为参考依据，根据人体的衣着特征、发型特征、以及体态特征进行比对。实现在目前的技术水平、计算机速度及视频质量基础上，完成智能识别。
文档编号G06K9/00GK1916931SQ20051002893
公开日2007年2月21日申请日期2005年8月19日优先权日2005年8月19日
发明者张宪民, 井祥元, 陈林波申请人:上海正电科技发展有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张宪民;井祥元;陈林波
技术所有人：上海正电科技发展有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。