人数统计方法和人数统计装置与流程

文档序号:15077217发布日期:2018-08-01 02:11阅读:368来源:国知局
本发明涉及一种人数统计方法和人数统计装置,更具体地说,涉及一种基于视频统计规定时间内通过规定场所断面的人数的人数统计方法和人数统计装置。
背景技术
:在现有技术中,为了统计规定时间内通过规定场所断面的人数(也称为“客流人数”),通常利用视频解析算法(例如,光流法)对摄像机摄取的视频进行视频解析。专利文献1公开了一种基于乘客多运动行为分析的公交车客流统计方法,其包括如下步骤:获取乘客上下公交车的视频图像;对获取的视频图像进行处理,提取乘客头部目标,生成矩形框框定提取出的乘客头部目标;结合乘客头部目标形心点距离对相邻帧中形心点进行匹配,更新形心点位置信息并保存,连接各形心点获得运动轨迹;对获得的运动轨迹进行轨迹聚类,分析乘客运动行为;计数判定,得到人数统计结果。根据该方法,可以克服现有客流统计方法出现误判和漏判的不足,有效提高公交车内乘客人数统计的准确度。专利文献2公开了一种基于视频监控的客运站非出入口区域的客流统计方法,其对于客运站非出入口区域拍摄的图像容易出现遮挡的特点,提出使用行人的不易被遮挡、且形态基本不变的头肩部haar-like特征来对行人进行检测,其检测判别是否为行人的准确率较高,适用于行人图像出现遮挡的应用场景;而在完成检测后,通过kalman滤波器和以上检测行人的方法来对行人在每帧图像的位置进行双重追踪,以保证追踪的准确率。专利文献1:cn103646253a;专利文献2:cn106127812a。技术实现要素:但是专利文献1、2均使用了单纯的视频解析算法,由于受到外界环境和算法本身的限制,准确率受到了约束。我们发现,通过视频解析算法得到的客流人数与真实的人数之间存在着比较强的趋势性,故通过回归建模方法可以大幅度地提高客流统计的精度。由于视频解析算法的性能受到很多外界因素的影响而呈现出不稳定。例如,即使是同一摄像机,在工作日(例如,周五)与休息日(例如,周六)的同一时间段,当客流的拥挤程度不同时,视频的解析精度也会不一样。或者例如在某天上午和下午同样有5个乘客经过摄像机拍摄的同一区域,但是由于上午的乘客分散着通过,下午的乘客拥挤在一起通过,因此摄像机在上午可能检测到了5个人,但是在下午的时候只检测到了3个人。本发明为了解决现有技术中存在的上述问题,提供一种人数统计方法和人数统计装置。在该人数统计方法和人数统计装置中,我们引入了实时的视频特征、摄像机的环境特征及配置参数特征等加入到模型的训练,可以使校正模型更加稳定,适应各种不同的环境。本发明的第一方面是一种人数统计方法,其特征在于,包括:取得对第一视频进行视频解析(也称为“图像分析”)而获得的第一视频解析人数作为待校正的视频解析人数的第一人数取得步骤;取得该第一视频的时间戳、视频特征、摄取该第一视频时的摄像机所处环境的环境特征和摄像机的配置参数的第一特征取得步骤;和根据与所述第一视频对应的时间戳,从包含时间戳、视频解析人数、视频特征、环境特征和配置参数的校正用模型库寻找对应的校正用模型,输入所述待校正的视频解析人数以及与所述第一视频对应的所述视频特征、所述环境特征和所述配置参数,获得校正后的人数的人数校正步骤。本发明的第二方面是一种人数统计方法,其在第一方面的人数统计方法的基础上,也可以构成为,所述校正用模型库是通过以下步骤形成的:取得对第二视频进行视频解析而获得的第二视频解析人数和与该第二视频对应的真实人数的第二人数取得步骤;取得该第二视频的视频特征、摄取该第二视频时的摄像机所处环境的环境特征和摄像机的配置参数的第二特征取得步骤;使所述第二视频解析人数、所述真实人数、以及与该第二视频对应的所述视频特征、所述环境特征和所述配置参数相互对应,生成包含这些特征的数据集的数据集生成步骤;根据所述数据集中包含的时间戳,按时间将所述数据集分成多个子数据集的子数据集生成步骤;和基于所述子数据集生成校正用模型,由多个所述校正用模型构成校正用模型库的模型库生成步骤。本发明的第三方面是一种人数统计方法,其在第二方面的人数统计方法的基础上,也可以构成为:所述真实人数是根据行人通过闸机时生成的闸机数据而统计得到的,在所述第二视频的视频数据与所述闸机数据存在时间差的情况下,在生成所述数据集之前,还包括求取所述时间差,使所述视频数据与所述闸机数据在时间上对齐的时间对齐步骤。本发明的第四方面是一种人数统计方法,其在第二方面的人数统计方法的基础上,也可以构成为:在所述第二特征取得步骤中,还包括从所述视频特征、所述环境特征和所述配置参数所包含的特征中除去部分特征的步骤。本发明的第五方面是一种人数统计方法,其在第一方面~第四方面中任一方面的人数统计方法的基础上,也可以构成为:所述视频特征包括画面客流密度、亮度变化和对比度,所述画面客流密度是视频中所有帧的客流密度的最大值,所述亮度变化是视频中所有帧与其相邻帧的亮度差的平均值,所述对比度是视频中所有帧画面的对比度的平均值。本发明的第六方面是一种人数统计方法,其在第二方面~第四方面中任一方面的人数统计方法的基础上,也可以构成为:在所述模型库生成步骤中,利用线性回归方法对所述子数据集进行训练而生成所述校正用模型。本发明的第七方面是一种人数统计方法,其在第一方面~第四方面中任一方面的人数统计方法的基础上,也可以构成为:所述视频特征包括对比度,所述对比度指视频中所有帧画面的对比度的平均值,将每帧画面中规定区域的对比度作为该帧画面的对比度,所述画面中的规定区域是从画面中关注的乘客通行断面起前后各占1人的区域。本发明的第八方面是一种人数统计装置,其特征在于,包括:取得对第一视频进行视频解析而获得的第一视频解析人数作为待校正的视频解析人数的第一人数取得模块;取得该第一视频的时间戳、视频特征、摄取该第一视频时的摄像机所处环境的环境特征和摄像机的配置参数的第一特征取得模块;和根据与所述第一视频对应的时间戳从包含时间戳、视频解析人数、视频特征、环境特征和配置参数的校正用模型库寻找对应的校正用模型,输入所述待校正的视频解析人数以及与所述第一视频对应的所述视频特征、所述环境特征和所述配置参数,获得校正后的人数的人数校正模块。本发明的第九方面是一种人数统计装置,其在第八方面的人数统计装置的基础上,也可以构成为,还包括:取得对第二视频进行视频解析而获得的第二视频解析人数和与该第二视频对应的真实人数的第二人数取得模块;取得该第二视频的视频特征、摄取该第二视频时的摄像机所处环境的环境特征和摄像机的配置参数的第二特征取得模块;使所述第二视频解析人数、所述真实人数、以及与该第二视频对应的所述视频特征、所述环境特征和所述配置参数相互对应,生成包含这些特征的数据集的数据集生成模块;根据所述数据集中包含的时间戳,按时间将所述数据集分成多个子数据集的子数据集生成模块;和基于所述子数据集生成校正用模型,由多个所述校正用模型构成校正用模型库的模型库生成模块。本发明的第十方面是一种人数统计装置,其在第九方面的人数统计装置的基础上,也可以构成为:所述真实人数是根据行人通过闸机时生成的闸机数据而统计得到的,所述人数统计装置还包括时间对齐模块,该时间对齐模块在所述一段时间的视频的视频数据与所述闸机数据存在时间差的情况下,在生成所述数据集之前,求取所述时间差,使所述视频数据与所述闸机数据在时间上对齐。发明效果根据本发明的人数统计方法和人数统计装置,能够获得更接近真实人数的统计人数。附图说明图1是表示实施方式1的生成校正模型库的流程图。图2是表示一帧画面中的被求取对比度的规定区域在该帧画面中的位置的示意图。图3(a)表示afc数据与视频数据之间存在时间差δt时的情况,图3(b)表示afc数据与视频数据之间时间对齐后的情况。图4是实施方式1中利用校正模型对基于视频解析算法获得的客流人数进行校正的流程图。图5是表示实施方式2的生成校正模型库的流程图。图6是表示实施方式3的生成校正模型库的流程图。具体实施方式(实施方式1)如之前所述,摄像机的外部环境对视频解析的准确率施加影响。并且,本发明的发明者还发现,视频的视频特征、摄像机的环境特征和摄像机的配置参数也与视频解析的准确率相关。为了统计出真实的客流人数,本发明首先针对“视频特征”、“摄像机的外部环境的环境特征”、和“摄像机的配置参数”生成校正模型,然后利用该校正模型对利用传统的视频解析方法获得的客流人数进行校正,从而获得更加真实的客流人数。图1是表示实施方式1的生成校正模型库的流程图。首先,采集afc(autofarecollection:自动检票)数据(步骤1)。afc数据是地铁站内检票闸机的刷卡数据,记录了乘客通过闸机时的时间,可以用来统计某一个时间粒度上进出某一组闸机的真实客流人数。afc数据一般包括:乘客使用的卡的卡号、卡类型、闸机设备的编号、交易时间(刷卡时间)、交易日期、闸机编号和闸机所在的车站的编号等信息。一个时间粒度(timeparticle)的长度可以是5秒、30秒、1分钟、5分钟、1小时等,没有特别限定,根据实际的应用场景决定,本实施方式选用30秒的时间粒度。关于时间粒度的定义与确定方法,由于属于现有技术,在此不进行具体说明。如上所述,在本实施方式中,为了获得某一个时间粒度上进出某一组闸机的真实客流人数,根据afc数据来统计人数并将根据afc数据统计出的人数作为真实客流人数。但是,本发明并不限于此,只要能够获得规定时间内通过规定场所的真实人数即可,并不限于获得真实人数的方式。例如,也可以通过人工统计来获得真实人数。例如,我们可以通过人眼查看视频,记录下乘客刷卡的日期、时间和进行拍摄的摄像机编号等信息。或者,也可以在摄像机进行摄像的现场通过人眼直接观察通过闸机的客流,记录下乘客刷卡的日期、时间和进行拍摄的摄像机编号等信息。然后,利用通常使用的视频解析方法对由摄像机摄取的时间粒度的视频进行视频解析,统计该时间粒度内的客流人数,并获取该时间粒度的视频的视频特征和时间戳(步骤s2)。上述视频特征包括:画面客流密度(d)、亮度变化(l)和对比度(g)。上述时间粒度的视频(以下,简称“一段视频”)是由很多帧的画面共同组成的(通常是25帧/秒),可以先利用通常使用的视频解析方法获得每一帧画面的客流密度、亮度和对比度,然后求取上述一段视频的视频特征。其中,画面客流密度(d)是指视频中所有帧的客流密度的最大值,可以通过以下式(1)求得。“画面客流密度”可以根据每平方米的客流人数分为(1,2,3,4,5,6)六个等级,其中1表示最小的客流密度,6表示最大的客流密度。d=maxidi(1)假设上述一段视频包含n帧画面,则i的取值范围是1~n。亮度变化(l)是指一段视频中所有帧与其相邻帧的亮度差的平均值,可以通过以下式(2)求得。l=avgi|li+1-li|(2)对比度(g)指一段视频中所有帧的对比度的平均值,可以通过以下式(3)求得。g=avgigi(3)在求取各帧的对比度时,既可以求取整个帧的画面的对比度,也可以求取画面中的规定区域的对比度作为该帧的对比度。下面利用附图2说明利用画面中的规定区域的对比度作为该帧的对比度的情况。图2是表示一帧画面中的被求取对比度的规定区域在该帧画面中的位置的示意图。图2中,最外侧大方框表示一帧画面(即,一帧图像),箭头“→”表示客流(圆圈“○”表示的行人)的行走方向,虚线所示的方框区域表示上述的画面中的规定区域,实线表示画面中关注的乘客通行断面。本发明也可以求取该虚线所示的方框区域的对比度作为该帧的对比度。该虚线所示的方框区域的大小可以是:在图2中,从画面中关注的乘客通行断面起前后各占1人的区域。更具体而言,在图2中,该虚线所示的方框区域以画面中关注的乘客通行断面(例如闸机的检票处)为中心,乘客行进方向的长度为该方向上2人所占区域的长度,左右方向的长度为画面中关注的乘客通行断面的宽度。摄像机不仅可以架设在地铁的闸机处,还可以架设在地铁站出入口、楼梯等其他位置。因此,图2中的乘客通行断面不仅可以是闸机的检票处的乘客通行断面,也可以是地铁站出入口、楼梯等其他位置的乘客通行断面。步骤s2中取得的时间戳包含上述一段视频的日期、开始时间和结束时间。在完成步骤s2之后,采集摄像机的环境特征和配置参数(步骤s3)。其中摄像机的环境特征包括“目标像素尺寸(sz)”、“摄像机与目标角度(ag)”、“区域类型(ar)”和“拥挤程度(cr)”。其中,“目标像素尺寸”是指画面中的每个人的人头部分所占用的像素的量。例如,当目标像素尺寸为80×250时,表示人头部分在画面中的宽度方向上占用80个像素,在长度方向上占用250个像素。关于“摄像机与目标角度(ag)”,当摄像机与水平面平行时,摄像机与目标角度为0;当摄像机与水平面垂直时,摄像机与目标角度为90。区域类型是指客流通过的场所,包括“楼梯”、“地铁站闸机”、“地铁站出入口”等。拥挤程度是由专家根据该场景的平时表现来决定的,可以根据每平方米的客流人数分为“低,中,高”三个等级。配置参数(lu,sh,……)包括“亮度等级(lu)”和“摄像机设置高度(sh)”等70多项参数。其中,“亮度等级”可以分为六个等级(1,2,3,4,5,6),“1”表示“最低亮度”,“6”表示“最高亮度”。由于摄像机的配置参数属于现有技术,因此在本说明书中省略对该70多项配置参数的详细说明,在本说明书中仅列举“亮度等级(lu)”和“摄像机设置高度(sh)”作为例子。然后,将在步骤s2中计算得到的视频特征(d,l,g)和在步骤s3中得到的环境特征(sz,ag,ar,cr)和配置参数(lu,sh,……)汇总成(d,l,g)(sz,ag,ar,cr)(lu,sh,……),并且,为了减少计算量,除去(d,l,g)(sz,ag,ar,cr)(lu,sh,……)中的某些无用或者用处不大的项(即,某些无用或者用处不大的特征),进行特征选择,得到特征向量(步骤s4)。这里,关于哪些特征有用,哪些特征用处不大,在此基础上进行特征选择是一个很成熟的研究领域,不是本发明的发明点,这里不进行详细说明。例如,进行特征选择时,可以使用mrmr(minimum-redundancy-maximum-relevance:最小冗余最大相关)算法,选出最好的特征集。另外,也可以将(d,l,g)(sz,ag,ar,cr)(lu,sh,……)简单记作f1f2f3,其中,f1表示(d,l,g),f2表示(sz,ag,ar,cr),f3表示(lu,sh,……)。在步骤s4中,假定配置参数中的“sh”之特征被除去,则最终得到的特征向量f1f2f3是(d,l,g)(sz,ag,ar,cr)(lu,……)。其中,例如,如之前所述,这些特征中的“cr”表示“拥挤程度”,其取值是(低、中、高)中的一个。由于这些特征的选择以及各个特征的取值范围属于现有技术,因此在本说明书中省略其详细说明。另外,在步骤s4中,删除了配置参数中的“sh”之特征,但是不限于此,也可以删除整个配置参数的任意特征。地铁站中的闸机获得的数据存储在afc服务器中,摄像机摄取的视频数据存储在摄像机服务器中。当afc服务器与摄像机服务器之间存在时间差时,从afc服务器获得的afc数据的时间戳与从摄像机数据服务器获得的视频数据的时间戳也会存在时间差,这样的时间差会影响校正模型的生成。下面计算afc数据与视频数据之间的时间差,并将afc数据与视频数据对齐(步骤s5)。图3(a)表示afc数据与视频数据之间存在时间差δt时的情况,图3(b)表示afc数据与视频数据之间对齐后的情况。在图3(a)、图3(b)中,横轴表示时间,纵轴表示统计得到的客流人数,颜色较深的曲线表示根据afc数据统计得到的客流人数,颜色较浅的曲线表示通过对视频进行解析而获得的客流人数。可以使用以下的式(4)求取某一天的上述的时间差δt。在以上式(4)中,δt表示最终得到的时间差的值,tt表示两组数据(即,afc数据与视频数据)的时间差的可能取值,例如可以在“-300秒~300秒”的范围内取值,st表示每一个时间粒度的起始时间。其中04:00:00为地铁开始运营的时间(即,开始获得afc数据和视频数据的时间),24:00:00为地铁停止运营的时间(即,停止获得afc数据和视频数据的时间),“视频统计值”是指利用视频解析算法对一个时间粒度的视频进行解析而统计得到的客流人数,“afc统计值”是指根据该一个时间粒度的时间的afc数据统计得到的客流人数。在以上式(4)中,通过使tt在“-300秒~300秒”的范围内取值,例如假设摄像机服务器的视频数据比对应的afc数据分别快-300秒,-299秒,-298秒,…,298秒,299秒,300秒,找到其中两组数据差值最小的时间差,即,找到能够使该视频数据与afc数据最为契合的值作为该2组数据的时间差的值。在以如上所述的方法使视频数据与afc数据在时间上对齐后,可以获得各个时间粒度的视频的开始时间(st)、结束时间(et)、视频特征(f1)、环境特征(f2)、配置参数(f3)、视频统计客流人数(x)和afc统计客流人数(y),将这些数据汇总在一起作为一个初版本的训练集(st,et,f1,f2,f3,x,f)(步骤s6)。其中,“视频统计客流人数”是指利用视频解析算法对该时间粒度的视频进行解析而统计得到的客流人数,“afc统计客流人数”是指根据该时间粒度afc数据统计得到的客流人数。我们知道,乘客在工作日和节假日、以及不同的季节出行的出行习惯都不相同,而且即使在同一天,早晚高峰与平时的拥挤程度也不相同。为了使生成的模型能够更加准确的用于校正,我们可以按照时间段来切分训练集。具体而言,根据训练集中包含的时间戳,按照节假日、季节、小时等将初版本的训练集切分成多个子训练集(步骤s7)。例如,可以将训练集划分成平日训练集和节假日训练集,节假日包括:春节、端午节、国庆节、劳动节、清明节、元旦和中秋节。进一步可以将平日训练集分为工作日训练集和周末训练集。工作日训练集和周末训练集又可以划分为春季训练集、夏季训练集、秋季训练集和冬季训练集。并且,可以将每种训练集按小时划分成24个子训练集。另外,假设地铁站每日4点整开始营运,24点整结束营运,则在0点~4点期间没有客流,因此也可以省略这个时间段的子训练集。每个训练集的格式可以由以下矩阵式(5)表示。在以上矩阵式(5)中,每一行是每个时间粒度的数据。在以上的式(5)中,st表示每条数据的开始时间,et为结束时间,n为数据的行数,f1n表示第n个数据的视频特征,f2n表示第n个数据的摄像机环境特征,f3n表示第n个数据的摄像机的配置参数特征,xn表示第n个数据的视频统计客流人数,yn表示第n个数据的afc统计客流人数(即,真实客流人数)。然后,利用线性回归方法对在步骤s7中切分得到的各个子训练集进行校正,生成与各个子训练集对应的校正用的模型(以下,称为“校正模型”),由这些校正模型构成校正模型库(步骤s8)。具体而言,在利用线性回归方法生成校正模型时,通过输入x、y来模拟线性方程,其中x为自变量,y为因变量。这里,令摄像机的视频统计客流人数和各种特征组合起来的向量[f1n,f2n,f3n,xn]为自变量x,afc统计客流人数为因变量y。在有新的afc数据和视频数据的情况下,可以返回至步骤s1,再次进行步骤s1~s7,生成新的校正模型。以上,说明了生成校正模型的方法。接着,说明利用所生成的校正模型,对基于传统的视频解析算法获得的客流人数进行校正,获得更准确的客流人数的方法进行说明。图4是利用校正模型对基于视频解析算法获得的客流人数进行校正的流程图。在对基于传统的视频解析算法获得的时间粒度上的视频的客流人数进行校正之前,首先,利用通常使用的视频解析方法对与该时间粒度上的客流人数对应的视频(以下,称为“对象视频”)进行视频解析,统计该对象视频的客流人数,并获取该对象视频的视频特征和时间戳(步骤s11)。步骤s11与步骤s2实质相同,省略对步骤s11的详细说明。接着,采集摄像机拍摄对象视频时的环境特征和配置参数(步骤s12)。步骤s12与步骤s3实质相同,省略对步骤s12的详细说明。然后,将在步骤s11中计算得到的视频特征和在步骤s3中得到的环境特征和配置参数汇总,并且为了减少计算量,也可以除去视频特征、环境特征和配置参数中的某些影响小的项(即,某些影响小的特征),进行特征选择,得到特征向量(步骤s13)。步骤s13与步骤s4实质相同,省略对步骤s11的详细说明。然后,将在步骤s13中得到的特征向量与在步骤s11中统计得到的客流人数汇总,得到输入向量(f1,f2,f3,x)(步骤s14)。根据在步骤s11中获得的对象视频的时间戳,从在步骤s8生成的校正模型库中寻找与该对象视频的时间戳对应的校正模型(步骤s15)。这里,假定对象视频的时间戳与春季、周末、7点的模型相对应,则步骤s15所寻找的校正模型就是春季、周末、7点的校正模型。将步骤s14得到的输入向量输入至在步骤s15寻找得到的校正模型中,就可以得到校正后的客流人数(步骤s16)。通过采用以上所述的人数统计方法,与现有技术相比,能够获得更接近真实人数的统计人数。在本实施方式中,说明了视频特征包括画面客流密度、亮度变化和对比度,摄像机的环境特征包括目标像素尺寸、摄像机与目标角度、区域类型和拥挤程度,配置参数包括亮度等级和摄像机设置高度的例子。但是视频特征、摄像机的环境特征和配置参数不限于上述的各项具体特征,在考虑计算成本的情况下,可以适当增加或减少某些特征。(实施方式2)在实施方式1中,采用根据afc数据统计出的人数作为真实客流人数。在afc服务器与摄像机服务器之间存在时间差时,需要计算afc数据与视频数据之间的时间差,将afc数据与视频数据对齐(即,消除两者之前的时间差)。具体内容,请参照实施方式1的步骤s5。图5是表示实施方式2的生成校正模型库的流程图。在本实施方式2中,为了获得某一个时间粒度内进出某一组闸机的真实客流人数,不采用根据afc数据来统计真实客流人数的方式,而通过人工观察来获得真实客流人数(s1’)。具体而言,我们通过人眼观察视频,记录下乘客通过闸机的日期和时间等信息来统计真实客流人数;或者在摄像机进行摄像的现场通过人眼直接观察通过闸机的乘客来获得真实客流人数。由于在通过人眼观察的情况下获得的数据与视频数据之间不存在时间差,因此不需要如实施方式1那样进行将afc数据与视频数据对齐的步骤s5。在本实施方式2中,如图5所示,在进行了生成特征向量之步骤s4之后,进入步骤s6,生成初版本的训练集。在本实施方式2中,与实施方式1相比,除了步骤s1’不同、且省略了步骤s5之外,其他步骤(s2~s4、s6~s8、s11~s16)与实施方式1相同。在本实施方式中,省略对与实施方式1相同的内容的描述。通过采用本实施方式2记载的人数统计方法,与现有技术相比,能够获得更接近真实人数的统计人数。(实施方式3)在实施方式1中,为了减少计算量,从视频特征(d,l,g)、环境特征(sz,ag,ar,cr)和配置参数(lu,sh)中除去了影响小的项(即,某些影响小的特征),例如,从配置参数中除去了“摄像机设置高度”之特征。在本实施方式3中,没有如实施方式1那样进行特征的删除。图6是表示实施方式3的生成校正模型库的流程图。如图6所示,在本实施方式3的步骤s4’中,将视频特征、环境特征和配置参数汇总后,直接得到特征向量。在本实施方式3中,与实施方式1相比,除了步骤s4’不同之外,其他步骤(s1~s3、s5~s8、s11~s16)与实施方式1相同。在本实施方式中,省略对与实施方式1相同的内容的描述。通过采用本实施方式3记载的人数统计方法,与现有技术相比,能够获得更接近真实人数的统计人数。下面利用实施例1对本发明进行具体说明。(实施例1)以下,根据步骤s11~s16,确认本发明中利用根据步骤s1~s8制作的校正模型库获得的效果。首先,我们通过人眼查看视频,记录一段视频中的乘客刷卡的日期(交易日期)、时间(交易时间)、拍摄用的摄像机编号。刷卡交易的时间以摄像机的拍摄时间为准。表1交易日期交易时间摄像机编号201601310902364320160131090355432016013123311043………表1表示记录的包含交易日期、交易时间和摄像机编号的3个数据的示例。在表1中,“20160131”表示交易日期为2016年1月31日,“090236”表示交易时间为9时2分36秒,“43”是摄像机编号。人工标定的数据在模型的训练和测试中充当真实值。然后,通过传统的视频解析方法获得每个时间粒度的视频中的客流人数。以下的表2表示摄像机的客流人数的数据格式。表2在以上表2中,方向“0”表示乘客从远处靠近摄像机的方向,如果方向为“1”,则表示乘客远离摄像机的方向。然后,获取上述一段视频的视频特征(请参照以下的表3)、摄像机的环境特征(请参照以下的表4)和配置参数(请参照以下的表5)。表3开始时间结束时间画面客流密度亮度变化对比度09000009003035.37.5表4目标像素尺寸摄像机与目标角度区域类型拥挤程度80×25015闸机中表5亮度等级摄像机设置高度4260并且,基于传统的视频解析算法对以上一段视频进行视频解析,获得的是各时间粒度上的视频的人数。而通过人眼查看视频,校正的结果也是各时间粒度上的视频的人数。利用上述的数据,将表1、2、3、4、5进行匹配,生成初版本的数据集。2016年1月31日是周日冬季,所以将数据初版本数据集按照各个小时进行拆分,并将拆分的子数据集加入到“冬季周末”各个小时的训练集中。为“冬季周末”各个小时的子数据集进行训练,生成校正模型库。当我们需要对某一个时间粒度上的客流人数进行校正的时候,如果校正的视频拍摄于2016年2月6日上午9点21分34秒时,则采集这个时间粒度上的视频解析客流人数、视频特征、环境特征和参数特征,生成输入向量。由于2016年2月6日是冬季周末,故找到“冬季周末9点”的校正模型,输入输入向量,可以得到该时间粒度上的校正后的客流人数。以下表6记载了在2016年1月份各天中,利用传统的视频解析算法时的视频解析的准确率和基于本发明进行校正后的准确率的数据。表6在以上表6中的第一行数据中,“50172”是指在2016年1月9日由摄像机(编号为43)拍摄的视频中的全天真实客流人数,“6597”是指利用传统的视频解析算法时在每个时间粒度上的错误数的总和(既包括在各个时间粒度中多检测出的人数,也包括在各个时间粒度中少检测出的人数),“2832”是基于本发明进行校正后的错误数,“86.85%”是利用传统的视频解析算法时的视频解析的准确率,“94.36%”是基于本发明进行校正后的准确率。以上表(6)中的准确率可以利用以下式(6)来计算。其中,xhour表示每个小时的客流统计人数(根据视频统计出的客流人数或校正后的客流人数),yhour表示每小时的真实的客流人数,a%表示准确率。根据表6可知,通过采用本发明的人数统计方法,与现有的视频解析方法相比,能够获得更接近真实客流人数的数据。以上所述仅是本发明的优选的实施方式,应当指出,对于本领域的技术人员来说,在不脱离本发明原理和基础的前提下,还可以做出若干改进、润饰、更换步骤组合等,这些改进、润饰、更换步骤组合等也应该是本发明的保护范围。本领域技术人员应明白,本发明能够提供为方法、系统、或计算机程序产品。本发明能够完全由硬件实现、完全由软件实现、或结合软件和硬件来实现。而且,本发明能够采用在一个或多个包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。本发明是根据本发明具体实施方式的方法、系统、或计算机程序产品的流程图和/或方框图来描述的。应理解能够由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。能够将这些计算机程序指令提供给通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以实现一个通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也能够存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也能够装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。工业上的可利用性本发明的人数统计方法和人数统计装置能够提升统计精度,能够适用于地铁站、商场、医院等各种需要统计人数的区域,尤其对于公交客流统计是非常有用的。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1