模型的构建方法、人群密度估计方法、装置、设备和介质与流程

文档序号:18351839发布日期:2019-08-06 22:32阅读:244来源:国知局
模型的构建方法、人群密度估计方法、装置、设备和介质与流程

本申请实施例涉及计算机视觉技术,尤其涉及一种网络模型的构建方法、人群密度估计方法、装置、设备和存储介质。



背景技术:

随着科技的进步和人们生活水平的提高,人们的社交活动逐渐增多,交通枢纽、大型活动现场及大型公共场所人流拥堵越来越严重,由于人流拥堵造成的安全隐患日趋严重。因此,如何自动、实时的,进行人数估计具有重要的研究价值,对于公共事务人员提供有效的事件决策也有深入的指导意义。

现有技术中,通常是对图像设计一系列有针对性的特征,例如lbp(localbinarypattern,局部二值模式)、gabor、hog(histogramoforientedgradient,方向梯度直方图)和共生矩阵等,以通过这些特征反映出图像的某些潜在特性,在获取到这些特征后,选择一个合适的训练学习方法,例如adaboost和svm(supportvectormachine,支持向量机)等,对特征和人群密度的关系进行拟合,从而对特定场景中的人群密度进行分类,或者是对人群数量进行回归。

但是,这些方法中还需要设计有针对性的特征,这个过程需要耗费大量的人力,而且准确性和有效性较低。



技术实现要素:

本申请提供了一种网络模型的构建方法、人群密度估计方法、装置、设备和存储介质,以解决现有技术中估计人群密度时耗费人力大以及准确性低的问题。

本发明采用如下技术方案:

第一方面,本申请实施例提供了一种网络模型的构建方法,该方法包括:

应用标注的训练样本进行训练,获得预设数量的回归器;

将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;

确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号;

根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

第二方面,本申请实施例提供了一种人群密度估计方法,该方法包括:

将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别;

应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图;

所述预先构建的深度卷积神经网络模型基于本申请实施例第一方面所述的网络模型的构建方法确定。

第三方面,本申请实施例提供了一种网络模型的构建装置,该装置包括:

回归器获取模块,用于应用标注的训练样本进行训练,获得预设数量的回归器;

密度图获取模块,用于将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;

确定模块,用于确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号;

调整模块,用于根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

第四方面,本申请实施例提供了一种人群密度估计装置,该装置包括:

类别确定模块,用于将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别;

回归分析模块,用于应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图;

所述预先构建的深度卷积神经网络模型基于本申请实施例第三方面所述的网络模型的构建装置确定。

第五方面,本申请实施例提供了一种设备,包括存储器以及一个或多个处理器;

所述存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的网络网络模型的构建方法。

第六方面,本申请实施例提供了一种设备,包括存储器以及一个或多个处理器;

所述存储器,用于存储一个或多个程序;

当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第二方面所述的人群密度估计方法。

第七方面,本申请实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的网络模型的构建方法。

第八方面,本申请实施例提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第二方面所述的人群密度估计方法。

本发明采用的技术方案中有如下有益效果:应用标注的训练样本进行训练,获得预设数量的回归器,多个回归器的设计,提高了训练样本在回归分析过程中的针对性,而无需另外设计有针对性的特征;将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号,以根据回归器确定分类器的编号;根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。这样循环微调分类器和回归器,获得了训练效果更好的目标分类器和回归器,应用目标分类器和目标回归器估计人群密度,提高了准确性,节约了人力物力。

附图说明

通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:

图1是本申请实施例提供的一种网络模型的构建方法的流程图;

图2是本申请实施例提供的另一种网络模型的构建方法的流程图;

图3是本申请实施例中适用的一种算法构成的流程图;

图4是本申请实施例中适用的一种分类深度卷积神经网络的示意图;

图5是本申请实施例中适用的一种回归器对应的深度卷积神经网络的示意图;

图6是本申请实施例中适用的一种回归器的单列深度卷积神经网络的示意图;

图7是本申请实施例中适用的另一种回归器的单列深度卷积神经网络的示意图;

图8是本申请实施例中适用的一种回归器构成的示意图;

图9是本申请实施例提供的一种人群密度估计方法的流程图;

图10是本申请实施例提供的一种网络模型的构建装置的结构示意图;

图11是本申请实施例提供的一种人群密度估计装置的结构示意图;

图12是本申请实施例提供的一种设备的结构示意图;

图13是本申请实施例提供的另一种设备的结构示意图。

具体实施方式

为了使本申请的目的、技术方案和优点更加清楚,下面结合附图对本申请具体实施例作进一步的详细描述。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部内容。在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。

首先,为了方便描述,这里将本申请第一个实施例中提到的更新之前的回归器称为第一回归器,将本申请中第二个实施例中提到的更新后的回归器称为第二回归器;将本申请第一个实施例中提到的更新之前的人群密度图称为第一人群密度图,将本申请第二个实施例中提到的更新后的人群密度图称为第二人群密度图。

图1给出了本申请实施例提供的一种网络模型的构建方法的流程图,本实施例提供的网络模型的构建方法可以由网络模型的构建装置来执行,该网络模型的构建装置可通过硬件和/或软件的方式实现。参考图1,该方法具体可以包括:

s101、应用标注的训练样本进行训练,获得预设数量的回归器。

具体的,本申请实施例的技术方案可以应用在安防领域,用本申请实施例中预先构建的深度卷积神经网络模型训练样本数据,来获得人群密度,准确性高。可选的,训练样本可以是某个摄像头拍摄到的图像,还可以是视频帧,其中,摄像头可以是地铁站里的各个监控摄像头。首先,应用标注好的训练样本对初始回归器进行训练,这里的初始回归器是指一个初始的可以用作回归器的深度卷积神经网络模型,训练以获得预设数量的回归器,在一个具体的例子中,预设数量可以是3个。示例性的,标注是指,给训练样本添加一个标签,通过各个标签,可以对各个训练样本进行区分;本申请实施例中提到的深度卷积神经网络可以是对经典的卷积神经网络vgg16的变形,这里不进行限定。

在一个具体的例子中,应用标注的训练样本进行训练,获得预设数量的第一回归器,其中,预设数量可以是3个,示例性的,每个第一回归器可以由两个深度卷积神经网络并联构成,损失函数l(θ)采用逐点的欧氏距离函数,

d(xi;θ)是估计的第一人群密度图,gi是真实标定的第一人群密度图,表示欧式距离,n表示像素点的个数。

s102、将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图。

具体的,以3个第一回归器为例,将训练样本分别输入至3个第一回归器,得到3个第一人群密度图,其中,第一回归器和第一人群密度图一一对应。此外,每个训练样本的真实密度图已知,且一个训练样本对应一个真实密度图,真实密度图用来计算误差,以确定回归器的编号。在一个具体的例子中,第一回归器记为r10、r11和r12,第一人群密度图记为d10、d11和d12。

s103、确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号。

具体的,分别计算每个第一人群密度图和训练样本对应的真实密度图之间的误差,比较各个误差的大小,选取误差最小的第一人群密度图对应的第一回归器的编号,作为训练样本的分类编号。

在一个具体的例子中,可以用下述公式表示,

表示第x个样本的真实的密度图,为第x个样本的第r个回归器的第一人群密度图,label为该样本的真实密度图和使得该样本误差最小的第一回归器的编号,也即,使最小的r的值的集合,同时,label也是该样本用于训练分类器的编号。在一个具体的例子中,例如训练样本x的真实密度图和r12的误差最小,则训练样本的编号为2。

s104、根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

具体的,上述获得的训练样本的分类编号只是初始编号,并不是训练样本的实际编号,这里还需要根据训练样本的分类编号和训练样本微调初始分类器,这里的初始分类器可以是指一个能实现分类器功能的深度卷积神经网络模型,例如vgg16网络。此时,对初始分类器进行微调,以得到能够使用的分类器,再应用该中间过程获得的分类器对训练样本进行分类,再应用分类后的训练样本微调回归器,其中,微调可以是指,调整分类器或者回归器中对应的参数,以实现对分类器或者回归器的调整。在一个具体的例子中,微调可以是修改softmax的输出类别,例如,将输出类别的数量修改为3,则微调后,会获得一个3分类的深度卷积神经网络分类器;另外,微调还可以是在模型不变的情况下,采用小学习率进行调整。需要说明的是,微调的方式有很多,这里只是举例进行说明,不形成具体的限定。

在一个具体的例子中,利用上述3分类深度卷积神经网络分类器对训练样本进行分类,并对训练样本进行重新编号,样本所属编号和回归器的编号一致,也即,如果回归器的编号为0、1和2,则全部的训练样本会被3分类深度卷积神经网络分为0、1和2三类。此外,利用上述分类器分类后的训练样本和对应的编号,对回归器进行微调,也即,如果分类后的样本编号为2,则会用样本编号为2的回归器r12进行微调。

其中,微调过程一直持续,直到满足预设训练条件时停止,这时,将最新一次微调的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。之后可以应用目标分类器和目标回归器去估计人群密度,以获得较高的准确率。在一个具体的例子中,预设训练条件可以是网络的收敛条件等。

本发明采用的技术方案中有如下有益效果:应用标注的训练样本进行训练,获得预设数量的回归器,多个回归器的设计,提高了训练样本在回归分析过程中的针对性,而无需另外设计有针对性的特征;将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号,以根据回归器确定分类器的编号;根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。这样循环微调分类器和回归器,获得了训练效果更好的目标分类器和目标回归器,应用目标分类器和目标回归器估计人群密度,提高了准确性和效率,节约了人力物力。

在上述实施例的基础上,图2给出了本申请实施例提供的另一种网络模型的构建方法的流程图。该网络模型的构建方法是对上述网络模型的构建方法的具体化。参考图2,该网络模型的构建方法包括:

s201、应用预先制作的回归器标签对训练样本进行标注,以得到标注的训练样本。

具体的,应用预先制作的回归器标签对训练样本进行标注,也即,回归器标签的获取过程或制作过程为训练样本的标注过程,这样,即可得到标注后的训练样本。

可选的,训练样本的标注过程包括:获得训练样本的人头图像;对所述人头图像中的人头位置坐标进行标定;对标定后的人头图像进行高斯滤波,以得到训练样本的回归器标签。

其中,获取训练样本的人头图像,人头图像可以是指,根据人头坐标形成的人头坐标图像,也即,标记为人头的地方。示例性的,标签的制作过程需要指定人群中人头的坐标,每个人能且仅能指定一个人头坐标,该坐标理论上位于人头的几何中心点。对标定后的人头图像进行高斯滤波,高斯滤波参数sigma可以是一个固定的值,也可以是一个根据人头位置距离确定的值。经过高斯滤波后,便得到训练样本的回归器标签。而本申请中,分类器的标签是通过回归器来确定的,也即,在训练中生成的。在一个具体的例子中,回归器的样本标注是标注一个二维矩阵,二维矩阵是输入视频帧的1/16,二维矩阵的值时每个人头所在位置的高斯滤波在改点的值的累加。

示例性的,高斯滤波的过程如下:

其中,sigma为高斯滤波参数,sigma可以是一个固定的常数值,也可以根据人群彼此的几何关系获得的一个动态值,k为高斯滤波窗大小,p和q为人头坐标,f为高斯滤波函数,dt为真实人群密度图。

s202、应用标注的训练样本进行训练,获得预设数量的回归器。

s203、将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图。

s204、确定每个人群密度图和训练样本对应的真实密度图之间的误差。

s205、根据所述误差更新每个回归器的回归参数,以应用所述更新后的回归参数更新所述回归器,以得到更新后的回归器。

具体的,计算每个第一人群密度图和对应的真实密度图之间的误差,并将误差沿着误差最小的第一回归器进行反向传播,以更新对应的第一回归器的回归参数,例如可以是权值参数,其中,对每个样本执行相同的操作,这样得到更新后的回归器,称为第二回归器,例如得到3个第二回归器。

在一个具体的例子中,对于每一个训练样本,分别经过第一回归器r10、r11和r12,得到估计的第一人群密度图d10x、d11x和d12x。计算d10x、d11x和d12x和真实密度图之间的误差,并将误差沿着误差最小的第一回归器ri进行反向传播,并更新对应的回归器ri的权值参数。对每个训练样本执行相同的操作后,便可训练得到3个第二回归器r20、r21和r22,同样,以r12为例,如果第x个样本的真实密度图和r12估计的第一密度图d12x的误差最小,则和d12x的误差将会沿着r12进行反向传播,r12的权重参数将会被更新,从而得到第二回归器r22;而r10和r11在本轮误差反向传播过程中将保持不变,其中,误差计算公式为

其中,为第x个样本的真实的密度图,为第x个样本的第r个第一回归器的第一人群密度图。需要说明的是,在本申请实施例中,r20、r21和r22的第一位数字符号2表示是第二回归器的意思,第二位数字符号才表示样本的编号;d10x、d11x和d12x的编号规则与回归器的编号规则相同,这里不再赘述。

s206、将所述训练样本分别输入至每个更新后的回归器,得到每个更新后的回归器对应的更新后的人群密度图。

具体的,将训练样本分别输入至第二回归器,得到每个第二回归器对应的第二人群密度图。

s207、确定每个更新后的人群密度图和训练样本对应的真实密度图之间的更新后的误差。

具体的,确定每个第二人群密度图和训练样本对应的真实密度图之间的误差,该误差可以称为更新后的误差。

s208、选取更新后的误差最小的更新后的人群密度图对应的更新后的回归器的编号作为所述训练样本的编号。

s209、根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述更新后的回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

具体的,这里的操作中,与第一个实施例的区别是,微调的是更新后的第二回归器;与第一实施例相比,应用更新后的第二回归器来确定目标分类器和目标回归器,其中,第二回归器与第一回归器相比,包括一个更新优化过程,因此,确定的目标分类器和目标回归器更准确。

本申请实施例中,应用预先制作的回归器标签对训练样本进行标注,以得到标注的训练样本,应用标注的训练样本进行训练,获得预设数量的第一回归器。将所述训练样本分别输入至每个第一回归器,得到每个第一回归器对应的第一人群密度图;计算每个第一人群密度图和对应的真实密度图之间的误差,根据所述误差更新每个第一回归器的回归参数,以应用所述更新后的回归参数更新所述第一回归器,以得到对应的第二回归器。利用了第一回归器训练过程中的误差进行回归器的更新,这样,获得的第二回归器的准确度更高,还避免了手动设计特征的复杂性。

可选的,所述分类器由13个卷积层、3个全连接层、5个最大池化层和1个softmax层构成,所述分类器的激活函数为relu函数。

其中,分类器的13个卷积层为子卷积层,例如可以是组成了5个全卷积层,其中,第1卷积层和第2卷积层各包含两个子卷积层,第3卷积层、第4卷积层和第5卷积层各包含三个子卷积层,卷积层之间用maxpool进行连接。另外,分类器的激活函数为relu函数,也可以理解为13个relu层。

可选的,所述回归器中,每个回归器由两个单列并联的深度卷积神经网络并联组成,每个单列并联的深度卷积神经网络由4个卷积层和2个最大池化层构成,所述回归器还包括1个contact层,所述回归器的激活函数均为relu函数。

其中,每个回归器都是由两个单列并联的深度卷积神经网络组合构成,通过contact的方式进行融合,最后通过一个1×1×1的卷积层。可选的,回归器之间的卷积核尺度和卷积层数可能有差异,回归器主要是对分类器标注的视频帧进行准确的回归,得到人群密度图等相关信息。

在一个具体的例子中,回归器包括9个卷积层(conv2_1、……、conv2_9),4个最大池化层(maxpool2_1、maxpool2_2、maxpool2_3和maxpool2_4)和一个contact层构成。并联的两个深度卷积神经网络的感受野不同,用于捕获不同的特征,conv2_4和conv2_8通过contact进行组合,组合后通过一个1×1×1的卷积层conv2_9来实现对视频帧的人群密度分布的回归。通过上述网络可知,最终估计的人群密度图的分辨率是原图的1/16,最终的人群数量为密度图的积分,也即:

其中,dx,n表示估计的人群密度图的第n个点。

为了使本申请的技术方案表述更清晰,下面用具体的示意图来进行说明,图3是一种算法构成的流程图;图4是一种分类深度卷积神经网络的示意图;图5是一种回归器对应的深度卷积神经网络的示意图;图6是一种回归器的单列深度卷积神经网络的示意图;图7是另一种回归器的单列深度卷积神经网络的示意图;图8是一种回归器构成的示意图;需要说明的是,图4-图8中的各个参数只是一种可选的实施例的参数选择,也可以选择其他参数,这里不形成限定。

图9给出了本申请实施例提供的一种人群密度估计方法的流程图,本实施例提供的人群密度估计方法可以由人群密度估计装置来执行,该人群密度估计装置可通过硬件和/或软件的方式实现。参考图9,该方法具体可以包括:

s901、将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别。

具体的,获取到的视频帧为待处理的对象,将获取到的视频帧输入至预先构建的深度卷积神经网络中,其中,预先构建的深度卷积神经网络由分类器和回归器构成,通过分类器可以确定视频帧所属的回归器类别,也即,当获取的视频帧输入至分类器后,即可获知对应的回归器的列表编号,也即,获知了在接下来的识别过程中,将获取到的视频帧输入至哪个回归器进行回归分析。寻找对应的回归器,使得在对应的回归器进行回归分析的准确性更高。

s902、应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图。

具体的,确定了与视频帧对应的回归器的类别编号,应用与回归器的类别编号对应的深度卷积神经网络模型的回归器对视频帧进行回归分析,得到人群密度图。可选的,所述预先构建的深度卷积神经网络模型基于本申请实施例中所述的网络模型的构建方法确定。

本申请实施例中,将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别,应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图,提高了人群密度识别的准确性和识别速度,节约了人力物力。

此外,本申请的人群密度估计方法可以应用在安防领域,应用本申请实施例的人群密度估计方法,能够有效的对监控视频中单个视频帧的人群密度进行估计,进而可以估计出该视频帧的人数,从而提供监控区域的人群聚集信息,例如,人群拥挤程度等,以方便相关人员进行事件决策。

在上述实施例的基础上,图10为本申请实施例提供的一种网络模型的构建装置的结构示意图。参考图10,本实施例提供的网络模型的构建装置具体包括:回归器获取模块1001、密度图获取模块1002、确定模块1003和调整模块1004。

其中,回归器获取模块1001,用于应用标注的训练样本进行训练,获得预设数量的回归器;密度图获取模块1002,用于将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;确定模块1003,用于确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号;调整模块1004,用于根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

本发明采用的技术方案中有如下有益效果:应用标注的训练样本进行训练,获得预设数量的回归器,多个回归器的设计,提高了训练样本在回归分析过程中的针对性,而无需另外设计有针对性的特征;将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号,以根据回归器确定分类器的编号;根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。这样循环微调分类器和回归器,获得了训练效果更好的目标分类器和目标回归器,应用目标分类器和目标回归器估计人群密度,提高了准确性和效率,节约了人力物力。

可选的,还包括回归器更新模块,用于在确定每个人群密度图和训练样本对应的真实密度图之间的误差,之后:

根据所述误差更新每个回归器的回归参数,以应用所述更新后的回归参数更新所述回归器,以得到更新后的回归器;将所述训练样本分别输入至每个更新后的回归器,得到每个更新后的回归器对应的更新后的人群密度图;确定每个更新后的人群密度图和训练样本对应的真实密度图之间的更新后的误差;

相应的,确定模块1003具体用于:

选取更新后的误差最小的更新后的人群密度图对应的更新后的回归器的编号作为所述训练样本的编号;

相应的,调整模块1004具体用于:

根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述更新后的回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

可选的,还包括标注模块,用于在应用标注的训练样本进行训练之前,应用预先制作的回归器标签对训练样本进行标注,以得到标注的训练样本。

可选的,标注模块具体用于:

获得训练样本的人头图像;

对所述人头图像中的人头位置坐标进行标定;

对标定后的人头图像进行高斯滤波,以得到训练样本的回归器标签。

可选的,所述分类器由13个卷积层、3个全连接层、5个最大池化层和1个softmax层构成,所述分类器的激活函数为relu函数。

可选的,所述回归器中,每个回归器由两个单列并联的深度卷积神经网络并联组成,每个单列并联的深度卷积神经网络由4个卷积层和2个最大池化层构成,所述回归器还包括1个contact层,所述回归器的激活函数均为relu函数。

本申请实施例提供的网络模型的构建装置可以用于执行上述实施例提供的网络模型的构建方法,具备相应的功能和有益效果。

在上述实施例的基础上,图11为本申请实施例提供的一种人群密度估计装置的结构示意图。参考图11,本实施例提供的人群密度估计装置具体包括:类别确定模块1101和回归分析模块1102。

其中,类别确定模块1101,用于将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别;回归分析模块1102,用于应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图;所述预先构建的深度卷积神经网络模型基于本申请实施例所述的网络模型的构建装置确定。

本申请实施例中,将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别,应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图,提高了人群密度识别的准确性和识别速度,节约了人力物力。

本申请实施例提供的人群密度估计装置可以用于执行上述实施例提供的人群密度估计方法,具备相应的功能和有益效果。

本申请实施例提供了一种设备,且该设备中可集成本申请实施例提供的装置。图12是本申请实施例提供的一种设备的结构示意图。参考图12,该设备包括:处理器120、存储器121。该设备中处理器120的数量可以是一个或者多个,图12中以一个处理器120为例。该设备中存储器121的数量可以是一个或者多个,图12中以一个存储器121为例。该设备的处理器120和存储器121可以通过总线或者其他方式连接,图12中以通过总线连接为例。

存储器121作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的网络模型的构建方法对应的程序指令/模块(例如,网络模型的构建装置中的回归器获取模块1001、密度图获取模块1002、确定模块1003和调整模块1004)。存储器121可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器121可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器121可进一步包括相对于处理器120远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器120通过运行存储在存储器121中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的网络模型的构建方法,该网络模型的构建方法包括:应用标注的训练样本进行训练,获得预设数量的回归器;将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号;根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

上述提供的设备可用于执行上述实施例提供的网络模型的构建方法,具备相应的功能和有益效果。

本申请实施例提供了一种设备,且该设备中可集成本申请实施例提供的装置。图13是本申请实施例提供的一种设备的结构示意图。参考图13,该设备包括:处理器130、存储器131。该设备中处理器130的数量可以是一个或者多个,图13中以一个处理器130为例。该设备中存储器131的数量可以是一个或者多个,图13中以一个存储器131为例。该设备的处理器130和存储器131可以通过总线或者其他方式连接,图13中以通过总线连接为例。

存储器131作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请任意实施例所述的人群密度估计方法对应的程序指令/模块(例如,人群密度估计装置中的类别确定模块1101和回归分析模块1102)。存储器131可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据设备的使用所创建的数据等。此外,存储器131可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器131可进一步包括相对于处理器130远程设置的存储器,这些远程存储器可以通过网络连接至设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

处理器130通过运行存储在存储器131中的软件程序、指令以及模块,从而执行设备的各种功能应用以及数据处理,即实现上述的人群密度估计方法,该人群密度估计方法包括:将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别;应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图;所述预先构建的深度卷积神经网络模型基于本申请实施例所述的网络模型的构建方法确定。

上述提供的设备可用于执行上述实施例提供的人群密度估计方法,具备相应的功能和有益效果。

本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种网络模型的构建方法,该网络模型的构建方法包括:应用标注的训练样本进行训练,获得预设数量的回归器;将所述训练样本分别输入至每个回归器,得到每个回归器对应的人群密度图;确定每个人群密度图和训练样本对应的真实密度图之间的误差,选取误差最小的人群密度图对应的回归器的编号作为所述训练样本的分类编号;根据所述训练样本的分类编号和所述训练样本微调初始分类器,以得到分类器,应用所述分类器对训练样本进行分类,应用分类后的训练样本微调所述回归器,直至满足预设训练条件时停止分类器和回归器的微调,将最新的分类器和回归器作为预先构建的网络模型的目标分类器和目标回归器。

存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如cd-rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddrram、sram、edoram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的网络模型的构建方法,还可以执行本申请任意实施例所提供的网络模型的构建方法中的相关操作。

上述实施例中提供的网络模型的构建装置、存储介质及设备可执行本申请任意实施例所提供的网络模型的构建方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的网络模型的构建方法。

本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种人群密度估计方法,该人群密度估计方法包括:将获取到的视频帧输入至预先构建的深度卷积神经网络模型中,通过所述深度卷积神经网络模型中的分类器确定所述视频帧所属的回归器类别;应用与所述回归器类别对应的所述深度卷积神经网络模型中的回归器对所述视频帧进行回归分析,得到人群密度图;所述预先构建的深度卷积神经网络模型基于本申请实施例所述的网络模型的构建方法确定。

存储介质——任何的各种类型的存储器设备或存储设备。术语“存储介质”旨在包括:安装介质,例如cd-rom、软盘或磁带装置;计算机系统存储器或随机存取存储器,诸如dram、ddrram、sram、edoram,兰巴斯(rambus)ram等;非易失性存储器,诸如闪存、磁介质(例如硬盘或光存储);寄存器或其它相似类型的存储器元件等。存储介质可以还包括其它类型的存储器或其组合。另外,存储介质可以位于程序在其中被执行的第一计算机系统中,或者可以位于不同的第二计算机系统中,第二计算机系统通过网络(诸如因特网)连接到第一计算机系统。第二计算机系统可以提供程序指令给第一计算机用于执行。术语“存储介质”可以包括可以驻留在不同位置中(例如在通过网络连接的不同计算机系统中)的两个或更多存储介质。存储介质可以存储可由一个或多个处理器执行的程序指令(例如具体实现为计算机程序)。

当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的人群密度估计方法,还可以执行本申请任意实施例所提供的人群密度估计方法中的相关操作。

上述实施例中提供的人群密度估计装置、存储介质及设备可执行本申请任意实施例所提供的人群密度估计方法,未在上述实施例中详尽描述的技术细节,可参见本申请任意实施例所提供的人群密度估计方法。

注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1