无人拍摄自动变焦方法及系统、无人摄像机及存储介质与流程

文档序号:17758886发布日期:2019-05-24 21:31阅读:283来源:国知局
无人拍摄自动变焦方法及系统、无人摄像机及存储介质与流程

本发明涉及摄像技术领域,尤其是涉及一种无人拍摄自动变焦方法及系统、无人摄像机及存储介质。



背景技术:

现有的摄像工作都需要有人直接参与操作控制,用户直接拿着拍摄终端进行拍摄,或者借用拍摄云台等进行控制,其中,拍摄终端采集到的图像数据,从中选择边界框(bounding-box)最大的作为拍摄对象,其实质也是由用户进行操控、选择拍摄的焦距进而实施拍摄。如果用户想用不同尺度进行拍照均需要人工调焦,例如用户当前拍摄的为全身照,当想要拍半身照时,则只能自行调节摄像终端的焦距进行拍照,操作麻烦,欠智能化。

另外,拍摄终端对人像尺度的估计比较难,它既反映了距离,也反映了人物本身的大小。距离可以加入距离传感器进行估计,而人物本身的大小则难以测量,因为它是纯视觉的感知能力,绝非一个人像边界框能表达。人的姿态千变万化,姿态的轻微变化就会导致框的大小发生很大变化。不仅如此,对局部和全局的观察也需要得到几乎相同的结论。如图7所示,我们假定只能在这3个人像边界框里面观察目标,然后估计人物在画面中的尺度,这种情形会经常发生,因为人像的边界框的位置是难以确定的,不同的视觉检测技术以及外部的运动平台会导致实际的拍摄影像画面效果出现很强的波动和随机性,我们需要对这些情形进行处理。



技术实现要素:

基于此,有必要针对现有技术的不足,提供一种能根据不同的预设命令尺度来控制摄像机的变焦马达转动,无需人工直接操作摄像机即可完成对拍摄目标的调焦拍摄,提升拍摄效果,满足用户的个性化需求的无人拍摄自动变焦方法及系统、无人摄像机及存储介质。

为解决上述技术问题,本发明采用以下技术方案:

本发明提供了一种无人拍摄自动变焦方法,其包括如下步骤:

步骤s110、接收用户输入的变焦控制指令;

步骤s120、实时检测摄像机拍摄影像内的目标人像,获取所述目标人像的目标人像边界框;

步骤s130、基于深度卷积神经网络获取目标人像边界框的尺度;

步骤s140、计算目标人像边界框的尺度与变焦控制指令对应的预设命令尺度的尺度误差;

步骤s150、判断所述尺度误差是否处于预设误差范围内,若否,执行步骤s160;若是,执行步骤s170;

步骤s160、根据所述尺度误差控制摄像机的变焦马达转动,返回执行步骤s120;

步骤s170、控制摄像机的变焦马达停止转动,完成自动变焦。

另一方面,本发明提供了一种无人拍摄自动变焦系统,其包括:

指令接收模块,用于接收用户输入的变焦控制指令;

人像边界框获取模块,用于实时检测摄像机拍摄的影像内的目标人像,获取所述目标人像的目标人像边界框;

尺度获取模块,用于基于深度卷积神经网络获取所述目标人像边界框的尺度;

尺度误差计算模块,用于计算所述目标人像边界框的尺度与变焦控制指令中的预设命令尺度的尺度误差;

判断模块,用于判断所述尺度误差是否处于预设误差范围内;

变焦马达控制模块,用于控制摄像机的变焦马达转动;若判断模块判断出所述尺度误差不处于预设误差范围内,则根据所述尺度误差控制摄像机的变焦马达转动;若是判断模块判断出所述尺度误差处于预设误差范围内,则控制摄像机的变焦马达停止转动,完成自动变焦。

第三方面,本发明提供了一种无人摄像机,其包括存储器、处理器以及拍摄组件;

所述拍摄组件,用于拍摄环境影像;所述拍摄组件包括变焦马达;

所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的无人拍摄自动变焦方法。

第四方面,本发明提供了一种存储介质,其存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被执行时实现上述的无人拍摄自动变焦方法。

综上所述,本发明提供的一种无人拍摄自动变焦方法及系统、无人摄像机及存储介质通过获取目标人像边界框的尺度,配合不同的预设命令尺度来控制摄像机的变焦马达转动,无需人工直接操作摄像机即可完成对拍摄目标的自动变焦拍摄,提升拍摄效果,满足用户的个性化需求。

附图说明

图1为本发明实施例提供的第一种无人拍摄自动变焦方法的流程示意图。

图2为本发明实施例提供的第二种无人拍摄自动变焦方法的流程示意图。

图3为本发明实施例提供的一种无人拍摄自动变焦系统的结构框图。

图4为本发明另一实施例提供的一种无人拍摄自动变焦系统的结构框图。

图5为本发明实施例提供的一种无人摄像机的结构框图。

图6为本发明实施例提供的一种内存储器的结构框图。

图7为本发明提供的拍摄影像画面内的人物图像。

具体实施方式

为能进一步了解本发明的特征、技术手段以及所达到的具体目的、功能,下面结合附图与具体实施方式对本发明作进一步详细描述。

图1是本发明实施例提供的第一种无人拍摄自动变焦方法的流程示意图,如图1所示,该无人拍摄自动变焦方法,包括步骤s110-步骤s170,具体如下:

步骤s110、接收用户输入的变焦控制指令。

其中,所述接收用户输入的变焦控制指令包括:接收用户通过移动终端app输入的变焦控制指令或接收用户通过手势识别方式输入的变焦控制指令。例如,用户可以通过移动终端app输入胸像变焦控制指令、半身像变焦控制指令、7分像变焦控制指令或全身像变焦控制指令,以使摄像机自动变焦对应获取目标人像的胸像、半身像、7分像或全身像;用户也可以通过手势识别方式输入变焦控制指令,具体地,摄像机内存储有手势动作对应的变焦控制指令,摄像机识别用户手势动作后发出变焦控制指令,从而达到让摄像机自动变焦对应拍摄目标人像的胸像、半身像、7分像或全身像的目的。

步骤s120、实时检测摄像机拍摄影像内的目标人像,获取所述目标人像的目标人像边界框。

实时检测摄像机拍摄影像的每一帧图像,当图像中出现目标人像时,获取目标人像的目标人像边界框。

步骤s130、基于深度卷积神经网络获取目标人像边界框的尺度。

在一些实施例中,步骤s130、基于深度卷积神经网络获取目标人像边界框的尺度的方法具体包括:

步骤s131、利用深度卷积神经网络对拍摄影像进行计算,得到与所述拍摄影像相同大小的尺度响应图;

步骤s132、获取所述目标人像边界框在所述尺度响应图对应位置的最高响应值,以所述最高响应值作为目标人像边界框的尺度。

基于深度卷积神经网络获取目标人像边界框的尺度时,不需要距离传感器来感知人物相对摄像机镜头的距离,仅从采集的人物图像上就可以对目标人像边界框的尺度进行计算,同时降低了成本;其中,人物图像为拍摄影像内的含有目标人像的图像。

获取目标人像边界框的尺度时,深度卷积神经网络通过观察人物图像,直接计算出人物图像内所有目标人像的相对尺度,可以处理人物图像内任意数量的目标人像。

步骤s140、计算目标人像边界框的尺度与变焦控制指令对应的预设命令尺度的尺度误差。其中,预设命令尺度为目标人像在人物图像中的预设尺度值,预设命令尺度包括胸像命令尺度、半身像命令尺度、7分像命令尺度及全身像命令尺度,分别对应目标人像的胸像、半身像、7分像及全身像;变焦控制指令包括胸像变焦控制指令、半身像变焦控制指令、7分像变焦控制指令或全身像变焦控制指令,分别控制摄像机拍摄目标人像的胸像、半身像、7分像及全身像。

步骤s150、判断所述尺度误差是否处于预设误差范围内,若否,执行步骤s160;若是,执行步骤s170。

步骤s160、根据所述尺度误差控制摄像机的变焦马达转动,返回执行步骤s120。

在一些实施例中,步骤s160中根据所述尺度误差控制摄像机的变焦马达转动的方法包括步骤s161-步骤s162,具体如下:

步骤s161、根据尺度误差e来计算变焦马达的运动速率v,

v=kp·f(e),e=sref-se

其中,定义变焦马达向长焦端移动的速率为正,向广角端移动的速率为负;尺度误差e=预设命令尺度sref-目标人像边界框的尺度se;kp为速率控制的增益系数;δ是误差截止值;f(e)为误差映射的函数,

步骤s162、根据所述运动速率v控制摄像机的变焦马达转动;

其中,预设误差范围为[-δ,+δ]。

步骤s170、控制摄像机的变焦马达停止转动,完成自动变焦。

例如,若接收用户输入的变焦控制指令为半身像变焦控制指令,此时,预设命令尺度为半身像命令尺度,实时检测的摄像机拍摄影像内的目标人像,获取目标人像的目标人像边界框,基于深度卷积神经网络获取目标人像边界框的尺度;计算目标人像边界框的尺度与半身像命令尺度的尺度误差;当尺度误差不处于预设误差范围内时,根据尺度误差控制摄像机的变焦马达转动,继续检测并获取目标人像的目标人像边界框,再重新计算目标人像边界框的尺度与半身像命令的尺度误差,重复上述操作,使得拍摄影像内目标人像的目标人像边界框的尺度满足半身像命令尺度,从而达到对目标人像拍摄半身像效果的目的;当尺度误差处于预设误差范围内时,控制摄像机的变焦马达停止转动,无需自动变焦即实现了对目标人像拍摄半身像效果的目的。

本实施例提供的无人拍摄自动变焦方法实现了在无人摄影中对摄像机焦距的自动控制,通过深度卷积神经网络获取目标人像边界框的尺度,根据目标人像边界框的尺度与预设命令尺度的尺度误差来调整摄像机的焦距,使目标人像在拍摄影像画面中的大小满足用户需求。

图2是本发明实施例提供的第二种无人拍摄自动变焦方法的流程示意图,如图2所示,所述步骤s130前还包括:

步骤s210、构建由人物图像及每张人物图像对应的标记数据组成的人物图像数据集。其中,所述标记数据包括:人物图像中每个人物的人像边界框、人物躯干在人物图像中的像素面积及人物离镜头的距离;具体地,人物图像数据集中采集的人物年龄分布在6~60岁,采集的人物中男女性别比例为1:1,其中,为了获取的目标人像姿态具有多样性,让人物在人物图像中展现出姿态各异的动作、以及相互遮挡的动作、或被其它障碍物遮挡的动作,以进行模拟;最后检测出人物图像中每个人物的人像边界框,并获取人物图像中每个人物的人像边界框、人物躯干在人物图像中的像素面积、和对应的人物离镜头的距离的标记数据。

步骤s220、利用所述人物图像数据集对深度卷积神经网络进行迭代训练,得到训练好的深度卷积神经网络。利用训练好的深度卷积神经网络,能更准确地获取目标人像边界框的尺度,从而使得摄像机更高效地能根据目标人像边界框的尺度与预设命令尺度的尺度误差来调整焦距,使目标人像在拍摄影像画面中的大小满足用户需求。

在一些实施例中,所述步骤s220中用所述人物图像数据集对深度卷积神经网络进行迭代训练,得到训练好的深度卷积神经网络的方法包括:

步骤s221、通过公式计算得到人物图像中每个人物的人像边界框的相对尺度s;其中,w为人物图像的像素宽度,h为人物图像的像素高度;as为人物绝对尺度的量,其中,d为人物离镜头的距离,a为人物躯干在人物图像中的像素面积;

步骤s222、使用深度卷积神经网络处理人物图像,得到一幅与人物图像相同大小的尺度响应图;

步骤s223、根据所述相对尺度s生成一幅与尺度响应图尺度一样的高斯响应图,其中高斯响应图的极值点位于人像边界框的中心,所述极值点的大小等于相对尺度s;具体地,首先获取人物图像对应的尺度响应图,再根据人物图像对应的标记数据在该尺度响应图上生成一个以人像边界框的中心位置为中心、以相对尺度s为极值的高斯响应,从而得到高斯响应图;

步骤s224、将步骤s223生成的高斯响应图与步骤s222获得的尺度响应图进行整个平面的欧几里得距离损失计算,并将计算结果使用反向传播算法对深度卷积神经网络的参数进行调节;

步骤s225、对人物图像数据集中的每一张人物图像不断重复步骤s221-步骤s224,直到计算的欧几里得距离损失不再下降时,结束对深度卷积神经网络的训练,得到训练好的深度卷积神经网络。

为了更加清晰本发明的技术方案,下面再阐述优选实施例。

步骤s210、构建由人物图像及每张人物图像对应的标记数据组成的人物图像数据集。

步骤s220、利用所述人物图像数据集对深度卷积神经网络进行迭代训练,得到训练好的深度卷积神经网络。

步骤s110、接收用户输入的变焦控制指令。

步骤s120、实时检测摄像机拍摄影像内的目标人像,获取所述目标人像的目标人像边界框。

步骤s130、基于深度卷积神经网络获取目标人像边界框的尺度。

基于深度卷积神经网络获取目标人像边界框的尺度时,不需要距离传感器来感知人物相对摄像机镜头的距离,仅从采集的人物图像上就可以对目标人像边界框的尺度进行计算,同时降低了成本;其中,人物图像为拍摄影像内的含有目标人像的图像。

获取目标人像边界框的尺度时,深度卷积神经网络通过观察人物图像,直接计算出人物图像内所有目标人像的相对尺度,可以处理人物图像内任意数量的目标人像。

步骤s140、计算目标人像边界框的尺度与变焦控制指令对应的预设命令尺度的尺度误差。

步骤s150、判断所述尺度误差是否处于预设误差范围内,若否,执行步骤s160;若是,执行步骤s170。

步骤s160、根据所述尺度误差控制摄像机的变焦马达转动,返回执行步骤s120。

步骤s170、控制摄像机的变焦马达停止转动,完成自动变焦。

在现有技术中因为人物姿势的变化、人物位置的随机性、及人物被遮挡等因素,很难对人像的大小进行估计,而本实施例不需要距离传感器来感知人物相对镜头的距离,直接通过训练好的深度卷积神经网络来获取拍摄影像内所有人物的相对尺度,提高了对人像大小估计的准确率,从而能准确控制摄像机的变焦马达转动以拍摄满足用户需要的尺寸的影像,本实施例提供的无人拍摄自动变焦方法能智能化地满足用户对不同尺寸的要求,提高了用户体验。

图3是本发明实施例提供的一种无人拍摄自动变焦系统的结构框图,如图3所示,对应于上述无人拍摄自动变焦方法,本发明还提供一种无人拍摄自动变焦系统,该无人拍摄自动变焦系统包括用于执行上述无人拍摄自动变焦方法,该系统可以被配置于无人摄像机等无人拍摄终端,应用本发明无人拍摄自动变焦系统,通过获取目标人像边界框的尺度,配合不同的预设命令尺度来控制摄像机的变焦马达转动,无需人工直接操作摄像机即可完成对拍摄目标的拍摄,提升拍摄效果,满足用户的个性化需求。

具体地,请参考图3,该无人拍摄自动变焦系统包括指令接收模块10、人像边界框获取模块20、尺度获取模块30、尺度误差计算模块40、判断模块50及变焦马达控制模块60。

指令接收模块10,用于接收用户输入的变焦控制指令。

所述指令接收模块10具体用于:接收用户通过移动终端app输入的变焦控制指令;或接收用户通过手势识别方式输入的变焦控制指令。

人像边界框获取模块20,用于实时检测摄像机拍摄的影像内的目标人像,获取所述目标人像的目标人像边界框。

尺度获取模块30,用于基于深度卷积神经网络获取所述目标人像边界框的尺度。

在一些实施例中,尺度获取模块30具体用于:

利用深度卷积神经网络对拍摄影像进行计算,得到与所述拍摄影像相同大小的尺度响应图;

获取所述目标人像边界框在所述尺度响应图对应位置的最高响应值,以所述最高响应值作为目标人像边界框的尺度。

尺度误差计算模块40,用于计算所述目标人像边界框的尺度与变焦控制指令中的预设命令尺度的尺度误差。

判断模块50,用于判断所述尺度误差是否处于预设误差范围内。

变焦马达控制模块60,用于控制摄像机的变焦马达转动;若判断模块50判断出所述尺度误差不处于预设误差范围内,则根据所述尺度误差控制摄像机的变焦马达转动;若是判断模块50判断出所述尺度误差处于预设误差范围内,则控制摄像机的变焦马达停止转动,完成自动变焦。

在其中一个实施例中,所述变焦马达控制模块60包括速率计算单元61和转动控制单元62。

速率计算单元61,用于根据尺度误差e来计算变焦马达的运动速率v,

v=kp·f(e),e=sref-se

其中,定义变焦马达向长焦端移动的速率为正,向广角端移动的速率为负;尺度误差e=预设命令尺度sref-目标人像边界框的尺度se;kp为速率控制的增益系数;δ是误差截止区间;f(e)为误差映射的函数,转动控制单元62,用于根据所述运动速率v控制摄像机的变焦马达转动;其中,预设误差范围为[-δ,+δ]。

图4是本发明另一实施例提供的一种无人拍摄自动变焦系统的结构框图。如图4所示,本实施例提供的无人拍摄自动变焦系统是在上述无人拍摄自动变焦系统的基础上增加了神经网络训练模块70,所述神经网络训练模块70包括数据集构建单元71和训练单元72。

数据集构建单元71,用于构建由人物图像及每张人物图像对应的标记数据组成的人物图像数据集;其中,所述标记数据包括:人物图像中每个人物的人像边界框、人物躯干在人物图像中的像素面积及人物离镜头的距离。

训练单元72,用于利用所述人物图像数据集对深度卷积神经网络进行迭代训练,得到训练好的深度卷积神经网络。

通过训练单元72训练好的深度卷积神经网络,能更准确地获取目标人像边界框的尺度,从而使得摄像机更高效地能根据目标人像边界框的尺度与预设命令尺度的尺度误差来调整焦距,使目标人像在拍摄影像画面中的大小满足用户需求。

所述训练单元72具体用于:

a、通过公式计算得到人物图像中每个人物的人像边界框的相对尺度s;其中w为人物图像的像素宽度,h为人物图像的像素高度;as为人物绝对尺度的量,其中,d为人物离镜头的距离,a为人物躯干在人物图像中的像素面积;

b、使用深度卷积神经网络处理人物图像,得到一幅与人物图像相同大小的尺度响应图;

c、根据所述相对尺度s生成一幅与人物图像尺度一样的高斯响应图,其中高斯响应图的极值点位于人像边界框的中心,所述极值点的大小等于相对尺度s;

d、将步骤c生成的高斯响应图与步骤b获得的尺度响应图进行欧几里得距离损失计算,并将计算结果使用反向传播算法对深度卷积神经网络的参数进行调节;

步骤e、对人物图像数据集中的每一张人物图像不断重复步骤a-步骤d,直到计算的欧几里得距离损失不再下降时,结束对深度卷积神经网络的训练,得到训练好的深度卷积神经网络。

需要说明的是,所属领域的技术人员可以清楚地了解到,上述无人拍摄自动变焦系统和各模块的具体实现过程,可以参考前述方法实施例中的相应描述,为了描述的方便和简洁,在此不再赘述。

图5为本发明实施例提供的一种无人摄像机的结构框图,如图5,本发明提供的无人摄像机包括通过系统总线连接的存储器501、处理器502、拍摄组件503及网络接口506;所述拍摄组件503,用于拍摄环境影像;所述拍摄组件503包括变焦马达;所述存储器501上存储有计算机程序5042,所述处理器502执行所述计算机程序5042时实现上述的一种无人拍摄自动变焦方法。图6为本发明实施例提供一种内存储器的结构框图,如图6所示,存储器501可以包括非易失性存储介质504和内存储器505。

该非易失性存储介质504可存储操作系统5041和计算机程序5042。该计算机程序5042包括程序指令,该程序指令被执行时,可使得处理器502执行上述一种无人拍摄自动变焦方法。

该处理器502用于提供计算和控制能力,以支撑整个无人摄像机的运行。

该内存储器505为非易失性存储介质504中的计算机程序5042的运行提供环境,该计算机程序5042被处理器502执行时,可使得处理器502执行上述一种无人拍摄自动变焦方法。

该网络接口506用于与其它设备进行网络通信。本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的无人摄像机的限定,具体的无人摄像机可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

其中,所述处理器502用于运行存储在存储器501中的计算机程序5042,以实现如下步骤:步骤s110、接收用户输入的变焦控制指令;步骤s120、实时检测摄像机拍摄影像内的目标人像,获取所述目标人像的目标人像边界框;步骤s130、基于深度卷积神经网络获取目标人像边界框的尺度;步骤s140、计算目标人像边界框的尺度与变焦控制指令中的预设命令尺度的尺度误差;步骤s150、判断所述尺度误差是否处于预设误差范围内,若否,执行步骤s160;若是,执行步骤s170;步骤s160、根据所述尺度误差控制摄像机的变焦马达转动,返回执行步骤s120;步骤s170、控制摄像机的变焦马达停止转动,完成自动变焦。

在其中一实施例中,处理器502在实现所述步骤s130、基于深度卷积神经网络获取目标人像边界框的尺度的步骤时,具体实现如下步骤:步骤s131、利用深度卷积神经网络对拍摄影像进行计算,得到与所述拍摄影像相同大小的尺度响应图;步骤s132、获取所述目标人像边界框在所述尺度响应图对应位置的最高响应值,以所述最高响应值作为目标人像边界框的尺度。

在其中一实施例中,处理器502在实现所述根据所述尺度误差控制摄像机的变焦马达转动的步骤时,具体实现如下步骤:根据尺度误差e来计算变焦马达的运动速率v,v=kp·f(e),e=sref-se其中,定义变焦马达向长焦端移动的速率为正,向广角端移动的速率为负;尺度误差e=预设命令尺度sref-目标人像边界框的尺度se;kp为速率控制的增益系数;δ是误差截止值;f(e)为误差映射的函数,根据所述运动速率v控制摄像机的变焦马达转动;其中,预设误差范围为[-δ,+δ]。

在其中一实施例中,处理器502在实现所述在基于深度卷积神经网络获取目标人像边界框的尺度步骤之前,还实现如下步骤:构建由人物图像及每张人物图像对应的标记数据组成的人物图像数据集;其中,所述标记数据包括人物图像中每个人物的人像边界框、人物躯干在人物图像中的像素面积及人物离镜头的距离;利用所述人物图像数据集对深度卷积神经网络进行迭代训练,得到训练好的深度卷积神经网络。

在其中一实施例中,处理器502在实现所述所述基于深度卷积神经网络获取目标人像边界框的尺度时,具体实现如下步骤:利用训练好的深度卷积神经网络获取目标人像边界框的尺度。

应当理解,在本申请实施例中,处理器502可以是中央处理单元(centralprocessingunit,cpu),该处理器502还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中,通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被该计算机系统中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。

因此,本发明还提供一种存储介质。该存储介质可以为计算机可读存储介质。该存储介质存储有计算机程序,其中计算机程序包括程序指令。该程序指令被处理器执行时使处理器执行如下步骤:步骤s110、接收用户输入的变焦控制指令;步骤s120、实时检测摄像机拍摄影像内的目标人像,获取所述目标人像的目标人像边界框;步骤s130、基于深度卷积神经网络获取目标人像边界框的尺度;步骤s140、计算目标人像边界框的尺度与变焦控制指令中的预设命令尺度的尺度误差;步骤s150、判断所述尺度误差是否处于预设误差范围内,若否,执行步骤s160;若是,执行步骤s170;步骤s160、根据所述尺度误差控制摄像机的变焦马达转动,返回执行步骤s120;步骤s170、控制摄像机的变焦马达停止转动,完成自动变焦。

在一实施例中,所述处理器在执行所述程序指令而实现所述尺度误差控制摄像机的变焦马达转动的步骤时,具体实现如下步骤:根据尺度误差e来计算变焦马达的运动速率v,v=kp·f(e),e=sref-se其中,定义变焦马达向长焦端移动的速率为正,向广角端移动的速率为负;尺度误差e=预设命令尺度sref-目标人像边界框的尺度se;kp为速率控制的增益系数;δ是误差截止值;f(e)为误差映射的函数,根据所述运动速率v控制摄像机的变焦马达转动;其中,预设误差范围为[-δ,+δ]。

在其中一实施例中,所述处理器在实现所述程序指令而实现所述基于深度卷积神经网络获取目标人像边界框的尺度步骤时,具体实现如下步骤:利用深度卷积神经网络对拍摄影像进行计算,得到与所述拍摄影像相同大小的尺度响应图;获取所述目标人像边界框在所述尺度响应图对应位置的最高响应值,以所述最高响应值作为目标人像边界框的尺度。

在一实施例中,所述处理器在执行所述程序指令而实现所述在基于深度卷积神经网络获取目标人像边界框的尺度步骤之前,还实现如下步骤:构建由人物图像及每张人物图像对应的标记数据组成的人物图像数据集;其中,所述标记数据包括人物图像中每个人物的人像边界框、人物躯干在人物图像中的像素面积及人物离镜头的距离;利用所述人物图像数据集对深度卷积神经网络进行迭代训练,得到训练好的深度卷积神经网络。

所述存储介质可以是u盘、移动硬盘、只读存储器(read-onlymemory,rom)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。

综上所述,本发明一种无人拍摄自动变焦方法及系统、无人摄像机及存储介质通过训练好的深度卷积神经网络获取目标人像边界框的尺度,配合不同的预设命令尺度来控制摄像机的变焦马达转动,无需人工直接操作摄像机即可完成对拍摄目标的自动变焦拍摄,提升拍摄效果,满足用户的个性化需求。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的。例如,各个单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。该集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1