图像中目标物位置检测方法、装置、电子设备及存储介质与流程

文档序号:24488913发布日期:2021-03-30 21:13阅读:126来源:国知局
图像中目标物位置检测方法、装置、电子设备及存储介质与流程

本发明涉及图像处理技术领域,尤其涉及一种图像中目标物位置检测方法、装置、电子设备及计算机可读存储介质。



背景技术:

随着计算机视觉的发展,越来越多的场合需要对图像进行分析处理以实现从图像中获取需要的信息。例如,发生交通事故时,人们从事故发生地获取交通事故发生时的行车图像,利用图像处理技术对所述行车图像进行分析,得到图像中车辆的位置、轨迹等信息,从而判断交通事故发生的原因、责任归属。

现有的对于图像中目标物(如车辆)位置的检测方法多为利用包含目标物的现有图像直接对图像识别网络进行训练,但由于现有图像中的目标物可能存在模糊、重叠、发生形变等因素,导致利用现有图像直接训练出的模型在对图像进行识别时的精确度不高。



技术实现要素:

本发明提供一种图像中目标物位置检测方法、装置及计算机可读存储介质,其主要目的在于解决现有目标物位置识别模型的精确度不高的问题。

为实现上述目的,本发明提供的一种图像中目标物位置检测方法,包括:

获取包含目标物的训练图像集,对所述训练图像集进行图像增强,得到增强图像集;

将所述增强图像集进行前景及背景的区域分割,得到分割图像集,其中,所述分割图像集中的每张图像中包括前景区域及背景区域;

对所述分割图像集中每张图像的背景区域进行图像填充,得到填充图像集;

对所述填充图像集中的每张图像进行图像扩展,得到扩展图像集;

利用所述扩展图像集对预先构建的位置识别网络模型进行目标物位置识别训练,得到训练完成的位置识别网络模型;

获取待识别图像,利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果。

可选地,所述对所述训练图像集进行图像增强,得到增强图像集,包括:

遍历并获取所述训练图像集的像素点;

利用预设的像素滤波器对所述像素点进行像素滤波处理,得到滤波图像集;

对所述滤波图像进行局部纹理加深,得到增强图像集。

可选地,所述对所述滤波图像集进行局部纹理加深,得到增强图像集,包括:

用n×n的图像窗口在所述滤波图像集中依次执行区域选择,得到多个图像区域,根据每个所述图像区域的中心像素以及所述中心像素的邻域像素,利用预设算法计算每个所述图像区域的中心像素的二进制码元;

根据得到的所述二进制码元对所述中心像素进行像素归一化,得到增强图像集。

可选地,所述根据每个所述图像区域的中心像素以及所述中心像素的邻域像素,利用预设算法计算每个所述图像区域的中心像素的二进制码元,包括:

利用如下算法计算所述图像区域的中心像素的二进制码元

其中,p0为所述图像区域的中心像素,pe为所述中心像素的邻域像素的均值,n为所述邻域像素的个数,s(p0-pe)为量化运算。

可选地,所述将所述增强图像集进行前景及背景的区域分割,得到分割图像集,包括:

遍历并获取所述增强图像集中每张增强图像内各像素点的像素值;

确定所述像素值大于预设像素阈值的像素点为前景区域;

确定所述像素值小于或等于所述预设像素阈值的像素点为背景区域;

按照所述前景区域和所述背景区域将所述增强图像集中每张增强图像进行前景及背景的区域分割,得到分割图像集。

可选地,所述利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果,包括:

利用所述位置识别网络模型的前向并行卷积通道对所述待识别图像进行卷积操作,得到前向特征图;

利用所述位置识别网络模型的后向并行卷积通道对所述前向特征图及所述前向特征图的下采样图像进行卷积操作,得到后向特征图;

对获得的前向特征图和后向特征图进行特征融合,得到融合特征图;

利用像素分类算法对所述融合特征图进行目标物位置识别,得到目标物位置识别结果。

可选地,所述对所述填充图像集中的每张图像进行图像扩展包括图像尺寸裁剪、图像白平衡调节、图像像素扰动、图像几何旋转和图像几何拉伸之中的一项或多项操作。

为了解决上述问题,本发明还提供一种图像中目标物位置检测装置,所述装置包括:

图像增强模块,用于获取包含目标物的训练图像集,对所述训练图像集进行图像增强,得到增强图像集;

区域划分模块,用于将所述增强图像集进行前景及背景的区域分割,得到分割图像集,其中,所述分割图像集中的每张图像中包括前景区域及背景区域;

区域填充模块,用于对所述分割图像集中每张图像的背景区域进行图像填充,得到填充图像集;

图像扩展模块,用于对所述填充图像集中的每张图像进行图像扩展,得到扩展图像集;

网络训练模块,用于利用所述扩展图像集对预先构建的位置识别网络模型进行目标物位置识别训练,得到训练完成的位置识别网络模型;

位置识别模块,用于获取待识别图像,利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果。

为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:

存储器,存储至少一个指令;及

处理器,执行所述存储器中存储的指令以实现上述所述的图像中目标物位置检测方法。

为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的图像中目标物位置检测方法。

本发明实施例通过对训练图像集进行图像增强,可实现将训练图像集中的每张训练图像进行噪点像素过滤,以及局部纹理增强,有利于后续训练出更加精确的位置识别网络模型,将增强图像集分割为前景区域和背景区域,对分割图像集中每张图像的背景区域进行图像填充,可减少图像中需要进行分析的区域,有利于提高后续利用位置识别网络模型进行目标物位置识别的效率,执行图像扩展操作可增加扩展图像集中的图像多样化,有利于提高后续训练出的位置识别网络模型的鲁棒性,对构建的位置识别网络模型进行训练,并利用训练完成的位置识别网络模型识别待识别图像中目标物的位置,实现了对待识别图像中目标物位置的精确识别。因此本发明提出的图像中目标物位置检测方法、装置、电子设备及计算机可读存储介质,可以解决现有目标物位置识别模型的精确度不高的问题。

附图说明

图1为本发明一实施例提供的图像中目标物位置检测方法的流程示意图;

图2为本发明一实施例提供的图像中目标物位置检测装置的功能模块图;

图3为本发明一实施例提供的实现所述图像中目标物位置检测方法的电子设备的结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本申请实施例提供一种图像中目标物位置检测方法。所述图像中目标物位置检测方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述图像中目标物位置检测方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。

参照图1所示,为本发明一实施例提供的图像中目标物位置检测方法的流程示意图。在本实施例中,所述图像中目标物位置检测方法包括:

s1、获取包含目标物的训练图像集,对所述训练图像集进行图像增强,得到增强图像集。

本发明实施例中,所述训练图像集中包含多张训练图像,每张训练图像内均包括所述目标物,例如,当目标物为汽车时,所述训练图像集中包含多张包含汽车的训练图像。

详细地,本发明实施例通过具有数据抓取功能的python语句从用于存储训练图像集的区块链节点中抓取所述训练图像集,利用区块链对数据的高吞吐性,可提高获取所述训练图像集的效率。

本发明实施例中,所述对所述训练图像集进行图像增强,得到增强图像集,包括:

遍历并获取所述训练图像集的像素点;

利用预设的像素滤波器对所述像素点进行像素滤波处理,得到滤波图像集;

对所述滤波图像进行局部纹理加深,得到增强图像集。

本发明实施例中,所述像素滤波器包括但不限于最大值滤波器、最小值滤波器和中值滤波器,详细地,所述利用预设的像素滤波器对所述像素点进行像素滤波处理包括:将所述训练图像集的像素点输入至所述像素滤波器,利用像素滤波器判断并筛选出所述像素点中的噪声像素点,对所述噪声像素点进行删除,完成所述像素滤波处理。本发明实施例利用所述像素滤波器将所述训练图像集的像素点进行像素滤波处理,可实现对所述训练图像集中噪声像素点的过滤。

进一步地,所述对所述滤波图像集进行局部纹理加深,得到增强图像集,包括:

用n×n的图像窗口在所述滤波图像集中依次执行区域选择,得到多个图像区域,根据每个所述图像区域的中心像素以及所述中心像素的邻域像素,利用预设算法计算每个所述图像区域的中心像素的二进制码元;

根据得到的所述二进制码元对所述中心像素进行像素归一化,得到增强图像集。

详细地,所述根据每个所述图像区域的中心像素以及所述中心像素的邻域像素,利用预设算法计算每个所述图像区域的中心像素的二进制码元,包括:

利用如下算法计算所述图像区域的中心像素的二进制码元

其中,p0为所述图像区域的中心像素,pe为所述中心像素的邻域像素的均值,n为所述邻域像素的个数,s(p0-pe)为量化运算。

其中,所述s(p0-pe)代表的量化运算的表达式如下:

x=p0-pe

具体地,所述根据得到的所述二进制码元对所述中心像素进行像素归一化,得到增强图像集,包括:

判断所述二进制码元与预设的标准码元的大小,当所述二进制码元大于所述标准码元,将所述中心像素的像素值置为预设第一中心像素值;

当所述二进制码元小于或等于所述标准码元,将所述中心像素的像素值置为预设第二中心像素值。

本发明实施例对训练图像集进行图像增强,可实现将训练图像集中的每张训练图像进行噪点像素过滤,以及局部纹理增强,有利于后续训练出更加精确的位置识别网络模型。

s2、将所述增强图像集进行前景及背景的区域分割,得到分割图像集,其中,所述分割图像集中的每张图像中包括前景区域及背景区域。

本发明实施例中,所述将所述增强图像集进行前景及背景的区域分割,得到分割图像集,包括:

遍历并获取所述增强图像集中每张增强图像内各像素点的像素值;

确定所述像素值大于预设像素阈值的像素点为前景区域;

确定所述像素值小于或等于所述预设像素阈值的像素点为背景区域;

按照所述前景区域和所述背景区域将所述增强图像集中每张增强图像进行前景及背景的区域分割,得到分割图像集。

详细地,所述前景及背景区域分割是将所述增强图像集中每张增强图像根据像素值的大小划分为前景区域和背景区域。

例如,增强图像中包含像素点a、像素点b、像素点c、像素点d、像素点e和像素点f,其中,像素点a的像素值为10,像素点b的像素值为20,像素点c的像素值为30,像素点d的像素值为40,像素点e的像素值为50,像素点f的像素值为60,当预设像素阈值为35时,确定素点a、像素点b和像素点c所在的区域为背景区域,确定像素点d、像素点e和像素点f所在的区域为前景区域。

s3、对所述分割图像集中每张图像的背景区域进行图像填充,得到填充图像集。

本发明实施例中,所述对所述分割图像集中每张图像的背景区域进行图像填充是利用包含颜色的图形对背景区域进行覆盖。例如,使用pythonturtle库中的青色分型雪花的图形对分割图像集中每张图像的背景区域进行覆盖。

详细地,对所述分割图像集中每张图像的背景区域进行图像填充的图形与分割图像集中目标物的形状与颜色不一致,避免由于进行图像填充的图形与分割图像集中目标物的形状与颜色相似导致后续位置识别网络模型识别时的误判。

s4、对所述填充图像集中的每张图像进行图像扩展,得到扩展图像集。

本发明实施例中,所述对所述填充图像集中的每张图像进行图像扩展包括图像尺寸裁剪、图像白平衡调节、图像像素扰动、图像几何旋转和图像几何拉伸之中的一项或多项操作。

详细地,所述图像像素扰动是指对填充图像的像素进行调整,具体的,可以通过利用如下扰动算法对填充图像进行像素扰动:

trans=(δr+xr)+(δg+xg)+(δb+xb)

其中,trans为像素扰动后的填充图像,xr、xg、xb为扰动前的填充图像中任一像素点的三分量,δr、δg、δb为扰动因子中任一像素点的三分量,所述扰动因子是与扰动前的填充图像大小相同的图像。

本发明实施例中,执行图像扩展操作可增加扩展图像集中的图像多样化,有利于提高后续训练出的位置识别网络模型的鲁棒性。

s5、利用所述扩展图像集对预先构建的位置识别网络模型进行目标物位置识别训练,得到训练完成的位置识别网络模型。

本发明实施例中,所述位置识别网络模型为一个具有目标物位置识别功能的卷积神经网络,所述卷积神经网络包括卷积层、池化层和全连接层。

详细地,所述位置识别网络模型包括多个不同分辨率的并行卷积层。

本发明实施例中,所述位置识别网络模型采用hrnet网络结构,所述hrnet网络采用多通道、多分辨率分支并行卷积的方式对同一特征进行卷积,从而得到目标物同一特征不同分辨率下的特征图。

本发明实施例采用的hrnet网络,由传统的串行连接卷积,改成并行连接卷积,进而得到丰富的高分辨率表征,提高了模型进行目标检测的精确度。

详细地,所述所述利用所述扩展图像集对所述位置识别网络模型进行目标物位置识别训练之前,还包括对所述扩展图像集进行目标物位置标注,本发明实施例利用预设的图像标注工具实现对扩展图像集进行目标物位置标注,得到目标物的标准位置信息,所述图像标注工具包括但不限于labelmelabelme工具、labelimglabelimg工具和labelhublabelhub工具。

具体地,所述利用所述扩展图像集对所述位置识别网络模型进行目标物位置识别训练,得到训练完成的位置识别网络模型,包括:

利用所述位置识别网络模型对所述扩展图像集进行位置预测,得到目标物的预测位置信息;

计算所述预测位置信息与所述标准位置信息的损失值;

若所述损失值大于或等于预设的损失阈值,则调整所述位置识别网络模型的参数,重新进行位置预测;

若所述损失值小于所述损失阈值,则完成训练,得到训练完成的位置识别网络模型。

本发明实施例利用如下损失函数计算所述预测位置信息与所述标准位置信息的损失值l:

其中,s*为所述预测位置信息,s为所述标准位置信息,n为所述预测位置信息的数量。

进一步地,若所述损失值大于或等于预设的损失阈值,本发明实施例利用梯度下降算法调整所述位置识别网络模型的参数,所述梯度下降算法包括但不限于批量梯度下降算法、随机梯度下降算法和小批量梯度下降算法。

s6、获取待识别图像,利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果。

本发明实施例中,可利用具有数据调用功能的java语句从数据库中调用预先存储的待识别图像。

详细地,所述利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果,包括:

利用所述位置识别网络模型的前向并行卷积通道对所述待识别图像进行卷积操作,得到前向特征图;

利用所述位置识别网络模型的后向并行卷积通道对所述前向特征图及所述前向特征图的下采样图像进行卷积操作,得到后向特征图;

对获得的前向特征图和后向特征图进行特征融合,得到融合特征图;

利用像素分类算法对所述融合特征图进行目标物位置识别,得到目标物位置识别结果。

详细地,所述像素分类算法包括但不限于基于区域的像素分类算法、基于阈值的像素分类算法、基于边缘的像素分类算法。

所述前向并行卷积通道与所述后向并行卷积通道是相对而言的,例如,位置识别网络模型包括4个并行卷积通道,第一个对待识别图像进行卷积的并行卷积通道相对于第二个对待识别图像进行卷积的并行卷积通道、第三个对待识别图像进行卷积的并行卷积通道和第一个对待识别图像进行卷积的并行卷积通道来说是前向并行卷积通道;第二个对待识别图像进行卷积的并行卷积通道相对于第一个对待识别图像进行卷积的并行卷积通道来说是后向并行卷积通道,依此类推。

当前向并行卷积通道为初始并行卷积通道时,后向卷积的对前向得到的结果及前向并行卷积通道的输入进行卷积,得到特征图。

当前向并行卷积通道不为初始卷积通道时,后向卷积的对前向得到的结果及所有前向卷积通道的输入进行卷积,得到特征图。

具体地,例如,在第一并行卷积通道中对所述待识别图像进行卷积,得到第一特征图;

在第二并行卷积通道中对所述第一特征图及所述第一特征图的第一下采样图像进行卷积,得到第二特征图;

在第三并行卷积通道中对所述第二特征图及所述第二特征图的第二下采样图像进行卷积,得到第三特征图;

在第四并行卷积通道中对所述第三特征图及所述第三特征图的第三下采样图像进行卷积,得到第四特征图;

对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图进行特征融合得到融合特征图,并利用图像分割算法对所述融合特征图进行图像分割,得到所述检测结果。

其中,第一并行卷积通道、第一并行卷积通道、第一并行卷积通道、第一并行卷积通道以并行方式连接,以此得到同一特征的四种不同分辨率的特征图。

本发明实施例通过对训练图像集进行图像增强,可实现将训练图像集中的每张训练图像进行噪点像素过滤,以及局部纹理增强,有利于后续训练出更加精确的位置识别网络模型,将增强图像集分割为前景区域和背景区域,对分割图像集中每张图像的背景区域进行图像填充,可减少图像中需要进行分析的区域,有利于提高后续利用位置识别网络模型进行目标物位置识别的效率,执行图像扩展操作可增加扩展图像集中的图像多样化,有利于提高后续训练出的位置识别网络模型的鲁棒性,对构建的位置识别网络模型进行训练,并利用训练完成的位置识别网络模型识别待识别图像中目标物的位置,实现了对待识别图像中目标物位置的精确识别。因此本发明提出的图像中目标物位置检测方法,可以解决现有目标物位置识别模型的精确度不高的问题。

如图2所示,是本发明一实施例提供的图像中目标物位置检测装置的功能模块图。

本发明所述图像中目标物位置检测装置100可以安装于电子设备中。根据实现的功能,所述图像中目标物位置检测装置100可以包括图像增强模块101、区域划分模块102、区域填充模块103、图像扩展模块104、网络训练模块105和位置识别模块106。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。

在本实施例中,关于各模块/单元的功能如下:

所述图像增强模块101,用于获取包含目标物的训练图像集,对所述训练图像集进行图像增强,得到增强图像集。

本发明实施例中,所述训练图像集中包含多张训练图像,每张训练图像内均包括所述目标物,例如,当目标物为汽车时,所述训练图像集中包含多张包含汽车的训练图像。

详细地,本发明实施例通过具有数据抓取功能的python语句从用于存储训练图像集的区块链节点中抓取所述训练图像集,利用区块链对数据的高吞吐性,可提高获取所述训练图像集的效率。

本发明实施例中,所述图像增强模块101具体用于:

获取包含目标物的训练图像集;

遍历并获取所述训练图像集的像素点;

利用预设的像素滤波器对所述像素点进行像素滤波处理,得到滤波图像集;

对所述滤波图像进行局部纹理加深,得到增强图像集。

本发明实施例中,所述像素滤波器包括但不限于最大值滤波器、最小值滤波器和中值滤波器,利用所述像素滤波器将所述训练图像集的像素点进行像素滤波处理,可实现对所述训练图像集中噪声像素点的过滤。

进一步地,所述对所述滤波图像集进行局部纹理加深,得到增强图像集,包括:

用n×n的图像窗口在所述滤波图像集中依次执行区域选择,得到多个图像区域,根据每个所述图像区域的中心像素以及所述中心像素的邻域像素,利用预设算法计算每个所述图像区域的中心像素的二进制码元;

根据得到的所述二进制码元对所述中心像素进行像素归一化,得到增强图像集。

详细地,所述根据每个所述图像区域的中心像素以及所述中心像素的邻域像素,利用预设算法计算每个所述图像区域的中心像素的二进制码元,包括:

利用如下算法计算所述图像区域的中心像素的二进制码元

其中,p0为所述图像区域的中心像素,pe为所述中心像素的邻域像素的均值,n为所述邻域像素的个数,s(p0-pe)为量化运算。

其中,所述s(p0-pe)代表的量化运算的表达式如下:

x=p0-pe

具体地,所述根据得到的所述二进制码元对所述中心像素进行像素归一化,得到增强图像集,包括:判断所述二进制码元与预设的标准码元的大小,当所述二进制码元大于所述标准码元,将所述中心像素的像素值置为预设第一中心像素值,当所述二进制码元小于或等于所述标准码元,将所述中心像素的像素值置为预设第二中心像素值。

本发明实施例对训练图像集进行图像增强,可实现将训练图像集中的每张训练图像进行噪点像素过滤,以及局部纹理增强,有利于后续训练出更加精确的位置识别网络模型。

所述区域划分模块102,用于将所述增强图像集进行前景及背景的区域分割,得到分割图像集,其中,所述分割图像集中的每张图像中包括前景区域及背景区域。

本发明实施例中,所述区域划分模块102具体用于:

遍历并获取所述增强图像集中每张增强图像内各像素点的像素值;

确定所述像素值大于预设像素阈值的像素点为前景区域;

确定所述像素值小于或等于所述预设像素阈值的像素点为背景区域;

按照所述前景区域和所述背景区域将所述增强图像集中每张增强图像进行前景及背景的区域分割,得到分割图像集。

详细地,所述前景及背景区域分割是将所述增强图像集中每张增强图像根据像素值的大小划分为前景区域和背景区域。

例如,增强图像中包含像素点a、像素点b、像素点c、像素点d、像素点e和像素点f,其中,像素点a的像素值为10,像素点b的像素值为20,像素点c的像素值为30,像素点d的像素值为40,像素点e的像素值为50,像素点f的像素值为60,当预设像素阈值为35时,确定素点a、像素点b和像素点c所在的区域为背景区域,确定像素点d、像素点e和像素点f所在的区域为前景区域。

所述区域填充模块103,用于对所述分割图像集中每张图像的背景区域进行图像填充,得到填充图像集。

本发明实施例中,所述对所述分割图像集中每张图像的背景区域进行图像填充是利用包含颜色的图形对背景区域进行覆盖。例如,使用pythonturtle库中的青色分型雪花的图形对分割图像集中每张图像的背景区域进行覆盖。

详细地,对所述分割图像集中每张图像的背景区域进行图像填充的图形与分割图像集中目标物的形状与颜色不一致,避免由于进行图像填充的图形与分割图像集中目标物的形状与颜色相似导致后续位置识别网络模型识别时的误判。

所述图像扩展模块104,用于对所述填充图像集中的每张图像进行图像扩展,得到扩展图像集。

本发明实施例中,所述对所述填充图像集中的每张图像进行图像扩展包括图像尺寸裁剪、图像白平衡调节、图像像素扰动、图像几何旋转和图像几何拉伸之中的一项或多项操作。

详细地,所述图像像素扰动是指对填充图像的像素进行调整,具体的,可以通过利用如下扰动算法对填充图像进行像素扰动:

trans=(δr+xr)+(δg+xg)+(δb+xb)

其中,trans为像素扰动后的填充图像,xr、xg、xb为扰动前的填充图像中任一像素点的三分量,δr、δg、δb为扰动因子中任一像素点的三分量,所述扰动因子是与扰动前的填充图像大小相同的图像。

本发明实施例中,执行图像扩展操作可增加扩展图像集中的图像多样化,有利于提高后续训练出的位置识别网络模型的鲁棒性。

所述网络训练模块105,利用所述扩展图像集对预先构建的位置识别网络模型进行目标物位置识别训练,得到训练完成的位置识别网络模型。

本发明实施例中,所述位置识别网络模型为一个具有目标物位置识别功能的卷积神经网络,所述卷积神经网络包括卷积层、池化层和全连接层。

详细地,所述位置识别网络模型包括多个不同分辨率的并行卷积层。

本发明实施例中,所述位置识别网络模型采用hrnet网络结构,所述hrnet网络采用多通道、多分辨率分支并行卷积的方式对同一特征进行卷积,从而得到目标物同一特征不同分辨率下的特征图。

本发明实施例采用的hrnet网络,由传统的串行连接卷积,改成并行连接卷积,进而得到丰富的高分辨率表征,提高了模型进行目标检测的精确度。

详细地,所述所述利用所述扩展图像集对所述位置识别网络模型进行目标物位置识别训练之前,还包括对所述扩展图像集进行目标物位置标注,本发明实施例利用预设的图像标注工具实现对扩展图像集进行目标物位置标注,得到目标物的标准位置信息,所述图像标注工具包括但不限于labelmelabelme工具、labelimglabelimg工具和labelhublabelhub工具。

具体地,所述网络训练模块105具体用于:

利用所述位置识别网络模型对所述扩展图像集进行位置预测,得到目标物的预测位置信息;

计算所述预测位置信息与所述标准位置信息的损失值;

若所述损失值大于或等于预设的损失阈值,则调整所述位置识别网络模型的参数,重新进行位置预测;

若所述损失值小于所述损失阈值,则完成训练,得到训练完成的位置识别网络模型。

本发明实施例利用如下损失函数计算所述预测位置信息与所述标准位置信息的损失值l:

其中,s*为所述预测位置信息,s为所述标准位置信息,n为所述预测位置信息的数量。

进一步地,若所述损失值大于或等于预设的损失阈值,本发明实施例利用梯度下降算法调整所述位置识别网络模型的参数,所述梯度下降算法包括但不限于批量梯度下降算法、随机梯度下降算法和小批量梯度下降算法。

所述位置识别模块106,用于获取待识别图像,利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果。

本发明实施例中,可利用具有数据调用功能的java语句从数据库中调用预先存储的待识别图像。

详细地,所述位置识别模块106具体用于:

利用所述位置识别网络模型的前向并行卷积通道对所述待识别图像进行卷积操作,得到前向特征图;

利用所述位置识别网络模型的后向并行卷积通道对所述前向特征图及所述前向特征图的下采样图像进行卷积操作,得到后向特征图;

对获得的前向特征图和后向特征图进行特征融合,得到融合特征图;

利用像素分类算法对所述融合特征图进行目标物位置识别,得到目标物位置识别结果。

详细地,所述像素分类算法包括但不限于基于区域的像素分类算法、基于阈值的像素分类算法、基于边缘的像素分类算法。

所述前向并行卷积通道与所述后向并行卷积通道是相对而言的,例如,位置识别网络模型包括4个并行卷积通道,第一个对待识别图像进行卷积的并行卷积通道相对于第二个对待识别图像进行卷积的并行卷积通道、第三个对待识别图像进行卷积的并行卷积通道和第一个对待识别图像进行卷积的并行卷积通道来说是前向并行卷积通道;第二个对待识别图像进行卷积的并行卷积通道相对于第一个对待识别图像进行卷积的并行卷积通道来说是后向并行卷积通道,依此类推。

当前向并行卷积通道为初始并行卷积通道时,后向卷积的对前向得到的结果及前向并行卷积通道的输入进行卷积,得到特征图。

当前向并行卷积通道不为初始卷积通道时,后向卷积的对前向得到的结果及所有前向卷积通道的输入进行卷积,得到特征图。

具体地,例如,在第一并行卷积通道中对所述待识别图像进行卷积,得到第一特征图;

在第二并行卷积通道中对所述第一特征图及所述第一特征图的第一下采样图像进行卷积,得到第二特征图;

在第三并行卷积通道中对所述第二特征图及所述第二特征图的第二下采样图像进行卷积,得到第三特征图;

在第四并行卷积通道中对所述第三特征图及所述第三特征图的第三下采样图像进行卷积,得到第四特征图;

对所述第一特征图、所述第二特征图、所述第三特征图和所述第四特征图进行特征融合得到融合特征图,并利用图像分割算法对所述融合特征图进行图像分割,得到所述检测结果。

其中,第一并行卷积通道、第一并行卷积通道、第一并行卷积通道、第一并行卷积通道以并行方式连接,以此得到同一特征的四种不同分辨率的特征图。

本发明实施例通过对训练图像集进行图像增强,可实现将训练图像集中的每张训练图像进行噪点像素过滤,以及局部纹理增强,有利于后续训练出更加精确的位置识别网络模型,将增强图像集分割为前景区域和背景区域,对分割图像集中每张图像的背景区域进行图像填充,可减少图像中需要进行分析的区域,有利于提高后续利用位置识别网络模型进行目标物位置识别的效率,执行图像扩展操作可增加扩展图像集中的图像多样化,有利于提高后续训练出的位置识别网络模型的鲁棒性,对构建的位置识别网络模型进行训练,并利用训练完成的位置识别网络模型识别待识别图像中目标物的位置,实现了对待识别图像中目标物位置的精确识别。因此本发明提出的图像中目标物位置检测装置,可以解决现有目标物位置识别模型的精确度不高的问题。

如图3所示,是本发明一实施例提供的实现图像中目标物位置检测方法的电子设备的结构示意图。

所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如图像中目标物位置检测程序12。

其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smartmediacard,smc)、安全数字(securedigital,sd)卡、闪存卡(flashcard)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如图像中目标物位置检测程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。

所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(centralprocessingunit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(controlunit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如图像中目标物位置检测程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。

所述总线可以是外设部件互连标准(peripheralcomponentinterconnect,简称pci)总线或扩展工业标准结构(extendedindustrystandardarchitecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。

图3仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图3示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。

例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。

进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。

可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organiclight-emittingdiode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。

应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。

所述电子设备1中的所述存储器11存储的图像中目标物位置检测程序12是多个指令的组合,在所述处理器10中运行时,可以实现:

获取包含目标物的训练图像集,对所述训练图像集进行图像增强,得到增强图像集;

将所述增强图像集进行前景及背景的区域分割,得到分割图像集,其中,所述分割图像集中的每张图像中包括前景区域及背景区域;

对所述分割图像集中每张图像的背景区域进行图像填充,得到填充图像集;

对所述填充图像集中的每张图像进行图像扩展,得到扩展图像集;

利用所述扩展图像集对预先构建的位置识别网络模型进行目标物位置识别训练,得到训练完成的位置识别网络模型;

获取待识别图像,利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果。

具体地,所述处理器10对上述指令的具体实现方法可参考图1至图3对应实施例中相关步骤的描述,在此不赘述。

进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。所述计算机可读存储介质可以是易失性的,也可以是非易失性的。例如,所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)。

本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:

获取包含目标物的训练图像集,对所述训练图像集进行图像增强,得到增强图像集;

将所述增强图像集进行前景及背景的区域分割,得到分割图像集,其中,所述分割图像集中的每张图像中包括前景区域及背景区域;

对所述分割图像集中每张图像的背景区域进行图像填充,得到填充图像集;

对所述填充图像集中的每张图像进行图像扩展,得到扩展图像集;

利用所述扩展图像集对预先构建的位置识别网络模型进行目标物位置识别训练,得到训练完成的位置识别网络模型;

获取待识别图像,利用所述训练完成的位置识别网络模型对所述待识别图像进行目标物位置识别,得到目标物位置识别结果。

在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。

因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1