目标对象信息的处理方法、装置及计算机程序产品与流程

文档序号:28323681发布日期:2022-01-05 00:02阅读:63来源:国知局
目标对象信息的处理方法、装置及计算机程序产品与流程

1.本公开涉及计算机技术领域,具体涉及边缘计算、云计算、深度学习等技术,尤其涉及目标对象信息的处理方法、装置、电子设备、存储介质以及计算机程序产品,可用于目标检测场景下。


背景技术:

2.在目标检测算法中,经常会遇到各类型的样本数据集数量相差比较大,即样本不均衡的情况。若直接采用不均衡的训练样本训练目标对象检测模型,所得到的模型的检测效果一般都不理想,尤其对于样本数量少的类型的目标对象,检测效果通常较差。目前,在样本不均衡的情况下,通常以数据量小的类别为基准,构建样本均衡的训练集进行模型训练。然而,由训练样本数据量较小,导致所得到的目标对象检测模型的检测效果较差。


技术实现要素:

3.本公开提供了一种目标对象信息的处理方法、装置、电子设备、存储介质以及计算机程序产品。
4.根据第一方面,提供了一种目标对象信息的处理方法,包括:获取训练集,其中,训练集中包括数量不均衡的、对应于不同类型的目标对象的多个训练子集,每个训练子集中包括的训练样本包括样本图像和样本图像中的目标对象的位置标签、类型标签;通过训练集中的训练样本中的样本图像和位置标签,训练得到目标对象确定网络;基于多个训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络;结合目标对象确定网络和目标对象分类网络,得到目标对象检测模型。
5.根据第二方面,提供了一种目标对象的检测方法,包括:获取待检测图像;通过目标对象检测模型得到待检测图像中的目标对象的检测结果,其中,目标对象检测模型通过第一方面任一实现方式描述的方法得到。
6.根据第三方面,提供了一种目标对象信息的处理装置,包括:第一获取单元,被配置成获取训练集,其中,训练集中包括数量不均衡的、对应于不同类型的目标对象的多个训练子集,每个训练子集中包括的训练样本包括样本图像和样本图像中的目标对象的位置标签、类型标签;第一训练单元,被配置成通过训练集中的训练样本中的样本图像和位置标签,训练得到目标对象确定网络;第二训练单元,被配置成基于多个训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络;得到单元,被配置成结合目标对象确定网络和目标对象分类网络,得到目标对象检测模型。
7.根据第四方面,提供了一种目标对象的检测装置,包括:第二获取单元,被配置成获取待检测图像;检测单元,被配置成通过目标对象检测模型得到待检测图像中的目标对象的检测结果,其中,目标对象检测模型通过第三方面任一实现方式描述的装置得到。
8.根据第五方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少
一个处理器执行,以使至少一个处理器能够执行如第一方面、第二方面任一实现方式描述的方法。
9.根据第六方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面、第二方面任一实现方式描述的方法。
10.根据第七方面,提供了一种计算机程序产品,包括:计算机程序,计算机程序在被处理器执行时实现如第一方面、第二方面任一实现方式描述的方法。
11.根据本公开的技术,在训练样本不均衡的情况下,将目标对象检测模型划分为确定网络和分类网络,先将各训练子集中所有类型的目标对象视作同一个大类,通过目标对象的位置标签训练目标对象确定网络;然后,利用目标对象分类网络对应的图像分类任务简单、所需训练样本的数据量少的特点,基于各训练子集中的样本图像的类型标签训练目标对象分类网络,以得到最终的目标检对象检测模型,提高了训练方法的实用性和适应范围,以及目标对象检测模型的检测准确度。
12.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
13.附图用于更好地理解本方案,不构成对本公开的限定。其中:
14.图1是根据本公开的一个实施例可以应用于其中的示例性系统架构图;
15.图2是根据本公开的目标对象信息的处理方法的一个实施例的流程图;
16.图3是根据本实施例的目标对象信息的处理方法的应用场景的示意图;
17.图4是根据本公开的目标对象信息的处理方法的又一个实施例的流程图;
18.图5是根据本公开的目标对象的检测方法的一个实施例的流程图;
19.图6是根据本公开的目标对象信息的处理装置的一个实施例的结构图;
20.图7是根据本公开的目标对象的检测装置的一个实施例的结构图;
21.图8是适于用来实现本公开实施例的计算机系统的结构示意图。
具体实施方式
22.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
23.本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
24.图1示出了可以应用本公开的目标对象信息的处理方法及装置、目标对象的检测方法及装置的示例性架构100。
25.如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。终端设备101、102、103之间通信连接构成拓扑网络,网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
26.终端设备101、102、103可以是支持网络连接从而进行数据交互和数据处理的硬件设备或软件。当终端设备101、102、103为硬件时,其可以是支持网络连接,信息获取、交互、显示、处理等功能的各种电子设备,包括但不限于监控设备、智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
27.服务器105可以是提供各种服务的服务器,例如在训练样本不均衡的情形下,基于用户通过终端设备发起的训练操作,训练目标对象确定网络和目标对象分类网络,以得到目标对象检测模型的后台处理服务器。在得到训练后的目标对象检测模型后,服务器可以通过目标对象检测模型执行目标对象的检测任务。可选的,服务器可以向终端设备反馈检测结果。作为示例,服务器105可以是云端服务器。
28.需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务的软件或软件模块),也可以实现成单个软件或软件模块。在此不做具体限定。
29.还需要说明的是,本公开的实施例所提供的目标对象信息的处理方法、目标对象的检测方法可以由服务器执行,也可以由服务器和终端设备彼此配合执行。相应地,目标对象信息的处理装置、目标对象的检测装置包括的各个部分(例如各个单元)可以全部设置于服务器中,也可以分别设置于服务器和终端设备中。
30.应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。当目标对象信息的处理方法、目标对象的检测方法运行于其上的电子设备不需要与其他电子设备进行数据传输时,该系统架构可以仅包括目标对象信息的处理方法、目标对象的检测方法运行于其上的电子设备(例如服务器或终端设备)。
31.请参考图2,图2为本公开实施例提供的一种目标对象信息的处理方法的流程图,流程200包括以下步骤:
32.步骤201,获取训练集。
33.本实施例中,目标对象信息的处理方法的执行主体(例如,图1中的终端设备或服务器)可以通过有线网络连接方式或无线网络连接方式从远程,或从本地获取训练集。
34.训练集中包括数量不均衡的、对应于不同类型的目标对象的多个训练子集,每个训练子集中包括的训练样本包括样本图像和样本图像中的目标对象的位置标签、类型标签。位置标签用于表征目标对象在样本图像中所处的位置、区域等信息,例如,可以通过目标对象在样本图像中的最小矩形框作为目标对象的位置标签;类型标签用于表征目标对象所属的类型信息,类型标签可以通过数字、文本、字符等形式表征,不同的类型目标独享设置不同的类型标签。
35.多个训练子集所一一对应的多种类型的目标对象可以是同一大类中类型相近、存在较大相关性的各子类的目标对象,例如,各训练子集对应的目标对象为同属于电子产品这一大类下的手机、电脑、数码相机、智能音箱等各子类的目标对象;也可以是相互独立、相关性较小的各类型的目标对象,例如,各训练子集中的目标对象为电子产品、生鲜类、衣物
类等类型的目标对象。
36.样本不均衡用于表征不同的训练子集中的训练样本的数量差距较大。例如,一般将样本数量比例超过4:1的训练样本称为不平衡样本。
37.步骤202,通过训练集中的训练样本中的样本图像和位置标签,训练得到目标对象确定网络。
38.本实施例中,上述执行主体通过训练集中的训练样本中的样本图像和位置标签,训练得到目标对象确定网络。其中,目标对象确定网络用于确定所输入的图像中的目标对象的位置信息。
39.作为示例,上述执行主体将多个训练子集对应的目标对象视为同一类目标对象,以先通过目标对象确定网络确定样本图像中是否存在目标对象;当确定样本图像中存在目标对象时,确定目标对象在图像的位置信息。
40.具体的,首先,上述执行主体从训练集中选取未经过训练的训练样本,将该训练样本中的样本图像输入初始确定网络,将该训练样本中的位置标签作为初始确定网络的期望输出,通过迭代训练过程,得到最终的目标对象确定网络。例如,上述执行主体可以确定初始确定模型的实际输出和期望输出之间的确定损失,进行根据确定损失计算梯度,并根据梯度,采用梯度下降算法调整初始确定网络的网络参数,并将每次调整参数后得到的模型作为下次训练的初始确定网络,并在满足预设的训练结束条件的情况下,结束训练,从而训练得到目标对象确定模型。
41.其中,训练结束条件例如可以是训练时间超过预设时间阈值、训练次数超过预设次数阈值、训练损失趋于收敛或低于预设损失阈值等。
42.初始确定网络可以是具有目标对象确定功能的任意分类网络,例如,r

cnn(region convolutional neural networks,区域卷积神经网络)、fast r

cnn(fast region convolutional neural networks,快速区域卷积神经网络)、ssd(single shot multibox detector,单次多盒检测器)、yolo(you only live once,你只需看一次)等。
43.步骤203,基于多个训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络。
44.本实施例中,上述执行主体可以基于多个训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络。其中,目标对象分类网络用于确定所输入的图像中的目标对象所属的类型。
45.作为示例,上述执行主体可以通过多个训练子集中的所有训练样本中的样本图像和类型标签对初始分类网络进行训练。具体的,首先,上述执行主体从多个训练子集中选取未经过训练的训练样本,将该训练样本中的样本图像输入初始分类网络,将该训练样本中的类型标签作为初始分类网络的期望输出,通过迭代训练过程,得到最终的目标对象分类网络。例如,上述执行主体可以确定初始分类模型的实际输出和期望输出之间的分类损失,进行根据分类损失计算梯度,并根据梯度,采用梯度下降算法调整初始分类网络的网络参数,并将每次调整参数后得到的模型作为下次训练的初始分类网络,并在满足预设的训练结束条件的情况下,结束训练,从而训练得到目标对象确定模型。
46.需要说明的,目标对象的分类任务具有简单、所需训练样本的数据量少的特点。作为又一示例,上述执行主体可以从各训练子集中抽取相同数量的训练样本,然后通过所抽
取的训练样本训练初始分类网络,得到目标对象分类网络。
47.初始分类网络可以是具有目标对象分类功能的任意分类网络,例如,决策树、支持向量机、朴素贝叶斯、随机森林等网络模型。
48.步骤204,结合目标对象确定网络和目标对象分类网络,得到目标对象检测模型。
49.本实施例中,上述执行主体可以结合目标对象确定网络和目标对象分类网络,得到目标对象检测模型。
50.具体的,基于目标对象确定网络在前、目标对象分类网络的顺序组合目标对象确定网络和目标对象分类网络,得到目标对象检测模型。通过目标对象检测模型中的目标对象确定网络确定所输入的图像中的目标对象的位置信息,通过目标对象分类网络确定位置信息所指示的图像区域中的目标对象所属的类型,从而完成对所输入的图像的目标检测任务。
51.其中,目标对象检测模型可以是应用于各领域中。例如,在人脸检测领域,目标对象检测模型用于人脸识别、人脸鉴伪等任务;在智能交通领域,目标对象检测模型用于障碍物检测、交通标志识别等任务。
52.继续参见图3,图3是根据本实施例的目标对象信息的处理方法的应用场景的一个示意图300。在图3的应用场景中,首先,服务器从数据库获取训练集301。其中,训练集301中包括数量不均衡的、对应于不同类型的目标对象的多个训练子集3011、3012、3013、3014,每个训练子集中包括的训练样本包括样本图像和样本图像中的目标对象的位置标签、类型标签。然后,通过训练集301中的训练样本中的样本图像和位置标签,训练得到目标对象确定网络302。然后,基于多个训练子集3011、3012、3013、3014中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络303;结合目标对象确定网络302和目标对象分类网络303,得到目标对象检测模型304。
53.本实施例中,在训练样本不均衡的情况下,将目标对象检测模型划分为确定网络和分类网络,先将各训练子集中所有类型的目标对象视作同一个大类,通过目标对象的位置标签训练目标对象确定网络;然后,利用目标对象分类网络对应的图像分类任务简单,所需训练样本的数据量少的特点,基于各训练子集中的样本图像的类型标签训练目标对象分类网络,以得到最终的目标检对象检测模型,提高了训练方法的实用性和适应范围,以及目标对象检测模型的检测准确度。
54.在本实施例的一些可选的实现方式中,上述执行主体可以通过如下方式执行上述步骤203:
55.第一,基于多个训练子集,采用预设方式得到数量均衡的多个更新训练子集。
56.预设方式可以是促使各训练子集均衡的任意方式,包括但不限于是基于图像旋转、移动、加入噪声进行数据扩展,基于对数据量较少的训练子集的重采样,代价敏感方法等方式。其中,代价敏感方法用于增加小样本错分的惩罚代价,并将此代价直接体现在模型训练的目标函数里。如此,可以通过优化目标函数调整模型在小样本上的注意力。
57.第二,通过多个更新训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络。
58.具体的,上述执行主体可以采用机器学习方法,以多个更新训练子集中的训练样本中的样本图像为输入,以所输入的样本图像的类型标签为期望输出,训练得到目标对象
分类网络。
59.本实现方式中,通过数量均衡的多个更新训练子集训练得到目标对象分类模型,提高了目标对象分类模型的分类准确度。
60.在本实施例的一些可选的实现方式中,上述执行主体可以通过如下方式执行上述第一步骤:
61.以多个训练子集中所包括的训练样本的数量最少的目标训练子集为基准,对目标训练子集之外的训练子集进行采样,得到多个更新训练子集。
62.具体的,对于目标训练子集外的每个训练子集,从中采样与目标训练子集的训练样本的数量相近或相同的数量的训练样本,得到多个更新训练子集。
63.例如,我们要对工地场景中工人是否佩戴安全帽,以及所佩戴安全帽的具体颜色进行识别。根据工地人员职责的不同,安全帽的颜色通常有黄色、红色、蓝色、白色等几种。一般情况下,黄色安全帽是普通工人佩戴,数量最多。白色安全帽是管理人员佩戴,数量最少。假设我们的训练集一共包含5000张样本图像,其中,包括黄色安全帽的样本图像有4000张,包括白色安全帽的样本图像有100张,包括蓝色安全帽、红色安全帽的样本图像各有450张。此时,依次对应于黄色、红色、蓝色、白色的安全帽的训练子集的样本不均衡。
64.首先,上述执行主体不考虑安全帽的颜色区别,将所有的5000张样本图像中的安全帽视为一个类别,训练可确定安全帽在图像中的位置信息的安全帽确定网络。然后,从对应于各颜色的安全帽的训练子集中各选取100张样本图像,通过选取的样本图像训练可分类安全帽的颜色的安全帽分类模型,最终结合安全帽确定网络和安全帽分类网络得到安全帽检测模型,可检测所输入的图像中的安全帽的位置和颜色。
65.本实现方式中,利用分类网络训练简单、所需训练样本的数量少的特点,提供了一种简单有效的样本均衡方法,可以快速便捷地得到均衡样本。
66.在本实施例的一些可选的实现方式中,上述执行主体可以通过如下方式执行上述步骤202:
67.利用机器学习方法,以训练集中的训练样本中的样本图像为输入,以所输入的样本图像对应的位置标签为期望输出,训练得到网络结构不同的多个目标对象确定网络。
68.上述执行主体还可以利用机器学习方法,以多个更新训练子集中的训练样本中的样本图像为输入,以所输入的样本图像对应的类型标签为期望输出,训练得到网络结构不同的多个目标对象分类网络。
69.网络结构不同的网络模型可以是基于同一基础网络改进得到的不同网络结构的同类型网络模型,也可以是不同类型的网络模型。通过训练得到网络结构不同的多个目标对象确定网络、网络结构不同的多个目标对象分类网络,提高了确定网络和分类网络的可选择性,有助于得到效果更好的网络模型。
70.在本实施例的一些可选的实现方式中,上述执行主体可以通过如下方式执行上述步骤204:
71.首先,从多个目标对象确定网络中确定出目标确定网络。
72.然后,从多个目标对象分类网络中确定出目标分类网络。
73.最后,结合目标确定网络和目标分类网络,得到目标对象检测模型。
74.作为示例,上述执行主体可以将多个目标对象确定网络中准确度最高的确定网络
作为目标确定网络,将多个目标对象分类网络中准确度最高的分类网络作为目标分类网络,从而结合目标确定网络和目标分类网络,得到目标对象检测模型。如此,提高了所得到的目标对象检测网络的检测准确度。
75.继续参考图4,示出了根据本公开的方法的一个目标对象信息的处理方法实施例的示意性流程400。其中,流程400包括以下步骤:
76.步骤401,获取训练集。
77.其中,训练集中包括数量不均衡的、对应于不同类型的目标对象的多个训练子集,每个训练子集中包括的训练样本包括样本图像和样本图像中的目标对象的位置标签、类型标签。
78.步骤402,通过训练集中的训练样本中的样本图像和位置标签,训练得到目标对象确定网络。
79.步骤403,以多个训练子集中所包括的训练样本的数量最少的目标训练子集为基准,对目标训练子集之外的训练子集进行采样,得到多个更新训练子集。
80.步骤404,通过多个更新训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络。
81.步骤405,结合目标对象确定网络和目标对象分类网络,得到目标对象检测模型。
82.从本实施例中可以看出,与图2对应的实施例相比,本实施例中的目标对象信息的处理方法的流程400具体说明了目标对象确定网络和目标对象分类网络的训练过程,利用目标对象分类网络对应的图像分类任务简单,所需训练样本的数据量少的特点,基于简单有效的样本均衡方式,进一步提高了目标对象检测模型的检测准确度。
83.继续参考图5,图5为本公开实施例提供的一种目标对象的检测方法的流程图,流程500包括以下步骤:
84.步骤501,获取待检测图像。
85.本实施例中,目标对象的检测方法的执行主体(例如,图1中的服务器或终端设备)可以通过有线网络连接方式或无线网络连接方式从远程,或从本地获取待检测图像。
86.待检测图像可以是包括目标对象的图像。例如,待检测图像为包括人脸的图像。
87.步骤502,通过目标对象检测模型得到待检测图像中的目标对象的检测结果。
88.本实施例中,上述执行主体可以通过目标对象检测模型得到待检测图像中的目标对象的检测结果。其中,目标对象检测模型通过实施例200、400得到。
89.具体的,上述执行主体可以通过目标对象检测模型中的目标对象确定网络确定待检测图像中的目标对象的位置信息,通过目标对象检测模型中的目标对象分类网络确定待检测图像中的目标对象的类型信息,得到由位置信息和类型信息组成的检测结果。
90.本实施例中,基于目标对象检测模型以得到准确的检测结果。
91.继续参考图6,作为对上述各图所示方法的实现,本公开提供了一种目标对象信息的处理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
92.如图6所示,目标对象信息的处理装置,包括:第一获取单元601,被配置成获取训练集,其中,训练集中包括数量不均衡的、对应于不同类型的目标对象的多个训练子集,每个训练子集中包括的训练样本包括样本图像和样本图像中的目标对象的位置标签、类型标
签;第一训练单元602,被配置成通过训练集中的训练样本中的样本图像和位置标签,训练得到目标对象确定网络;第二训练单元603,被配置成基于多个训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络;得到单元604,被配置成结合目标对象确定网络和目标对象分类网络,得到目标对象检测模型。
93.在本实施例的一些可选的实现方式中,第二训练单元603,进一步被配置成:基于多个训练子集,采用预设方式得到数量均衡的多个更新训练子集;通过多个更新训练子集中的训练样本中的样本图像和类型标签,训练得到目标对象分类网络。
94.在本实施例的一些可选的实现方式中,第二训练单元603,进一步被配置成:以多个训练子集中所包括的训练样本的数量最少的目标训练子集为基准,对目标训练子集之外的训练子集进行采样,得到多个更新训练子集。
95.在本实施例的一些可选的实现方式中,第二训练单元603,进一步被配置成:利用机器学习方法,以多个更新训练子集中的训练样本中的样本图像为输入,以所输入的样本图像对应的类型标签为期望输出,训练得到网络结构不同的多个目标对象分类网络;以及第一训练单元602,进一步被配置成:利用机器学习方法,以训练集中的训练样本中的样本图像为输入,以所输入的样本图像对应的位置标签为期望输出,训练得到网络结构不同的多个目标对象确定网络。
96.在本实施例的一些可选的实现方式中,得到单元604,进一步被配置成:从多个目标对象确定网络中确定出目标确定网络;从多个目标对象分类网络中确定出目标分类网络;结合目标确定网络和目标分类网络,得到目标对象检测模型。
97.本实施例中,在训练样本不均衡的情况下,将目标对象检测模型划分为确定网络和分类网络,先将所有类型的目标对象视作同一个大类,通过目标对象的位置标签训练目标对象确定网络;然后,利用目标对象分类网络对应的图像分类任务简单,所需训练样本的数据量少的特点,基于各训练子集中的样本图像的类型标签训练目标对象分类网络,以得到最终的目标检对象检测模型,提高了训练装置的实用性和适应范围,以及目标对象检测模型的检测准确度。
98.继续参考图7,作为对上述各图所示方法的实现,本公开提供了一种目标对象的检测装置的一个实施例,该装置实施例与图5所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
99.如图7所示,目标对象的检测装置,包括:第二获取单元701,被配置成获取待检测图像;检测单元702,被配置成通过目标对象检测模型得到待检测图像中的目标对象的检测结果,其中,目标对象检测模型通过实施例600得到。
100.根据本公开的实施例,本公开还提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现上述任意实施例所描述的目标对象信息的处理方法、目标对象的检测方法。
101.根据本公开的实施例,本公开还提供了一种可读存储介质,该可读存储介质存储有计算机指令,该计算机指令用于使计算机执行时能够实现上述任意实施例所描述的目标对象信息的处理方法、目标对象的检测方法。
102.本公开实施例提供了一种计算机程序产品,该计算机程序在被处理器执行时能够
实现上述任意实施例所描述的目标对象信息的处理方法、目标对象的检测方法。
103.图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
104.如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(ram)803中的计算机程序,来执行各种适当的动作和处理。在ram 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
105.设备800中的多个部件连接至i/o接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
106.计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如目标对象信息的处理方法、目标对象的检测方法。例如,在一些实施例中,目标对象信息的处理方法、目标对象的检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到ram 803并由计算单元801执行时,可以执行上文描述的目标对象信息的处理方法、目标对象的检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行目标对象信息的处理方法、目标对象的检测方法。
107.本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
108.用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件
包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
109.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd

rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
110.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
111.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
112.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决传统物理主机与虚拟专用服务器(vps,virtual private server)服务中存在的管理难度大,业务扩展性弱的缺陷;也可以为分布式系统的服务器,或者是结合了区块链的服务器。
113.根据本公开实施例的技术方案,在训练样本不均衡的情况下,将目标对象检测模型划分为确定网络和分类网络,先将各训练子集中所有类型的目标对象视作同一个大类,通过目标对象的位置标签训练目标对象确定网络;然后,利用目标对象分类网络对应的图像分类任务简单,所需训练样本的数据量少的特点,基于各训练子集中的样本图像的类型标签训练目标对象分类网络,以得到最终的目标检对象检测模型,提高了训练方法的实用性和适应范围,以及目标对象检测模型的检测准确度。
114.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开提供的技术方案所期望的结果,本文在此不进行限制。
115.上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开
的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1