目标搜索方法、装置、设备以及存储介质与流程

文档序号:33639397发布日期:2023-03-29 01:38阅读:34来源:国知局
目标搜索方法、装置、设备以及存储介质与流程

1.本公开涉及计算机技术领域,尤其涉无人机、目标搜索以及协同通信技术领域。


背景技术:

2.在多无人机协同进行目标搜索的场景中,可以使用的搜索方法有多种。例如,采用多群体蚁群协同算法进行多无人机的目标搜索。同一群体蚂蚁具有相互引导的作用,不同群体蚂蚁具有相互排斥的作用,选择每代中的最佳路径进行信息素更新,促进算法向较优的路径靠拢。再如,采用栅格法对搜索区域进行划分编号,建立环境地图模型;然后采用多粒子群算法对多无人机进行协同路径优化设计,通过机间通信来实现高动态环境的更新;最后通过信息交互实现任务分配。但是,这些算法主要应用于目标先验信息完全未知的场景,搜索效率较低。


技术实现要素:

3.本公开提供了一种目标搜索方法、装置、设备以及存储介质。
4.根据本公开的一方面,提供了一种目标搜索方法,包括:
5.根据智能体在搜索区域中所经过的网格的目标搜索结果,更新该智能体所经过的网格的特征值,其中,该网格的特征值与目标在该网格出现的概率相关;
6.根据该搜索区域中的该网格的特征值,预测该智能体在该搜索区域中搜索该目标所需的运动信息。
7.根据本公开的另一方面,提供了一种目标搜索装置,包括:
8.更新模块,用于根据智能体在搜索区域中所经过的网格的目标搜索结果,更新该智能体所经过的网格的特征值,其中,该网格的特征值与目标在该网格出现的概率相关;
9.预测模块,用于根据该搜索区域中的该网格的特征值,预测该智能体在该搜索区域中搜索该目标所需的运动信息。
10.根据本公开的另一方面,提供了一种电子设备,包括:
11.至少一个处理器;以及
12.与该至少一个处理器通信连接的存储器;其中,
13.该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。
14.根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。
15.根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。
16.采用本公开实施例,可以根据智能体在搜索区域中的搜索结果对网格的特征值进行更新,从而有利于提高智能体进行目标搜索的效率。
17.应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特
征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
18.附图用于更好地理解本方案,不构成对本公开的限定。其中:
19.图1是根据本公开一实施例的目标搜索方法的流程示意图;
20.图2是根据本公开另一实施例的目标搜索方法的流程示意图;
21.图3是根据本公开实施例中的网格划分一个示例的示意图;
22.图4是根据本公开实施例中的网格划分另一个示例的示意图;
23.图5是根据本公开实施例中的设定参考值的示意图;
24.图6是根据本公开另一实施例的目标搜索方法的流程示意图;
25.图7是根据本公开实施例中的幅宽占比的示意图;
26.图8是根据本公开实施例中的路径选择的示意图;
27.图9是根据本公开实施例中的转向方向选择的示意图;
28.图10是根据本公开另一实施例的目标搜索方法的流程示意图;
29.图11是根据本公开一实施例的目标搜索装置的结构示意图;
30.图12是根据本公开另一实施例的目标搜索装置的结构示意图;
31.图13是用来实现本公开实施例的电子设备的框图。
具体实施方式
32.以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
33.图1是根据本公开一实施例的目标搜索方法的流程示意图,该方法包括:
34.s101、根据智能体在搜索区域中所经过的网格的目标搜索结果,更新该智能体所经过的网格的特征值,其中,该网格的特征值与目标在该网格出现的概率相关;
35.s102、根据该搜索区域中的该网格的特征值,预测该智能体在该搜索区域中搜索该目标所需的运动信息。
36.在本公开实施例中,智能体可以包括无人机、卫星、摄像头、传感器、智能机器人等,对此不做限定。智能体的数量可以是单个,也可以是多个。在多个智能体协同的情况下,多个智能体可以构成智能体集群。搜索区域可以包括目标可能出现的区域。搜索区域可以将实际地理位置按照一定比例进行映射得到,也可以与地理位置无关例如在某个封闭空间内按照相对位置设置搜索区域。搜索区域中可以包括多个网格,网格的大小可以相同,也可以不同。搜索区域可以是二维的,也可以是三维的。相应地,搜索区域中网格可以是二维的,也可以是三维的。网格的特征值可以等于目标在该网格出现的概率,也可以是根据目标在该网格出现的概率计算的值。特征值也可以称为分值、参数值、比较值、可能值等,不限定具体名称。网格的特征值主要用于表示目标在该网格出现的可能性。
37.在本公开实施例中,目标为智能体可以识别的对象,目标的类型可以有多种,例如,人、动物或物体的图像和/或信号等。根据智能体类型、搜索场景等的不同可以灵活设置
具体的目标。例如,在搜救场景中,目标可能是等待救援的人或者动物的图像。在追踪场景中,目标可能是需要追踪的车辆、人或者动物等的图像和雷达信号。目标搜索结果可以包括目标存在、目标不存在、目标位置、目标所在网格、目标移动速度、目标移动方向、搜索幅宽占比、衰减系数等。智能体在搜索区域中经过某个网格,可以确定需要搜索的目标是否在该网格中,进而对特征值进行更新。例如,如果目标在该网格中,则提高该网格的特征值。如果目标不在该网格中,则降低该网格的特征值。
38.在本公开实施例中,智能体的运动信息可以包括智能体运动时所需要的各种参数,例如运动距离、运动速度、运动方向、运动路径、转向角度、运动时长或者转向间隔等。此外,可以在符合一定条件下执行s102。例如,在判定某个智能体需要改变当前的运动信息例如需要转弯的情况下,执行s102预测该智能体的运动信息。如果智能体不需要转弯,可以不执行s102。
39.采用本公开实施例,可以根据智能体在搜索区域中的搜索结果对网格的特征值进行更新,从而有利于提高智能体进行目标搜索的效率。
40.在一种实施方式中,搜索区域中可以存在一个智能体,也可以存在多个智能体。在该搜索区域中存在多个智能体的情况下,为该多个智能体共享该搜索区域中的网格的特征值。这种情况下,在s101中,可以根据多个智能体在搜索区域中所经过的网格的目标搜索结果,更新该多个智能体所经过的网格的特征值,其中,该网格的特征值与目标在该网格出现的概率相关。在102中,根据该搜索区域中的网格的特征值,预测一个或多个智能体在该搜索区域中搜索该目标所需的运动信息。即,如果搜索区域存在多个智能体,在s101中的智能体和在s102中的智能体可以不是同一个智能体。例如,可以根据第一智能体在搜索区域中所经过的网格的目标搜索结果,更新该第一智能体所经过的网格的特征值;然后根据该搜索区域中的一个或多个网格的特征值,预测第二智能体在该搜索区域中搜索该目标所需的运动信息。
41.本公开实施例的目标搜索方法可以通过某个智能体执行,也可以通过后台和/或中台的服务器执行。或者部分步骤通过某个智能体执行,部分步骤通过服务器执行。例如,在某个智能体中更新其所经过的网格的特征值,并将更新后的网格的特征值上传至服务器,由服务器预测一个或多个智能体后续的运动信息。再如,智能体将其所经过的网格的目标搜索结果上传至服务器,由服务器更新该智能体所经过的网格的特征值后预测一个或多个智能体后续的运动信息。再如,在某个智能体中更新其所经过的网格的特征值后,结合从服务器或其他智能体收到的共享信息例如其他网格的特征值,预测该智能体后续的运动信息。
42.以无人机集群为例,将一块给定的搜索区域划分为多个网格。当无人机完成对一个或多个网格的搜索后,可以将这一个或多个网格的搜索结果上传至集群网络的服务器。服务器对这一个或多个网格的特征值进行更新,可以利用更新后的网格的特征值对无人机集群中每个无人机的运动信息进行控制。例如,服务器可以实时为无人机集群中的每个无人机规划运动路线。再如,服务器在每个网格的特征值更新后,实时调整每个无人机的运动方向。再如,服务器在无人机运动时间达到设定好的运动时长或转向间隔时,使用当前共享的各个网格的特征值规划路线,或者调整运动方向。集群网络的服务器可以通过后台或中台对无人机进行控制。服务器可以对接收到的搜索结果、多个网格的特征值以及多个智能
体的运动信息进行统一处理,并发布指令。此外,也可以通过无人机集群中某个无人机例如主无人机内部的计算、处理和通信等模块替代上述服务器的功能。
43.采用本公开实施例,可以为多个智能体共享搜索区域的网格的特征值,提高了多智能体协同搜索的效率,提高了搜索的准确性。
44.图2是根据本公开另一实施例的目标搜索方法的流程示意图,该目标搜索方法可以包括上述目标搜索方法的一个或多个特征,在一种可能的实施方式中,该方法还包括:
45.s201、将该搜索区域划分为多个网格,其中,每个网格具有初始的参考值。
46.在本公开实施例中,如果搜索区域是二维的,网格可以为矩形、正方形等形状。如果搜索区域是三维的,网格可以为正方体、长方体等形状。网格的具体数量和大小可以根据实际情况灵活设定,且同一个搜索区域内,网格的大小可以是均匀的,也可以是不均匀的。同一搜索区域中的网格,可以通过编号来进行区分和标注,也可以通过网格的坐标来进行区分和标注。例如,二维的网格坐标为(x,y),三维的网格坐标为(x,y,z)。
47.例如,以搜索区域为海面为例,可以通过无人机集群在一片海面上搜索某个船只。如图3所示,如果搜索区域包括的海面为边长1000m的正方形,将该海面分成10*10的网格,采用均匀分割的方法,则每个网格为100m*100m的正方形。如图4所示,如果搜索区域包括的海面为长1000m,宽500m的长方形,将该海面分成10*10的网格,采用均匀分割的方法,则可以得到每个网格为长100m,宽50m的长方形。
48.在本公开实施例中,将搜索区域划分为多个网格后,可以为每个网格设定一个参考值,该参考值可以作为搜索过程中使用的网格的特征值的上限。该参考值可以根据概率分布函数或默认值确定。
49.在本公开实施例中,将面积较大、环境较复杂的搜索区域,划分为多个面积较小、环境相对简单的网格,能够以网格为粒度更准确地预测目标可能出现的位置,提高智能体在搜索区域进行目标搜索的效率和准确性。
50.在很多场景下可以使用一些方法推断目标的位置概率分布等先验信息。在此情况下使用传统方法假设目标位置分布概率未知,会使得区域内的所有位置的搜索重要性一样,因此,搜索效率较低。本公开实施例中,可以使用先验信息为网格赋值,利用先验信息便于尽快定位到目标,从而提高搜索效率。
51.在一种实施方式中,在该网格存在先验概率的情况下,根据该先验概率设置该网格的参考值。
52.在一种实施方式中,在该网格不存在先验概率的情况下,将该网格初始的参考值设置为默认值。
53.在本公开实施例中,网格的先验概率可以包括通过预先训练好的模型得到的目标分布概率、通过历史数据预测的分布概率等。一个网格的参考值可以理解为该网格的特征值的上限。例如,如果网格的特征值为分数(score),该网格的参考值可以理解为该网格分数的上限。在一些示例中,可以将网格的特征值设置为等于该网格的先验概率。也可以将网格的特征值设置为根据先验概率计算的其他值。
54.在本公开实施例中,预先根据先验概率为搜索区域中的每个网格赋予特征值的上限,可以合理利用网格的先验概率得到网格的特征值,有利于提高目标搜索的效率和准确性。
55.在一种实施方式中,该网格的参考值为经过归一化处理后的值。例如,该网格的参考值可以为将该网格的先验概率经过归一化处理后的值。一个网格的在t时刻的先验概率可以基于概率分布函数为f
t
(x,y)得到。f
t
(x,y)的具体公式不做限制,可以根据目标的特点例如速度、位置等进行构建。归一化处理的公式的示例如下:
[0056][0057]
该式中,(x,y)可以表示当前计算的网格的坐标,(x',y')表示参考值最大的网格的坐标;g
t
(x,y)可以表示归一化后的值,可以表示在搜索区域中在t时刻所有网格的参考值的最大值。
[0058]
随着时刻的变化,网格的特征值的上限也可能发生变化,例如网格在t1时刻的与在t1时刻的不同,相应地,计算得到的与与也可能不同。上述将先验概率归一化处理后的值作为网格的特征值的上限的方式仅是一种示例,而非限制,也可以采用其他方法计算网格的特征值的上限。例如,可以将上述的g
t
(x,y)乘10或者乘100等数值后作为网格的特征值的上限。
[0059]
在本公开实施例中,如果网格没有先验概率,不同网格的特征值的上限所设置的默认值可以相同,也可以不同,具体可以根据实际情况设置默认值。例如,假设搜索区域内越靠近边缘的位置,目标出现的概率越低,则可以将默认值设置为从边缘网格到中心网格按照一定梯度增大。再如,搜索区域内不同位置目标出现概率相同,则可以使默认值保持一致,例如,默认值可以为1、5、10、100等。默认值可以不随着时间变化,也可以按照一定时间规律变化,具体可以根据应用场景的需求进行选择。
[0060]
例如,如图5所示,将搜索区域划分为多个网格后,可以基于每个网格的坐标确定网格的特征值上限例如分数上限。如果网格(2,3)的先验概率为0.6、网格(5,5)的先验概率为0.8、网格(6,3)的先验概率为0.4。可以基于先验概率计算得到归一化值,将这些网格的特征值的上限设置为归一化值。例如,网格(2,3)的归一化值为0.6/0.8=0.75,网格(5,5)的归一化值为0.8/0.8=1,网格(6,3)的归一化值为0.4/0.8=0.5。其余网格先验概率未知,特征值的上限可以为默认值例如1。
[0061]
在本公开实施例中,预先根据先验概率归一化处理后的值为搜索区域中的每个网格赋予特征值的上限,可以利用先验信息灵活设置网格的特征值,有利于提高目标搜索的效率和准确性。当然,归一化处理仅是一种示例而非限制,也可以采用其他值作为网格的特征值的上限。例如,全部网格的特征值的上限均为固定值,但是搜索区域中所有网格的特征值的上限可以不完全相同。
[0062]
图6是根据本公开另一实施例的目标搜索方法的流程示意图,该目标搜索方法可以包括上述目标搜索方法的一个或多个特征,在一种实施方式中,s101根据智能体在搜索区域中所经过的网格的目标搜索结果,更新该智能体所经过的网格的特征值,包括:
[0063]
s601、根据该智能体所经过的网格的搜索幅宽占比和/或衰减参数,更新该智能体所经过的网格的特征值;
[0064]
其中,该智能体的搜索幅宽占比为该智能体的搜索幅宽所覆盖的网格的面积与该
网格的总面积的比值;该衰减参数根据该智能体是否在搜索幅宽所覆盖的网格内搜索到目标得到。
[0065]
在本公开实施例中,智能体的搜索幅宽可以包括智能体检测目标物体的信号或信息的范围。例如,对于具有摄像头的无人机,其搜索幅宽为其摄像头的视场范围;对于雷达,其搜索幅宽为雷达的覆盖范围。智能体的搜索幅宽可能覆盖完整的网格,也可能覆盖部分网格。参见图7,如果网格a在智能体的搜索幅宽内,则该网格a的搜索幅宽占比为1。如果网格b有一半在智能体的搜索幅宽内,则该网格b的搜索幅宽占比为0.5。如果网格c有四分之一在智能体的搜索幅宽内,则该网格c的搜索幅宽占比为0.25。图7仅为示例而非精确比例。
[0066]
在本公开实施例中,衰减参数可以根据目标搜索结果和/或时间间隔得到,但不仅限于上述方式,可以根据实际情况设定。例如,若智能体在当前网格的搜索结果为目标不存在,则可以通过衰减参数减小该网格的特征值。若智能体在当前网格的搜索结果为目标存在,则可以通过衰减参数增大该网格的特征值。
[0067]
在本公开实施例中,可以根据搜索幅宽占比和/或衰减系数对网格的特征值进行实时更新,能够为后续准确预测智能体的运动信息提供数据支持,从而有利于更快速准确的搜索到目标。
[0068]
在一种实施方式中,根据该智能体所经过的网格的搜索幅宽占比和/或衰减参数,更新该智能体所经过的网格的目标出现概率,包括以下至少之一:
[0069]
方式一:根据该网格的第一搜索幅宽占比与该网格的第一参考值,得到该网格在第一时刻的特征值。其中,该网格的第一搜索幅宽占比为该智能体在第一时刻在该网格的搜索幅宽占比,该网格的第一参考值为该网格在该第一时刻的参考值。
[0070]
在本公开实施例中,第一时刻可以是智能体开始进行目标搜索的初始时刻,也可以是智能体进行目标搜索一段时间后的某个时刻。
[0071]
本公开实施例中,可以预先设置网格的候选特征值的计算公式,示例如下:
[0072][0073]
例如,通过无人机集群在搜索区域例如一片海面上搜索某个船只。一个无人机开始按照初始的运动信息搜索某个目标,在开始搜索该目标的第一时刻,该海面的一个网格在第一时刻的第一参考值为0.8,第一搜索幅宽占比α为0.5,可以计算得到该网格在第一时刻的特征值为0.5
×
0.8=0.4。
[0074]
方式二:根据该网格的第一搜索幅宽占比、该网格的第二搜索幅宽占比、衰减系数、该网格的第一参考值以及该网格的第二参考值的至少之一,得到该网格的候选特征值;比较该候选特征值与该网格的第二参考值,得到该网格在该第二时刻的特征值。其中,该网格的第一搜索幅宽占比为该智能体在第一时刻在该网格的搜索幅宽占比,该网格的第一参考值为该网格在该第一时刻的参考值;该网格的第二搜索幅宽占比为该智能体在第二时刻在该网格的搜索幅宽占比,该网格的第二参考值为该网格在该第二时刻的参考值,该第二时刻是该第一时刻之后的时刻。
[0075]
在本公开实施例中,第二时刻可以是第一时刻的下一时刻,也可以是第一时刻经过一段时长之后的某个时刻,具体可以根据实际应用场景的需求进行设置。
[0076]
本公开实施例中,可以预先设置网格的候选特征值的计算公式,示例如下:
[0077][0078]
其中,α为网格的第一搜索幅宽占比,β为网格的第二搜索幅宽占比,ρ为衰减系数、为网格在第一时刻t1的第一参考值,为网格在第二时刻t2的第二参考值。
[0079]
例如,假设一个网格在第一时刻的第一参考值为0.4,在第二时刻的第二参考值0.6,基于一个无人机得到的该网格在第一时刻的搜索幅宽占比α为0.5,在第一时刻的搜索幅宽占比β为0.8。
[0080]
若无人机搜索结果为目标不存在,且衰减系数为0.2,则参见上述公式(3)可以计算0.5*0.4*0.2+0.8*0.6,得到网格的候选特征值为0.52。由于该网格的候选特征值小于该网格在第二时刻的第二参考值0.6,可以将该网格的特征值更新为该候选特征值。
[0081]
若无人机搜索结果为目标存在,且衰减系数为2,则参见上述公式(3)可以计算0.5*0.4*2+0.8*0.6,得到网格的候选特征值为0.88。由于该网格的候选特征值大于该网格在第二时刻的第二参考值0.6,可以将该网格的特征值更新为该网格的第二参考值。
[0082]
在本公开实施例中,可以基于智能体在网格的搜索幅宽占比和衰减系数等,合理地更新网格的特征值。例如,在智能体搜索结果为当前网格无目标的情况下,可以利用衰减系数减小当前网格的特征值;在当前网格有目标的情况下,可以利用衰减系数增加当前网格的特征值。
[0083]
在一种实施方式中,该方法还包括:在第一条件下,判定该智能体需要改变当前的运动信息;其中,该第一条件包括以下至少之一:
[0084]
该智能体的搜索幅宽超出搜索区域;
[0085]
该智能体进入敏感区域;
[0086]
该智能体收到碰撞预警;
[0087]
该智能体直行时长达上限。
[0088]
在本公开实施例中,如果需要改变该智能体当前的运动信息,可以改变该智能体的运动距离、运动速度、运动方向、运动路径、转向角度、运动时长或者转向间隔等。以改变智能体的运动方向例如转弯为例,当智能体符合第一条件时,可以预测智能体的转弯方向并控制该智能体转弯。
[0089]
例如,如果无人机的搜索幅宽超出了当前的目标海面区域,则判定为符合第一条件。再如,如果无人机的搜索幅宽未超出当前的目标海面区域,但无人机直行时长达到上限如1分钟,可以判定为符合第一条件。再如,如果无人机的搜索幅宽有一部分处于敏感区域后,判定为符合第一条件。再如,如果无人机探测到即将与礁石、山体、墙壁、船只或者其他无人机等发生碰撞,可以判定为符合第一条件。
[0090]
在本公开实施例中,可以由服务器检测智能体是否符合第一条件,也可以由智能体检测自身是否符合第一条件,还可以由智能体向服务器上报自身符合第一条件。例如,某个智能体s1来自收到服务器或其他智能体s2碰撞预警后,智能体s1可以将自身的碰撞预警发送至服务器,或者智能体s1可以自身判定符合第一条件后通知服务器。
[0091]
在本公开实施例中,可以避免智能体出现脱离搜索区域、进入敏感区域、与其他物体发生碰撞或者长时间不转向等情况,不仅能提高搜索效率,还能够提高整体搜索过程的
安全性。
[0092]
在一种实施方式中,s102根据该搜索区域中的该网格的特征值,预测该智能体在该搜索区域中搜索该目标所需的运动信息,包括以下之一:
[0093]
方式一:在该智能体需要改变当前的运动信息的情况下,根据设定距离和该智能体所在的当前网格获取多条路径的特征值。其中,一条路径的特征值包括从该智能体所在的当前网格经过该设定距离所覆盖的多个网格的特征值之和。根据该多条路径的特征值,从该多条路径中选择该智能体的运动路径。
[0094]
在公开实施例中,如果每个网格的特征值理解为该网格的分数,路径的特征值也可以理解为该路径的收益,该路径的收益可以等于该路径上所有网格的特征值例如分数之和。如果多个路径的特征值相等,可以随机选择一个路径作为该智能体的运动路径。
[0095]
例如,在检测到某个无人机需要转弯的情况下,可以根据设定距离l如10m、100m、1000m等,以及无人机当前在网格a,获取从a向周围延长l所覆盖的多个网格。这些网格可能组成多个路径l1、l2和l3,每个路径包括的网格的特征值的和可能不同。参见图8,路径l1包括网格b1、b2和b3,路径总特征值为1.5。路径l2包括网格c1、c2和c3,路径总特征值为2.5。路径l3包括网格d1、d2和d3,路径总特征值为2。因此,可以选取总特征值最大的路径l2作为该智能体后续运行的路径。
[0096]
在本公开实施例中,若无人机在某个路径上到搜索区域边界的距离不足给定距离,或者到搜索区域边界的运动时长不足给定的运动时长,计算路径时可以不考虑该路径。此外,除了比较路径的特征值总和的大小之外,也可以采用求网格的特征值的均值、方差等方式来选择路径,本公开实施例不做限定。
[0097]
方式二:在该智能体需要改变当前的运动信息的情况下,根据与该智能体所在的当前网格相邻的多个候选网格的特征值,从该多个候选网格中选择出至少一个网格以预测该智能体的运动方向。
[0098]
例如,无人机当前在网格a0,网格a0周围的相邻网格包括a1到a8,参见图9。如果网格a3的特征值最大,可以将网格a3作为将要转向的网格。
[0099]
在本公开实施例中,可以基于网格的特征值合理地为智能体规划后续运动的方向和/或路径,从而控制智能体更加准确地进行目标搜索,减少重复搜索,进而减少搜索时间,提高搜索效率。
[0100]
本公开实施例提供了一种目标搜索方法,可以包含搜索区域地图网格化策略、网格收益上限分配策略、网格分数(score)更新策略、转弯方向收益策略、转弯策略。如图10所示,该目标搜索方法具体可以包括:
[0101]
s1001、网格化策略:将搜索区域网格划分为一个个矩形网格,网格的长和宽的大小可以自由设定(例如可以设为无人机搜索半径的50%或以下)。
[0102]
s1002、网格分数上限分配策略:网格分数上限在目标信息已知和未知的情况下不一样。例如,对于无目标信息的目标搜索,由于目标出现在所有位置的概率一样,每个网格的分数(score)上限均为1。再如,对于有目标信息的目标搜索,通过一定手段知道目标出现在各处的概率分布这个先验信息后,可以假定在网格坐标(x,y)在t时刻的概率分布函数为ft
(x,y)。归一化之后,该网格(x,y)的score上限g
t
(x,y)为该公式中,g
t
(x,y)可以表示在t时刻归一化后的score上限,可以表示在搜索区域中在t时刻所有网格的概率分布的最大值。
[0103]
s1003、网格分数更新策略:每个网格有一个分数。例如,该分数取值在0~1之间。初始状态下,每个网格的取值为0,代表无人机的幅宽没有覆盖过当前网格。对于任意网格坐标(x,y),当无人机运动时,在t1时刻,无人机搜索幅宽覆盖网格的面积占比为α(在0~1之间),则该网格的分数更新为并且,随着时间的衰减,网格的分数可以按指数ρ衰减。当t2时刻无人机再次幅宽覆盖该网格的面积占比β时,该网格的分数更新为min可以向搜索区域的所有无人机或部分无人机共享各个网格的分数,通过网格分数的更新以及收益来自动达到协同的目的。
[0104]
s1004、转弯策略:转弯条件可以包含超出搜索区域、进入敏感区域、无人机碰撞预警、无人机直行时刻点间隔t等情况。当满足任意一种或多种情况时,可以控制无人机执行转弯操作,在可转弯的角度范围内通过转弯方向收益策略选择收益最大的方向进行转弯。若转弯条件不满足时,无人机可以继续直行。
[0105]
s1005、转弯方向收益策略:设定一个前进的距离l例如1000米或10000米等,以防止无人机频繁转弯。计算无人机在前进l距离时,幅宽所能覆盖的路径下所有网格的score总增益,作为当前方向的收益。可以控制无人机倾向于向收益更大的方向运动。
[0106]
本公开实施例的目标搜索方法是一种启发式的基于多智能体协同的目标搜索方法。通过网格化的分数更新以及收益计算来达到多智能体自动协同的目的。其中的网格分数上限分配策略可以在有目标先验信息时加以利用来提高搜索效率。
[0107]
图11是根据本公开一实施例的目标搜索装置的结构示意图,该装置包括:
[0108]
更新模块1101,用于根据智能体在搜索区域中所经过的网格的目标搜索结果,更新该智能体所经过的网格的特征值,其中,该网格的特征值与目标在该网格出现的概率相关;
[0109]
预测模块1102,用于根据该搜索区域中的该网格的特征值,预测该智能体在该搜索区域中搜索该目标所需的运动信息。
[0110]
图12是根据本公开另一实施例的目标搜索装置的结构示意图,该目标搜索方法可以包括上述目标搜索方法的一个或多个特征,在一种实施方式中,该装置还包括:划分模块1201,用于将该搜索区域划分为多个网格,其中,每个网格具有参考值,该参考值用于确定该网格的特征值。
[0111]
在一种实施方式中,如图12所示,该装置还包括参考值设置模块1202,用于以下至少之一:
[0112]
在该网格存在先验概率的情况下,根据该先验概率设置该网格的参考值;
[0113]
在该网格不存在先验概率的情况下,将该网格的参考值设置为默认值。
[0114]
在一种实施方式中,该网格的参考值为经过归一化处理后的值。
[0115]
在一种实施方式中,该更新模块1101还用于根据该智能体所经过的网格的搜索幅宽占比和/或衰减参数,更新该智能体所经过的网格的特征值。
[0116]
其中,该智能体的搜索幅宽占比为该智能体的搜索幅宽所覆盖的网格的面积与该网格的总面积的比值;该衰减参数根据该智能体是否在搜索幅宽所覆盖的网格内搜索到目标得到。
[0117]
在一种实施方式中,根据该智能体所经过的网格的搜索幅宽占比和/或衰减参数,更新该智能体所经过的网格的目标出现概率,还用于以下至少之一:
[0118]
根据该网格的第一搜索幅宽占比与该网格的第一参考值,得到该网格在第一时刻的特征值;其中,该网格的第一搜索幅宽占比为该智能体在第一时刻在该网格的搜索幅宽占比,该网格的第一参考值为该网格在该第一时刻的参考值;
[0119]
根据该网格的第一搜索幅宽占比、该网格的第二搜索幅宽占比、衰减系数、该网格的第一参考值以及该网格的第二参考值的至少之一,得到该网格的候选特征值;比较该候选特征值与该网格的第二参考值,得到该网格在该第二时刻的特征值;其中,该网格的第二搜索幅宽占比为该智能体在第二时刻在该网格的搜索幅宽占比,该网格的第二参考值为该网格在该第二时刻的参考值,该第二时刻是该第一时刻之后的时刻。
[0120]
在一种实施方式中,如图12所示,该装置还包括:判定模块1203,用于在第一条件下,判定该智能体需要改变当前的运动信息。其中,该第一条件包括以下至少之一:
[0121]
该智能体的搜索幅宽超出搜索区域;
[0122]
该智能体进入敏感区域;
[0123]
该智能体收到碰撞预警;
[0124]
该智能体直行时长达到上限。
[0125]
在一种实施方式中,如图12所示,该预测模块1102,还用于以下之一:
[0126]
在该智能体需要改变当前的运动信息的情况下,根据设定距离和该智能体所在的当前网格获取多条路径的特征值,其中,一条路径的特征值包括从该智能体所在的当前网格经过该设定距离所覆盖的多个网格的特征值之和;根据该多条路径的特征值,从该多条路径中选择该智能体的运动路径;
[0127]
在该智能体需要改变当前的运动信息的情况下,根据与该智能体所在的当前网格相邻的多个候选网格的特征值,从该多个候选网格中选择出至少一个网格以预测该智能体的运动方向。
[0128]
在一种实施方式中,如图12所示,该装置还包括:
[0129]
共享模块1204,用于在该搜索区域中存在多个智能体的情况下,为该多个智能体共享该搜索区域中的网格的特征值。
[0130]
本公开实施例的装置的各模块、子模块的具体功能和示例的描述,可以参见上述方法实施例中对应步骤的相关描述,在此不再赘述。
[0131]
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
[0132]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
[0133]
图13示出了可以用来实施本公开的实施例的示例电子设备1300的示意性框图。电
子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0134]
如图13所示,设备1300包括计算单元1301,其可以根据存储在只读存储器(rom)1302中的计算机程序或者从存储单元1308加载到随机访问存储器(ram)1303中的计算机程序,来执行各种适当的动作和处理。在ram 1303中,还可存储设备1300操作所需的各种程序和数据。计算单元1301、rom 1302以及ram 1303通过总线1304彼此相连。输入/输出(i/o)接口1305也连接至总线1304。
[0135]
设备1300中的多个部件连接至i/o接口1305,包括:输入单元1306,例如键盘、鼠标等;输出单元1307,例如各种类型的显示器、扬声器等;存储单元1308,例如磁盘、光盘等;以及通信单元1309,例如网卡、调制解调器、无线通信收发机等。通信单元1309允许设备1300通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0136]
计算单元1301可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1301的一些示例包括但不限于中央处理单元(cpu)、图形处理单元(gpu)、各种专用的人工智能(ai)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元1301执行上文所描述的各个方法和处理,例如目标搜索方法。例如,在一些实施例中,目标搜索方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1308。在一些实施例中,计算机程序的部分或者全部可以经由rom 1302和/或通信单元1309而被载入和/或安装到设备1300上。当计算机程序加载到ram 1303并由计算单元1301执行时,可以执行上文描述的目标搜索方法的一个或多个步骤。备选地,在其他实施例中,计算单元1301可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行目标搜索方法。
[0137]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、芯片上系统的系统(soc)、负载可编程逻辑设备(cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0138]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0139]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可
读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0140]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
[0141]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0142]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0143]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0144]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1