一种快速数据关联方法与流程

文档序号:33537691发布日期:2023-03-22 08:47阅读:29来源:国知局
一种快速数据关联方法与流程

1.本发明属于数据处理领域,尤其是涉及一种快速数据关联方法。


背景技术:

2.数据关联是数据科学的常规问题。比如,在无人驾驶领域目标的检测跟踪中,数据关联是非常重要的环节。它将某一个信息集合,比如,检测到的物体和另一个信息集合,比如,先验目标进行关联,从而确定一个先验目标对应的检测信息是哪个,类似的逻辑在大数据等其他领域也有应用。
3.信息集合s1和信息集合s2匹配时,关联矩阵的元素数量为n1
×
n2,也就是要计算n1
×
n2次距离,其中n1,n2分别是s1,s2的元素数量。这存在以下问题:很多s1和s2的元素之间是没有关联的,一般会认为其距离是无穷大,这部分计算是冗余的,应该被避免的,尤其在集合s1,s2存在大量元素而在其元素取值分布稀疏的场景下,直接计算关联矩阵会有非常显著的算力浪费。


技术实现要素:

4.有鉴于此,本发明旨在提出一种快速数据关联方法,考虑到背景技术中存在的稀疏性特征,进行关联矩阵的构建加速,并对关联矩阵进行了拆分,将一个关联问题转化成多个独立的关联问题,这对后续的计算也有加速作用,后续的计算包括进一步拆分关联矩阵和匈牙利算法等数据关联算法。
5.为达到上述目的,本发明的技术方案是这样实现的:一种快速数据关联方法,具体包括以下步骤:a1、关联信息集合s1和s2的数据点分布在2d数据空间中,对数据空间用交错的第一层栅格l1和第二层栅格l2划分,利用第一层栅格l1确定关联单位;a2、基于第二层栅格l2扩大第一层l1的关联单位;a3、对步骤a2中扩大后的每一个关联单位建立关联矩阵,基于每一个关联矩阵独立进行数据关联计算。
6.进一步的,在步骤a1中,第一层栅格l1和第二层栅格l2的长宽值为设置的数据关联阈值,其含义是如果集合s1数据点和集合s2数据点超过这个阈值,则这两个数据点之间不存在数据关联关系。
7.进一步的,在步骤a1中,具体为:第一层栅格l1和第二层栅格l2交错半个格子大小,也就是一半的数据关联阈值设置在数据空间中。
8.如果栅格的一个格子具有信息集合s1或s2的数据点,则设定这个的栅格格子为“激活”状态,否则设定为“不激活”状态;将第一层栅格l1中的每一个处于“激活”状态的格子都设置为一个关联单位。
9.进一步的,在步骤a2中,具体为:
针对第二层栅格l2的一个激活格子,将激活格子的四角覆盖的四个第一层栅格l1的激活格子合并为一个关联单位。
10.进一步,对l1交错的激活格子,进一步合并成一个关联单位。
11.进一步的,在步骤a3中,具体为:对每一个经过步骤a2合并后的关联单位,取出合并后的关联单位所包围的信息集合s1,s2的信息点建立关联矩阵,矩阵元素基于欧式距离计算,对每一个关联矩阵用数据关联算法进行计算;数据关联算法包括匈牙利算法。
12.进一步的,本方案公开了一种电子设备,包括处理器以及与处理器通信连接,且用于存储所述处理器可执行指令的存储器,所述处理器用于执行一种快速数据关联方法。
13.进一步的,本方案公开了一种服务器,包括至少一个处理器,以及与所述处理器通信连接的存储器,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述处理器执行,以使所述至少一个处理器执行一种快速数据关联方法。
14.进一步的,本方案公开了一种计算机可读取存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现一种快速数据关联方法。
15.相对于现有技术,本发明所述的一种快速数据关联方法具有以下有益效果:本发明所述的一种快速数据关联方法,回避了关联矩阵计算过程种的无效冗余计算,加速了关联矩阵的构建过程,并且将关联矩阵拆分成多个关联矩阵,减少了后续数据关联计算的输入数据规模,对后续的关联计算也有加速作用,本方案在大量数据而数据点分布稀疏场景下明显。
附图说明
16.构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:图1为本发明实施例所述的一种快速数据关联方法示意图。
具体实施方式
17.需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。
18.下面将参考附图并结合实施例来详细说明本发明。
19.本方案针对现有技术中存在的技术问题,尤其考虑到现有技术在信息分布在其值域稀疏的场景下计算冗余的问题,进行关联矩阵的构建加速,并对关联矩阵进行了拆分,将一个关联问题转化成多个独立的关联问题,这对后续的计算也有加速作用,后续的计算包括进一步拆分关联矩阵和匈牙利算法等数据关联算法。
20.关联信息集合s1,s2的数据点分布在2d空间,本方案将这个2d数据空间栅格化,并且构造了两层栅格:第一层栅格的作用是划分最小的关联范围,其方法是将栅格大小设定成关联阈值,其中,栅格长宽相等,长或宽的值为栅格大小。这样,每一个格子内的s1,s2集合信息点自然形成关联关系,但是其缺点是,它没有考虑s1,s2的信息点不在同一格子,而在相邻格
子的情况。因此,构造第二层栅格,它和第一层栅格错开半个格子,使得这些点落在第二层栅格的格子内。基于信息集合s1和s2的信息构建关联单位并计算对应的关联矩阵,关联单位之间是互相独立的关联问题。对每一个关联矩阵应用数据关联算法,比如匈牙利算法等。
21.结合附图1具体阐述本方案,具体包括以下步骤:步骤一,将数据空间用交错的两个栅格l1,l2划分,栅格的大小为数据关联阈值,用第一层栅格l1确定关联单位;步骤二,基于第二层栅格l2扩大第一层l1的关联单位;步骤三,对每一个关联单位建立关联矩阵,独立进行数据关联计算。
22.在步骤一中,将数据空间用交错的两个栅格l1,l2划分,具体为:关联信息集合s1,s2的数据点分布在2d空间,其中s1,s2检测点分别用白色,灰色点标示。将2d数据空间通过两层栅格l1,l2栅格化,图1中l1是实线栅格,l2是虚线栅格。每一个格子大小都是数据关联阈值,即,如果超过这个大小,数据点之间不存在关联关系。栅格l1,l2交错半个格子大小,图1中可见l1格子和坐标原点o重合,l2和其错开半个格子。如果一个格子内有s1或者s2的数据点,那么,设其状态为“激活”,否则设为“不激活”。栅格l1每一个激活格子都设置为一个关联单位。可见,可能关联的s1,s2元素要么落在l1的格子中,要么落在l2的格子中;在步骤二中,基于栅格l2扩大栅格l1的关联单位,具体为,对l2的一个激活格子,将它四角覆盖的四个l1的激活格子合并为一个关联单位。注意,l1的合并后的关联单位可能相连,那么,将这些相连的关联单位进一步合并,在图1中,灰色区域标示出了两个l2激活格子,两个粗黑线框标示了它们覆盖的l1格子,两个粗黑线部分的交错部分是一个格子,所以他们整体设置为一个关联单位,另外,图1中右侧和下侧还有两个关联单位,他们只有一个格子;在步骤三中,对每一个关联单位,取出它包围的信息集合s1,s2的信息点建立关联矩阵,矩阵元素基于欧式距离计算。对每一个关联矩阵用匈牙利算法等数据关联算法进行计算,获得数据关联结果。当然,进行数据关联计算之前,可以进一步通过其他方法拆分关联矩阵。对应图1,s1数据点的数量是9个,s2数据点的数量是9个。传统的匈牙利算法会建立9
×
9的关联矩阵,对应需要计算81个欧式距离。可见,其中有很多冗余计算,因为,很多s1,s2元素之间的距离超过步骤一所述的“数据关联阈值”,其值一般认为是“无穷大”,也就是没有关联关系,这部分计算是冗余的。但是,根据本专利提出的方法,得到3个关联矩阵,其大小分别是7
×
6=42;1
×
1=1;1
×
2=1;总共需要计算42+1+2=45个欧式距离。并且,得到了3个独立的关联矩阵,减少了后续数据关联计算的输入数据规模。
23.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
24.在本技术所提供的几个实施例中,应该理解到,所揭露的方法和系统,可以通过其它的方式实现。例如,以上所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征
可以忽略,或不执行。上述单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。
25.最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。
26.以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1