车载雷达测量数据的聚类方法、存储介质和电子装置与流程

文档序号：23132717发布日期：2020-12-01 13:06阅读：162来源：国知局

本发明涉及数据处理技术领域，尤其涉及一种车载雷达测量数据的聚类方法、存储介质和电子装置。

背景技术：

目前，车载毫米波雷达因其环境适应能力强、探测距离远、测量精度高且成本较低的优点，而被广泛应用于车辆智能驾驶系统中。作为系统中关键的环境传感器之一，车载毫米波雷达能够检测车辆行驶环境中的目标(障碍物)，工作原理大致是：雷达在有效测量范围内发射电磁波信号，被其发射路径上的障碍物阻挡后发生反射；通过捕捉反射的信号生成测量数据加以处理分析，系统可以确定障碍物的距离、速度和角度等信息。由此可见，测量数据处理分析算法的好坏对目标的正确识别起着至关重要的作用。

然而，在满足无人驾驶性能要求的车载毫米波雷达测量数据分析中，混有各种实物干扰、虚假目标以及镜像测量数据。其中，实物干扰测量数据如路牌广告、栏杆、路灯以及对应绿化带等干扰物体测量数据；虚假目标测量数据可能为因为复杂电磁环境产生的一些虚假数据；镜像测量数据包括各种复杂场景中其它物体与车辆、车辆与车辆之间的镜像数据。在处理这些数据之前，需要对其进行分类，使其真实目标的测量数据能够有效的与各种实物干扰、虚假目标以及镜像测量数据进行区分。

但是，现有的分类方法存在需要提前人工标注有多少个目标数量以及分类不准确或错误等问题，无法满足复杂场景下车载毫米波雷达测量数据分类的要求。

技术实现要素：

本发明提供车载雷达测量数据的聚类方法、存储介质和电子装置，以能够在目标数量未知的情况下自适应识别出测量数据中所包含的目标数量。

第一方面，本发明实施例提供一种车载雷达测量数据的聚类方法，该方法包括：

获取车载雷达的测量数据，作为待聚类的数据集；

计算数据集中每个测量数据的密度；

按照密度的大小，确定数据集中属于峰值点的测量数据；

根据峰值点，计算数据集的聚类信息，其中聚类信息中包括的聚类数量为车载雷达的测量数据中的目标数量。

第二方面，本发明实施例提供一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行上文所述的方法。

第三方面，本发明实施例提供一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行上文所述的方法。

本发明提供的技术方案，可以解决车载雷达测量数据中目标数据的自动提取和抗干扰问题，使后续算法处理数据更准确，可提高整个系统处理结果的精度以及提高系统抗干扰能力，且方法效率较高，成本较低，可靠性高。

附图说明

图1为本发明实施例提供的一种车载雷达测量数据的聚类方法的流程图；

图2为本发明实施例提供的一种根据峰值点计算数据集的聚类信息的流程图；

图3为本发明实施例提供的具体示例中的车载雷达测量数据的聚类方法的流程图；

图4为本发明实施例提供的一种车载雷达测量数据的聚类装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚，下面将结合附图对本发明作进一步地详细描述，显然，所描述的实施例仅仅是本发明一部份实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。

为满足车载雷达测量数据分析中复杂场景测量数据分类需自适应及分类准确的要求，本发明实施例可以根据测量数据自身的特点，计算出测量数据包含的类数量即目标数量，基于这些类数量对测量数据进行精确分类，方法稳定可靠。

参见图1，本发明实施例提供了一种车载雷达测量数据的聚类方法，该方法包括如下步骤。

步骤101、获取车载雷达的测量数据，作为待聚类的数据集。

在本步骤中，车载雷达可以是车载毫米波雷达，其测得的每个测量数据可以是多维向量，每一维向量元素表示车载雷达在车辆行驶环境中测量得到的障碍物的一种物理参数值，比如1个测量数据为{v，r，θ}，其中v为车载雷达测量到的障碍物的速度、该障碍物距离当前车辆的距离r和角度θ。并且，获取到的作为待聚类的测量数据可以是车载雷达在同一时刻或者不同时刻得到的多个测量数据。

需要说明的是，若测量数据中各物理参数值的度量单位不同，则需要预先归一化测量数据，也即：按照测量数据中各物理参数值的精度，将各物理参数值归一化。归一化过程属于现有技术，在此不再赘述。

步骤102、计算数据集中每个测量数据的密度。

在本步骤中，测量数据的密度描述了本数据周围区域内数据的密集程度，具体可以采用该测量数据邻域范围内所包含的其它测量数据的个数来表示。示例性的，可以针对数据集中的每个测量数据：计算本测量数据与数据集中其它所有测量数据的欧式距离；计算与本测量数据的欧式距离小于预设的第一邻域阈值的测量数据的个数，将该个数作为本测量数据在预设的第一邻域范围内的密度。其中，本测量数据指的是当前所针对的测量数据；第一邻域阈值为本领域技术人员根据经验设定。

步骤103、按照密度的大小，确定数据集中属于峰值点的测量数据。

在本步骤中，具体可以针对数据集中的每个测量数据：判断在预设的第二邻域范围内是否存在高于自己密度的测量数据；如果是，确定本测量数据属于普通点，否则确定本测量数据属于峰值点。其中，预设的第二邻域范围可以是与所针对的测量数据的欧式距离小于第二邻域阈值的范围，第二邻域阈值为本领域技术人员根据经验设定。

步骤104、根据峰值点，计算数据集的聚类信息，其中聚类信息中包括的聚类数量为车载雷达的测量数据中的目标数量。

在本步骤中，可直接将每个峰值点作为一个聚类，峰值点个数为聚类个数，聚类中心为峰值点本身；将数据集中的普通点划分给对应的聚类。聚类信息包括聚类数量，当然还可进一步包括每个聚类的聚类中心。考虑到如果两个峰值点成为聚类中心的概率都很高且离得很近，那么该情况下的两个峰值点应为同一聚类，而不应划分为两个独立的聚类，为消除该情况，参见图2，作为一种优选的具体实施方式，步骤104具体包括：

子步骤1041、基于欧式距离，识别属于同一类的峰值点；

子步骤1042、将属于同一类的峰值点划分为一个聚类，取一个聚类内所有峰值点的平均值作为聚类中心；

子步骤1043、将数据集中除所有的属于同一类的峰值点之外的每个峰值点作为一个独立的聚类，聚类中心为作为独立的聚类的峰值点本身；

子步骤1044、计算得到的全部聚类的数量；

子步骤1045、将数据集中的普通点划分给对应的聚类。

其中，子步骤1041中基于欧式距离识别属于同一类的峰值点，包括：①提取确定得到的所有峰值点中满足如下条件的峰值点：峰值点是聚类中心的概率大于预设的概率阈值；②在提取得到的峰值点中，基于欧式距离识别属于同一类的峰值点。其中，概率阈值由本领域技术人员根据经验预先设定。

在上述①提取峰值点之前，采用如下方式计算各测量数据为聚类中心的概率ξ(xi)为：

其中，ξ(xi)为数据集中当前测量数据xi为聚类中心的概率，ρ(xi)为数据集中当前测量数据xi的密度值，ρ(xj)为数据集中其它测量数据xj的密度值，ε是预设的第二邻域阈值，d(xi,xj)为当前测量数据xi和其它测量数据xj的欧式距离，p[d(xi,xj)]为基于测量数据xi和xj的欧式距离的概率，欧式距离越大则概率越大。

在上述②识别同一类峰值点的过程中，可具体包括：在提取得到的峰值点中，将欧式距离小于预设的第三邻域阈值的峰值点确定为同一类，其中每个峰值点有且仅属于唯一一个类。具体实施时，可以在提取得到的峰值点中：计算各峰值点彼此间的欧式距离，将欧式距离小于预设的第三邻域阈值的两峰值点作为一个分组确定为同一类；判断不同分组内是否存在有任一相同的峰值点，如果是，则将该不同分组合并为一个分组，继续与其它分组进行合并判断，直至所有分组遍历完毕。最后，一个分组内的所有峰值点为同一类，不同分组的峰值点不同类，分组个数即为聚类个数。

下面举例而言，提取到的峰值点共有8个测量数据：x1、x2、x3、x4、x5、x6、x7和x8。其中，若假设欧式距离均小于预设的第三邻域阈值的共有：x1与x2的欧式距离、x1与x4的欧式距离、x2与x3的欧式距离、x5与x6的欧式距离，那么x1、x2、x3、x4阈值属于同一类(设为第一聚类)，x5与x6同一类(设为第二聚类)，x7和x8阈值属于分别为两个独立的聚类(设为第三聚类和第四聚类)，因此计算得到的全部聚类的数量为4。

子步骤1045中将数据集中的普通点划分给对应的聚类，包括：

针对每个普通点：计算普通点到每个聚类中心的欧式距离；

将普通点划分到与其欧式距离最小的聚类中心所对应的聚类。

进一步的，本发明实施例提供的方法中，在根据峰值点计算数据集的聚类信息之后，还包括：基于计算得到的聚类信息，采用基于目标函数的模糊聚类算法，对数据集中的测量数据进行分类。其中，模糊聚类算法可以是fcm聚类算法。进一步的，本发明实施例提供的方法中，在按照密度的大小，确定数据集中属于峰值点的测量数据之前，还包括：将数据集中在第一邻域范围内的密度低于预设的噪声阈值的测量数据滤除。其中，噪声阈值由本领域技术人员根据经验预先设定。

下面给出一优选实施例。参见图3，本实施例提供一种车载雷达测量数据的聚类方法，具体包括如下步骤。

步骤300、获取车载雷达的多个测量数据，作为待聚类的数据集。其中每个测量数据为三维向量{v，r，θ}，其中v为车载雷达测量到的障碍物的速度、该障碍物距离当前车辆的距离r和角度θ。

步骤301、根据测量的速度v、距离r和角度θ的精度，对每个测量数据的速度v、距离r和角度θ进行归一化。

步骤302、计算数据集中的每个测量数据在第一邻域范围内的密度，将数据集中在第一邻域范围内的密度低于预设的噪声阈值的测量数据滤除。

具体的测量数据滤除过程，包括：判断测量数据在第一邻域范围内的密度值是否大于预设的噪音阈值；如果是，则确定该测量数据有效；否则，则认为该测量数据无效，为噪音数据，滤除掉。

步骤303、在数据集中，针对每个测量数据：判断在第二邻域范围内是否存在高于自己密度的测量数据。如果是，执行步骤304，否则执行步骤305。

步骤304、确定测量数据为普通测量数据(也称普通点)，赋予其较低峰值概率。

步骤305、确定测量数据为峰值测量数据(也称峰值点)，赋予其较高的峰值概率。

其中，测量数据的峰值概率为测量数据成为聚类中心的概率，普通测量数据的峰值概率要小于峰值测量数据的峰值概率。具体的，在上述步骤303-305中，可先确定当前测量数据在第二邻域范围内的有效测量数据；进而，判断所确定的所有有效测量数据中是否有密度高于当前测量数据的；然后，根据判断结果和上面公式赋予当前测量数据为聚类中心的概率。

步骤306、基于欧式距离，识别峰值测量数据中属于同一类的测量数据。

在本步骤中，识别过程可具体包括：

从所有峰值测量数据中，提取峰值概率大于预设的概率阈值的测量数据；

计算提取的各测量数据两两之间的欧式距离；

将欧式距离小于预设的距离阈值的测量数据，判定为同一类；

合并判定结果，确定每个峰值点所属的类，其中每个峰值点有且仅属于唯一一个类。

步骤307、将属于同一类的测量数据确定为一个聚类，取一个聚类内的所有测量数据的平均值作为聚类中心。

步骤308、将数据集中除所有的属于同一类的测量数据之外的每个峰值测量数据作为一个独立的聚类，其本身即为聚类中心。

数据集中，除所有的属于同一类的测量数据之外，还剩有多少个峰值测量数据，就有多少个独立的聚类。

步骤309、计算得到的全部聚类的数量。

步骤310、将数据集中的普通测量数据划分给对应的聚类并进行标记。

步骤311、基于聚类结果和标记结果，采用fcm聚类方法对数据集中的测量数据做进一步精确分类。其中，聚类结果包括得到的每个聚类及其聚类中心。

本示例提供的方法能够在目标数量未知的情况下自适应识别测量数据中包含目标的数量并将其进行精确分类。车载雷达的测量数据包括了距离、速度和角度三个因素，这个三个因素的精度各有差异，为了区分这些测量中包含的目标数量以及属于相应目标的测量，通常需要性能可靠且可自适应不同复杂环境的聚类方法，本示例通过计算每个测量数据的密度，并对每个测量数据一定邻域内的是否含有高于自己密度测量的方法获得密度峰值数据，然后对密度峰值数据进行优化计算得到对应的聚类中心以及目标数量，最后将所有测量归类。通过实测数据验证，该示例方法目标数量判断准确、数据分类精确且计算效率较高。

相应的，本发明实施例还提供一种车载雷达测量数据的聚类装置，参见图4，所述装置包括：

数据获取单元401，用于获取车载雷达采集的测量数据，作为待聚类的数据集；

密度计算单元402，用于计算数据集中每个测量数据的密度；

峰值点确定单元403，用于按照密度的大小，确定数据集中属于峰值点的测量数据；

聚类计算单元404，用于根据峰值点，计算数据集的聚类信息，其中聚类信息包括的聚类数量为车载雷达的测量数据中的目标数量。

进一步的，所述密度计算单元402用于计算数据集中每个测量数据的密度，具体包括：

针对数据集中的每个测量数据：计算本测量数据与数据集中其它所有测量数据的欧式距离；计算与本测量数据的欧式距离小于预设的第一邻域阈值的测量数据的个数，将该个数作为本测量数据在预设的第一邻域范围内的密度。

进一步的，所述峰值点确定单元403用于按照密度的大小确定数据集中属于峰值点的测量数据，具体包括：

针对数据集中的每个测量数据：判断在预设的第二邻域范围内是否存在高于自己密度的测量数据；如果是，确定本测量数据属于普通点，否则确定本测量数据属于峰值点。

进一步的，所述聚类计算单元404用于根据峰值点计算数据集的聚类信息，具体包括：

基于欧式距离，识别属于同一类的峰值点；

将属于同一类的峰值点划分为一个聚类，取一个聚类内所有峰值点的平均值作为聚类中心；

将数据集中除所有的属于同一类的峰值点之外的每个峰值点作为一个独立的聚类，聚类中心为作为独立的聚类的峰值点本身；

计算得到的全部聚类的数量；

将数据集中的普通点划分给对应的聚类。

进一步的，所述聚类计算单元404用于基于欧式距离识别属于同一类的峰值点，具体包括：

提取确定得到的所有峰值点中满足如下条件的峰值点：峰值点是聚类中心的概率大于预设的概率阈值；

在提取得到的峰值点中，基于欧式距离识别属于同一类的峰值点。

进一步的，所述装置还包括概率计算单元405，用于在所述峰值点确定单元403按照密度的大小确定数据集中属于峰值点的测量数据之后，所述聚类计算单元404基于欧式距离识别属于同一类的峰值点之前：

按照如下公式，计算各峰值点为聚类中心的概率：

其中，ξ(xi)为数据集中当前峰值点xi为聚类中心的概率，ρ(xi)为数据集中当前峰值点xi的密度值，ρ(xj)为数据集中非当前峰值点的测量数据xj的密度值，d(xi,xj)为当前峰值点xi和非当前峰值点的测量数据xj的欧式距离，p[d(xi,xj)]为基于当前峰值点xi和非当前峰值点的测量数据xj的欧式距离的概率，欧式距离越大则概率越大。

进一步的，所述装置还包括模糊聚类单元406，用于在所述聚类计算单元404根据峰值点计算数据集的聚类信息之后，基于计算得到的聚类信息，采用基于目标函数的模糊聚类算法，对数据集中的测量数据进行分类。

进一步的，所述装置还包括数据滤除单元407，用于在所述峰值点确定单元403按照密度的大小确定数据集中属于峰值点的测量数据之前，将数据集中在第一邻域范围内的密度低于预设的噪声阈值的测量数据滤除。

需要说明的是，本发明实施例中的车载雷达测量数据的聚类装置与上述方法属于相同的发明构思，未在本装置中详述的技术细节可参见前面对方法的相关描述，在此不再赘述。

此外，本发明实施例还提供一种存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行前面所述的方法。

本发明实施例还提供一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为运行所述计算机程序以执行前面所述的方法。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件(例如处理器)完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现。相应地，上述实施例中的每个模块/单元可以采用硬件的形式实现，例如通过集成电路来实现其相应功能，也可以采用软件功能模块的形式实现，例如通过处理器执行存储于存储器中的程序/指令来实现其相应功能。本发明不限制于任何特定形式的硬件和软件的结合。

虽然本发明所揭露的实施方式如上，但所述的内容仅为便于理解本发明而采用的实施方式，并非用以限定本发明。任何本发明所属领域内的技术人员，在不脱离本发明所揭露的精神和范围的前提下，可以在实施的形式及细节上进行任何的修改与变化，但本发明的专利保护范围，仍须以所附的权利要求书所界定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：戴春杨;王东峰;曹林;李俊;华斌;王涛;杨慧民;赵宇;宋雨轩;刘怡晓;王兆峰;李萌;镡晓林;杨华斌;谢晓鹏
技术所有人：北京川速微波科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。