基于GPU的相干激光雷达信号处理方法与流程

文档序号:15255651发布日期:2018-08-24 20:34阅读:903来源:国知局

本发明涉及激光雷达技术领域,尤其涉及一种基于gpu的相干激光雷达信号处理方法。



背景技术:

精确的大气风场测量对检测大气污染,获取军事环境情报,提高航空航天安全性,提高天气预报准确性,改进气候模型等具有重大意义。测风激光雷达是风场测量的有效手段,分为直接探测测风激光雷达和相干探测测风激光雷达。直接探测测风激光雷达使用光学鉴频器,将多普勒频移信息转化为能量的相对变化,实现大气风场的测量;相干探测测风激光雷达通过大气回波信号与本振激光的相干拍频实现大气风场的测量。相干测风激光雷达基本原理如下:连续波激光器产生中心频率为υ0的线偏振光,经分光片后分为信号光和本振光,信号光经声光调制器(aom)调制为脉冲光,并产生υm的频移,再由放大器进行功率放大,经环形器后由望远镜出射。设风场对脉冲光产生的多普勒频移为υd,则回波信号中心频率为υ0+υm+υd,回波信号与本振光两者的拍频信号经光电探测器转换为频率为υm+υd的if电信号,再经接收机中采集卡采样和后续电路数据处理分析得到风场信息。

1.5μm的全光纤相干测风激光雷达具有体积小,高测量精度,高时间和高空间分辨率等优点,是世界各国争相发展的领域。日本三菱机电有限公司报道了世界上第一台1.5μm的相干测风激光雷达。法国leosphere公司生产了可以商用的windcube相干测风激光雷达,法国航空航天研究中心(onera)自主研制了1.5μm相干测风激光雷达,英国sgurrenergy推出了搭配风力发电设备使用的galion系列相干测风激光雷达,英国qinetiq公司开发出了zephir系列基于光纤技术的1.548μm脉冲相干测风激光雷达,美国国家大气研究中心(ncar)拥有机载的基于连续激光的相干测风激光雷达(lams)。国内的哈尔滨工业大学姚勇课题组在2010年搭建了采用1.5μm波长连续波激光器的相干测风激光雷达。中国海洋大学在2014年报道了其研制的用于风能研究和开发利用的1.55μm相干测风激光雷达。中国电子科技集团公司第二十七研究所2010年报道了采用1.5μm连续波零差频的激光雷达,并在2013年报道了一套全光纤化的相干测风激光雷达。中国科学院上海光学精密机械研究所在2012年研制了1.064μm的相干测风激光雷达,在2014年又报道了用于边界层风廓线探测的1.54μm全光纤相干测风激光雷达。但是,以上相干测风激光雷达的接收机都使用fpga或者dsp进行风场数据实时反演,存在以下问题:

(1)通常相干激光雷达中aom调制频率υm=80mhz,在考虑υd动态范围之后,if电信号将达到120mhz量级。根据奈奎斯特采样定理,采样频率达到if电信号的2倍以上,才能完整地对信号进行还原,因此相干激光雷达中,采样率通常达到250mhz以上。假设采样率fs=500ms/s,距离分辨率为60m,每秒需进行5m个1024点的fft计算。在计算机中,基2的1024点实数fft理论上需要约260k次运算,在不考虑内存分配,功率谱计算,数据累积等运算,仅考虑fft运算的情况下,后续电路数据处理速度最少应达到1.2t次浮点每秒运算能力。以ti的高端dsp芯片tms320c6678的160g次浮点每秒的运算能力,需要8颗并行才能满足运算要求;目前最高性能的fpga运算能力与tms320c6678处于同一量级,因此相干接收机编程难度大,电路结构复杂。

(2)tms320c6678型号的dsp和fpga芯片都非常昂贵,单核tms320c6678板卡约为5000元。因此,相干接收机电路成本高昂。

(3)如果提高相干激光雷达的距离分辨率,需要减小出射激光脉冲宽度,根据脉冲宽度与光谱展宽的关系,会导致回波信号功率谱的展宽。为了避免光谱重叠,需要增加aom频移量,从而需要更高采样率的和更大计算能力的接收机。dsp或fpga的计算能力将成为相干激光雷达发展的瓶颈。



技术实现要素:

本发明的目的是提供一种基于gpu的相干激光雷达信号处理方法,通过使用gpu并行运算对相干拍频信号进行解调,降低了相干接收机的成本,提高了相干测风激光雷达接收机的计算能力,可以实现实时风速反演或实时时频变换,同时,使用cpu对gpu输出的功率谱进行处理,便于后续信号的深度处理,获取更多有用信息。

本发明的目的是通过以下技术方案实现的:

一种基于gpu的相干激光雷达信号处理方法,包括:

步骤s1、使用cudamalloc在gpu的显存中分配固定的输入输出数据储存空间;

步骤s2、将采集卡采集的数据通过pcie接口,使用dma方式直接输入显存中所分配的固定的输入输出数据储存空间;

步骤s3、将显存中的数据按照激光雷达的探测距离门进行预处理;

步骤s4、使用cuda中的cufft库创建fft变换策略,使用gpu多线程对预处理后的数据进行并行fft变换;

步骤s5、在gpu中对变换结果取功率谱,并进行功率谱累加;

步骤s6、到达累积阈值后,使用cudahostmalloc在计算机内存中分配固定储存空间,通过pcie接口,使用dma方式将累加的功率谱传回至计算机分配的固定储存空间中,使用计算机内的cpu对功率谱进行处理,求得最终风场结果。

由上述本发明提供的技术方案可以看出,使用gpu代替dsp和fpga对相干激光雷达信号进行处理,提高了相干接收机的运算能力,降低了相干接收机的成本。同时,使用经过优化的cuda库函数,降低了相干接收机的开发难度,此外,使用cpu对功率谱进行进一步处理,便于更多有用风场信息的提取。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。

图1为本发明实施例提供的一种基于gpu的相干激光雷达信号处理方法的流程图;

图2为本发明实施例提供的基于gpu的相干激光雷达系统的结构示意图。

具体实施方式

下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。

2007年英伟达nvidia公司推出了统一计算设备架构(cuda),将显卡(gpu)变成可以用作数据并行计算的设备。经过近10年的发展,cuda技术已经大规模商用,完全兼容c/c++等常见编程语言,具有高级而完备的软件开发工具和环境,且gpu广泛用于娱乐、高性能计算领域,容易采购且性价比高。目前民用级别的gtx1080显卡,单块不足5000元,可实现9t次每秒的浮点运算能力,比tms320c6678运算能力高50倍以上,因此,基于gpu的相干激光雷达信号处理方法具有很大优势。

本发明实施例提供一种基于gpu的相干激光雷达信号处理方法,其特征在于,包括:

步骤s1、使用cudamalloc在显卡的显存中分配固定的输入输出数据储存空间。

本发明实施例中,显存中分配固定的输入输出数据储存空间至少为两块,以实现采集卡高速数据流的“乒乓操作”,实现数据流的无缝传输和处理。

步骤s2、将采集卡采集的数据通过pcie接口,使用dma(直接内存存取)方式直接输入显存中所分配的固定的输入输出数据储存空间。

步骤s3、将显存中的数据按照激光雷达的探测距离门进行预处理。

本发明实施例中,所述的预处理主要包括:分组与内插补零等操作。

步骤s4、使用cuda中的cufft库创建fft变换(快速傅氏变换)策略,使用gpu多线程对预处理后的数据进行并行fft变换。

步骤s5、在gpu中对变换结果取功率谱,并进行功率谱累加。

本发明实施例中,使用cublas、cufft等并行函数库,对矩阵进行并行操作,提高数据分组,内插补零和功率谱计算的速度;具体的:显存中的数据为矩阵形式,可以使用cublas库对矩阵进行乘法或其他操作来分组与内插补零,然后用cufft库对矩阵进行并行fft变换,再计算功率谱。

步骤s6、到达累积阈值后,使用cudahostmalloc在计算机内存中分配固定储存空间,通过pcie接口,使用dma方式将累加的功率谱传回至计算机分配的固定储存空间中,使用计算机内的cpu对功率谱进行处理,求得最终风场结果。

本发明实施例中,使用cpu对功率谱进行最后处理。因为功率谱处理所需计算量较小,可用多种算法进行深入处理,提取更多有用信息,所以将功率谱结果从gpu输出,利用cpu处理进行更为灵活的处理,让gpu满载处理更为复杂的fft变换等操作。

本发明实施例中,上述方法可以在相干接收机中实现;如图2所示,为包含相干激光雷达光学发射系统(a),相干激光雷达光学接收系统(b),以及相干接收机(c)的基于gpu的相干激光雷达系统的结构示意图;其中的相干接收机(c)主要包括采集卡(1),支持cuda的gpu(2),以及计算机(3)。整个系统的实施过程简述如下:

步骤一:相干激光雷达发射系统(a)发射脉冲激光,脉冲激光回波信号经相干激光雷达接收系统(b)接收,经探测器将光信号转换为电信号后,输入至相干接收机(c)。

本领域技术人员可以理解,相干激光雷达发射系统(a)内部的a、b、c表示环形器的三个端口;相干激光雷达光学发射系统(a)与相干激光雷达光学接收系统(b)的具体实现方式可以参照现有技术。

步骤二:相干接收机(c)中的采集卡(1)对电信号进行数模转换,数字信号经pcie接口输入至支持cuda的gpu(2)的显存中。使用gpu对信号进行并行处理,在显卡内对功率谱进行累积。

步骤三:到达累积脉冲数后,累积功率谱经pcie接口传输给计算机(3),经计算机(3)中的cpu求得每个距离门内的离散功率谱峰值所在的频率,或对数据进行深度处理,得到风场信息。

上述步骤二~步骤三的具体实现过程也即前文所述的步骤s1~步骤s6。

本发明实施例上述方案,本发明英伟达公司的统一计算架构(cuda)算法,使用显卡(gpu)并行运算代替传统相干测风激光雷达中的fpga或dsp运算,使用cpu对gpu输出的功率谱进行保存和深入处理。相对于传统相干测风激光雷达,使用gpu运算速度更快,成本更低,可以实现实时风速反演或实时时-频变换。将功率谱数据保存,便于使用其他算法对数据进行深度处理,以提取大气能见度、大气退偏振比等更多有用信息。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1