一种基于嵌入式GPU的弹载SAR前侧视时域成像方法

文档序号:26001008发布日期:2021-07-23 21:17阅读:134来源:国知局
一种基于嵌入式GPU的弹载SAR前侧视时域成像方法
本发明属于数字信号处理
技术领域
,具体涉及一种基于嵌入式gpu的弹载sar前侧视时域成像方法。
背景技术
:合成孔径雷达(syntheticapertureradar,sar)是雷达成像的主体,其应用范围最广。合成孔径雷达成像技术通过对雷达回波信号矩阵进行距离和方位两维处理,获得距离和方位两维高分辨率的sar图像,将目标的形状和精细结构特征清晰地呈现出来,大大提高了对目标的检测和鉴别能力。随着合成孔径雷达成像技术的发展,其应用范围进一步扩大。近年来,将合成孔径雷达技术与精确制导技术相结合的弹载sar技术具有重大的应用价值。通过发挥雷达成像技术的优势,提取更多目标特征,实现目标分类与识别,使导引头具备成像寻的能力,实现导弹对目标的精确跟踪和打击,对国防安全和军事事业具有重大意义。总体来讲,现有成像算法可以分为两类:频域成像算法和时域成像算法。然而,大多数频域成像算法对目标传输函数进行了近似,这些成像算法中的近似条件对sar参数较为敏感,在大场景成像中带来较为严重的空变误差,导致sar图像质量变差,且运算量大,影响了打击目标的成像和鉴别实时性,从而限制了弹载sar的应用范围。在实际应用中,由于要保证导弹转弯的机动时间,弹载sar需要工作于前侧视模式,相比传统的正侧视模式,这种模式下的运算量要大的多,实时性难以保证,这进一步限制了弹载sar的应用。为了解决上述问题,现有的研究现状是,一方面,采用时域成像算法,时域成像算法观测几何灵活、聚焦精度高、图像分辨率可控,是一种精确成像方法,在前侧视以及大场景成像范围下也有很好的成像精度。另一方面,增加成像处理器或者采用先进的高性能硬件平台,兼顾成像质量和实时性。文献“基于fpga和多个多核dsp的sar前侧视成像方法,谢荣,张政等,202010400279.8”提出了一种基于fpga和多个多核dsp的sar前侧视成像方法,该方法在多个多核dsp上实现弹载sar成像算法,通过多个多核dsp的多处理器优势,大大提高了弹载sar成像算法的实时性,然而,该方法处理得到一幅sar前侧视图像的时间仍然大于一帧回波数据的积累时间,因此还无法做到连续实时成像,且这类硬件平台存在系统结构非常复杂、功耗大散热难、硬件成本高以及开发周期长等问题。文献“基于gpu的弹载sar前斜视成像方法,梁毅,邢孟道等,201410719487.9”提出了一种基于gpu的弹载sar前侧视成像方法,该方法在gpu上实现弹载sar成像算法,通过发挥gpu的cuda多核架构的优势,大大提高了弹载sar成像算法的实时性,然而,该方法基于频域算法实现,成像质量较差。技术实现要素:为了解决现有技术中存在的上述问题,本发明提供了一种基于嵌入式gpu的弹载sar前侧视时域成像方法。本发明要解决的技术问题通过以下技术方案实现:本发明提供的一种基于嵌入式gpu的弹载sar前侧视时域成像方法,应用于信号处理机,所述信号处理机包括前端模数转换器、前端fpga和集成cpu/gpu的后端集成芯片,所述成像方法包括:所述前端模数转换器,接收弹载sar图像的回波数据,对该回波数据进行数据采样,获得原始回波采样矩阵;所述前端fpga,用于获取弹载sar图像的原始回波采样矩阵,并对该原始回波采样矩阵进行距离维脉冲压缩,获得脉冲压缩后的回波信号矩阵,将所述脉冲压缩后的回波信号矩阵发送至后端集成芯片中;所述后端集成芯片,用于接收脉冲压缩后的回波信号矩阵,对距离维脉冲压缩后回波信号矩阵进行距离维插值处理,获得距离维插值处理后的回波信号矩阵;从雷达运动平台获取惯导数据矩阵,并对惯导数据矩阵中的每一行进行插值,获得雷达运动平台的实际三维位置信息;基于所述实际三维位置信息,对距离维插值处理后的回波信号矩阵进行积分处理,获得多幅低分辨子孔径图像;对低分辨子孔径图像进行方位维处理,获得全孔径高分辨sar图像;对全孔径聚焦sar图像进行几何校正,获得全孔径高分辨弹载sar图像。进一步的,所述后端集成芯片,在对该原始回波采样矩阵进行距离维脉冲压缩之前,进一步用于:将回波信号矩阵保存至全局内存中,并初始化成像系统参数;其中,成像系统参数主要包括:雷达系统工作的信号波长λ,雷达系统发射信号带宽b,雷达系统发射脉冲时宽tr,雷达系统采样频率fs,雷达系统脉冲重复频率prf,雷达平台主天线合成孔径长度l,雷达系统距离向采样点数n,雷达系统方位向采样点数m,雷达系统子孔径图像距离向采样点数m,雷达系统子孔径图像方位向采样点数n。进一步的,所述前端fpga,对该原始回波采样矩阵进行距离维脉冲压缩的步骤包括:对原始回波采样矩阵进行距离维脉冲压缩,得到距离脉压后的回波信号矩阵在所述回波信号矩阵中截掉每一行的前点和后点的数据,得到距离维截取回波信号矩阵sm×n;通过高速接口将脉冲压缩后的回波信号矩阵发送至所述后端集成芯片中。其中,m为脉冲个数或方位采样点数,4n为每个脉冲的采样点数,即距离采样点数,上标p表示距离脉压,n表示雷达系统距离向采样点数。进一步的,所述后端集成芯片,对距离维脉冲压缩后回波信号矩阵进行距离维插值处理,获得距离维插值处理后的回波信号矩阵的步骤包括:将获得的回波信号矩阵sm×n在距离维进行fft变换,使其变换至频域,得到回波信号频域矩阵使用m×8n个gpu线程对距离维fft变换后的回波信号矩阵进行频域补零,获得回波信号频域补零矩阵使用fft逆变换将频域补零矩阵在距离维变换回时域,获得距离维插值处理后的回波信号矩阵其中,m为脉冲个数或方位采样点数,上标i表示距离脉压,n表示雷达系统距离向采样点数。进一步的,所述后端集成芯片,从雷达运动平台获取惯导数据矩阵,并对惯导数据矩阵中的每一行进行插值,获得雷达运动平台的实际三维位置信息的步骤包括:从雷达前端获取北、天、东三个维度的惯导数据矩阵i3×l;对惯导数据矩阵i3×l的每一行进行三次样条插值,将数据长度插值至m,获得插值后的惯导数据矩阵i3×m;根据插值后的惯导数据矩阵i3×m,计算出雷达平台实际航迹的三维位置s3×m。进一步的,所述后端集成芯片,基于所述实际三维位置信息,对距离维插值处理后的回波信号矩阵进行积分处理,获得多幅低分辨子孔径图像的步骤包括:基于所需的成像范围,建立极坐标系;计算出极坐标系中每个点坐标在直角坐标系中所对应的坐标点表示的极坐标信息vm×n;获取所述雷达运行平台沿着俯冲飞行轨道运动生成的轨迹位置d(tm);其中,所述轨迹位置包括多个位置点;基于所述极坐标信息vm×n以及所述轨迹位置,设置m×n个gpu线程,以使每个线程计算在tm时刻,多个位置点到极坐标中任意点目标p(rp,θp)的瞬时距离;利用所述实际三维位置信息,对所述瞬时距离进行运动补偿,获得运动补偿完成后的瞬时距离信息;利用运动补偿完后的瞬时距离信息,对距离维插值处理后的回波信号矩阵进行bp积分,获得多幅低分辨子孔径图像sm×n。进一步的,所述后端集成芯片,基于所述极坐标信息vm×n,设置m×n个gpu线程,以使每个线程计算在tm时刻,雷达到极坐标中任意点目标p(rp,θp)的瞬时距离的步骤包括:基于所述极坐标信息vm×n以及所述轨迹位置,设置m×n个gpu线程,以使每个线程使用距离计算公式计算在tm时刻,多个位置点到极坐标中任意点目标p(rp,θp)的瞬时距离;距离计算公式为:其中,r(d;rp,αp)表示多个位置点到极坐标中任意点目标p(rp,θp)的瞬时距离,rp在极坐标系下的距离,αp为点目标p(rp,θp)在极坐标系下的角度αp=sinθp,d表示轨迹位置,l表示雷达平台主天线合成孔径长度。进一步的,所述后端集成芯片,利用运动补偿完后的瞬时距离信息,对距离维插值处理后的回波信号矩阵进行bp积分,获得多幅低分辨子孔径图像sm×n的步骤包括:利用运动补偿完后的瞬时距离信息,使用bp积分公式,对距离维插值处理后的回波信号矩阵进行bp积分,获得多幅低分辨子孔径图像sm×n;bp积分公式为:其中,s(rp,αp)表示极坐标下的多幅低分辨子孔径图像,rp和αp分别为点目标p(rp,θp)在极坐标系下的两个坐标,d表示轨迹位置,l表示雷达平台主天线合成孔径长度,m表示脉冲个数,krc=4π/λ表示距离波数中心,λ为合成孔径雷达发射信号时载频对应的波长。进一步的,所述后端集成芯片,对低分辨子孔径图像进行方位维处理,获得全孔径高分辨sar图像的步骤包括:计算各幅低分辨子图的波数谱中心kαu;对低分辨子孔径图像sm×n在方位维进行逆傅里叶变换,获得子图像的波数谱;将每个子图像的波数谱中心在方位向上进行移位,使其从零移至真实中心kαu,获得波数谱移位后的子孔径波数谱图像对子孔径波数谱图像在方位维进行频谱拼接获得全孔径波数谱图像sm×n′;对全孔径波数谱图像在方位维做傅里叶变换,以使全孔径波数谱图像变换回图像域;对图像域的全孔径图像求模,得到斜平面的全孔径高分辨图像。本发明提出的一种基于嵌入式gpu的弹载sar前侧视时域成像方法,应用于信号处理机,该信号接收机中的前端模数转换器,接收弹载sar图像的回波数据,对该回波数据进行数据采样,获得原始回波采样矩阵;前端fpga,用于获取弹载sar图像的原始回波采样矩阵,并对该原始回波采样矩阵进行距离维脉冲压缩,获得脉冲压缩后的回波信号矩阵,将脉冲压缩后的回波信号矩阵发送至后端集成芯片中;后端集成芯片,用于接收脉冲压缩后的回波信号矩阵,对距离维脉冲压缩后回波信号矩阵进行距离维插值处理,获得距离维插值处理后的回波信号矩阵从雷达运动平台获取惯导数据矩阵,并对惯导数据矩阵中的每一行进行插值,获得雷达运动平台的实际三维位置信息;基于实际三维位置信息,对距离维插值处理后的回波信号矩阵进行积分处理,获得多幅低分辨子孔径图像;对低分辨子孔径图像进行方位维处理,获得全孔径高分辨sar图像:对全孔径聚焦sar图像进行几何校正,获得全孔径高分辨弹载sar图像。本发明通过采用时域成像算法提高了sar图像质量,通过提高成像并行度,充分利用信号处理机处理器资源,减少了成像运算时间,提高了实时性,应用于导弹导引头中,有助于导弹对目标的实时精确识别和打击。以下将结合附图及实施例对本发明做进一步详细说明。附图说明图1是现有技术中硬件平台结构图;图2是本发明采用的信号处理机的硬件平台结构图;图3a是本发明实施例提供的一种基于嵌入式gpu的弹载sar前侧视时域成像方法的流程示意图;图3b是本发明实施例提供的成像方法的实现流程图;图4为本发明提供的信号矩阵频域补零示意图;图5是本发明实施例提供的矩阵子孔径拼接示意图;图6a是matlab软件处理实测数据获得的sar图像;图6b是fpga-多个多核dsp方法处理实测数据获得的sar图像;图6c是本发明提供的成像方法处理实测数据获得的sar图像。具体实施方式下面结合具体实施例对本发明做进一步详细的描述,但本发明的实施方式不限于此。实施例一现有弹载sar时域成像方法基于fpga-多片多核dsp平台,以dsp作为计算核心,在多片多核dsp上实现全数据处理的时域成像方法,成像处理过程中需要进行多片dsp之间的数据传输同步,耗时多,复杂度高;该方法采用的硬件平台结构图如图1所示。从图1中可以看出现有弹载sar成像方法平台系统结构非常复杂,处理器多,导致功耗大散热难、硬件成本高。另外,该方法计算并行度低,编程较为复杂。针对这种现状,本发明经过研究,提出一种基于嵌入式gpu的弹载sar前侧视成像方法,本发明的硬件结构图如图2所示,从图2可以看出,本发明采用的信号处理机硬件平台包括有前端模数转换器(adc)、前端fpga和后端cpu/gpu芯片,将cpu核和gpu核集成在一片芯片上,简化了硬件平台,扩充了计算能力,使得信号处理机硬件平台结构简单,容易实现。结合图3a以及图3b,本发明提供的一种基于嵌入式gpu的弹载sar前侧视时域成像方法,应用于信号处理机,所述信号处理机包括前端模数转换器、前端fpga和集成cpu/gpu的后端集成芯片,所述成像方法包括:s1,前端模数转换器,接收弹载sar图像的回波数据,对该回波数据进行数据采样,获得原始回波采样矩阵;s2,前端fpga,用于获取弹载sar图像的原始回波采样矩阵,并对该原始回波采样矩阵进行距离维脉冲压缩,获得脉冲压缩后的回波信号矩阵,将脉冲压缩后的回波信号矩阵发送至后端集成芯片中;s3,后端集成芯片,用于接收脉冲压缩后的回波信号矩阵,对距离维脉冲压缩后回波信号矩阵进行距离维插值处理,获得距离维插值处理后的回波信号矩阵;s4,从雷达运动平台获取惯导数据矩阵,并对惯导数据矩阵中的每一行进行插值,获得雷达运动平台的实际三维位置信息;s5,基于实际三维位置信息,对距离维插值处理后的回波信号矩阵进行积分处理,获得多幅低分辨子孔径图像;s6,对低分辨子孔径图像进行方位维处理,获得全孔径高分辨sar图像;s7,对全孔径聚焦sar图像进行几何校正,获得全孔径高分辨弹载sar图像。本发明提出的一种基于嵌入式gpu的弹载sar前侧视时域成像方法,应用于信号处理机,该信号接收机中的前端模数转换器,接收弹载sar图像的回波数据,对该回波数据进行数据采样,获得原始回波采样矩阵;前端fpga,用于获取弹载sar图像的原始回波采样矩阵,并对该原始回波采样矩阵进行距离维脉冲压缩,获得脉冲压缩后的回波信号矩阵,将脉冲压缩后的回波信号矩阵发送至后端集成芯片中;后端集成芯片,用于接收脉冲压缩后的回波信号矩阵,对距离维脉冲压缩后回波信号矩阵进行距离维插值处理,获得距离维插值处理后的回波信号矩阵从雷达运动平台获取惯导数据矩阵,并对惯导数据矩阵中的每一行进行插值,获得雷达运动平台的实际三维位置信息;基于实际三维位置信息,对距离维插值处理后的回波信号矩阵进行积分处理,获得多幅低分辨子孔径图像;对低分辨子孔径图像进行方位维处理,获得全孔径高分辨sar图像:对全孔径聚焦sar图像进行几何校正,获得全孔径高分辨弹载sar图像。本发明通过采用时域成像算法提高了sar图像质量,通过提高成像并行度,充分利用信号处理机处理器资源,减少了成像运算时间,提高了实时性,应用于导弹导引头中,有助于导弹对目标的实时精确识别和打击。实施例二作为本发明一种可选的实施例,后端集成芯片,在对该原始回波采样矩阵进行距离维脉冲压缩之前,进一步用于:将回波信号矩阵保存至全局内存中,并初始化成像系统参数;其中,成像系统参数主要包括:雷达系统工作的信号波长λ,雷达系统发射信号带宽b,雷达系统发射脉冲时宽tr,雷达系统采样频率fs,雷达系统脉冲重复频率prf,雷达平台主天线合成孔径长度l,雷达系统距离向采样点数n,雷达系统方位向采样点数m,雷达系统子孔径图像距离向采样点数m,雷达系统子孔径图像方位向采样点数n。实施例三作为本发明一种可选的实施例,前端fpga,对该原始回波采样矩阵进行距离维脉冲压缩的步骤包括:步骤a:对原始回波采样矩阵进行距离维脉冲压缩,得到距离脉压后的回波信号矩阵步骤b:在所述回波信号矩阵中截掉每一行的前点和后点的数据,得到距离维截取回波信号矩阵sm×n;步骤c:通过高速接口将脉冲压缩后的回波信号矩阵发送至所述后端集成芯片中。其中,m为脉冲个数或方位采样点数,4n为每个脉冲的采样点数,即距离采样点数,上标p表示距离脉压,n表示雷达系统距离向采样点数。在信号处理机前端fpga中,对原始回波采样矩阵sm×4n进行距离维脉冲压缩,得到距离脉压后的回波信号矩阵其中,m为脉冲个数,即方位采样点数,4n为每个脉冲的采样点数,即距离采样点数,上标p表示距离脉压;截掉距离脉压回波信号矩阵中每一行的前点和后点的数据,得到距离维截取回波信号矩阵sm×n,接着,通过高速接口将脉冲压缩后的回波信号矩阵发送至嵌入式gpu中。实施例四作为本发明一种可选的实施例,所述后端集成芯片,对距离维脉冲压缩后回波信号矩阵进行距离维插值处理,获得距离维插值处理后的回波信号矩阵的步骤包括:步骤a:将获得的回波信号矩阵sm×n在距离维进行fft变换,使其变换至频域,得到回波信号频域矩阵步骤b:使用m×8n个gpu线程对距离维fft变换后的回波信号矩阵进行频域补零,获得回波信号频域补零矩阵在本实施例中采用八倍插值,因此使用m×8n个gpu线程对距离维fft变换后的信号矩阵进行频域补零,获得回波信号频域补零矩阵补零示意图如图4所示,补零过程使用一个核函数实现,m×8n个gpu线程,每个线程正好对应补零后矩阵的每个点,处于矩阵中列号小于的线程直接对应复制矩阵sm×n中列号小于的点,处于矩阵中列号大于的线程直接对应复制矩阵sm×n中列号大于的点,处于矩阵中列号大于且小于的线程直接赋值0;最后后端集成芯片中,用fft逆变换将频域补零矩阵在距离维变换回时域,获得距离维插值处理后的回波信号矩阵本发明中利用fft变换以及gpu线程直接对信号矩阵块进行处理,不需要循环m次分别对m个脉冲处理,这样减少了gpu线程分配及启动次数,从而提高了运算速度。步骤c:使用fft逆变换将频域补零矩阵在距离维变换回时域,获得距离维插值处理后的回波信号矩阵其中,m为脉冲个数或方位采样点数,上标i表示距离脉压,n表示雷达系统距离向采样点数。本发明中利用fft变换以及gpu线程直接对信号矩阵块进行处理,不需要循环m次分别对m个脉冲处理,这样减少了gpu线程分配及启动次数,从而提高了运算速度。实施例五作为本发明一种可选的实施例,所述后端集成芯片,从雷达运动平台获取惯导数据矩阵,并对惯导数据矩阵中的每一行进行插值,获得雷达运动平台的实际三维位置信息的步骤包括:步骤a:从雷达前端获取北、天、东三个维度的惯导数据矩阵i3×l;步骤b:对惯导数据矩阵i3×l的每一行进行三次样条插值,将数据长度插值至m,获得插值后的惯导数据矩阵i3×m;步骤c:根据插值后的惯导数据矩阵i3×m,计算出雷达平台实际航迹的三维位置s3×m。从雷达运动平台获取北、天、东三个维度的惯导数据矩阵i3×l,其中,l为单个维度的惯导数据长度,在cpu中,分别对惯导数据矩阵i3×l的每一行进行三次样条插值,将数据长度插值至m,获得插值后的惯导数据矩阵i3×m,由于三次样条插值操作比较复杂且多为串行操作,无法在gpu中进行并行处理,若想要在gpu中进行插值,只能使用单个gpu计算核,使用单gpu计算核插值的运算速度要远低于使用cpu插值的运算速度,接着根据惯导数据矩阵i3×m计算出雷达平台实际航迹的三维位置s3×m。实施例六作为本发明一种可选的实施例,所述后端集成芯片,基于所述实际三维位置信息,对距离维插值处理后的回波信号矩阵进行积分处理,获得多幅低分辨子孔径图像的步骤包括:步骤a:基于所需的成像范围,建立极坐标系;步骤b:计算出极坐标系中每个点坐标在直角坐标系中所对应的坐标点表示的极坐标信息vm×n;步骤c:获取所述雷达运行平台沿着俯冲飞行轨道运动生成的轨迹位置d(tm);其中,所述轨迹位置包括多个位置点;步骤d:基于所述极坐标信息vm×n以及所述轨迹位置,设置m×n个gpu线程,以使每个线程计算在tm时刻,多个位置点到极坐标中任意点目标p(rp,θp)的瞬时距离;雷达运动平台沿着俯冲飞行轨道运动,生成长度为l的合成孔径,所述合成孔径的中心表述为o,以合成孔径中心为原点建立平面直角坐标系,在平面直角坐标系中,x轴方向为运动平台的运动方向,在天线相位中心的x轴坐标值的绝对值为d。在嵌入式gpu中,根据极坐标信息vm×n,设置m×n个gpu线程,可以计算出雷达到极坐标中任意点目标p(rp,θp)的瞬时距离。其中,可以基于所述极坐标信息vm×n以及所述轨迹位置,设置m×n个gpu线程,以使每个线程使用距离计算公式计算在tm时刻,多个位置点到极坐标中任意点目标p(rp,θp)的瞬时距离;距离计算公式为:其中,r(d;rp,αp)表示多个位置点到极坐标中任意点目标p(rp,θp)的瞬时距离,rp在极坐标系下的距离,αp为点目标p(rp,θp)在极坐标系下的角度αp=sinθp,d表示轨迹位置,l表示雷达平台主天线合成孔径长度。步骤e:利用所述实际三维位置信息,对所述瞬时距离进行运动补偿,获得运动补偿完成后的瞬时距离信息;步骤f:利用运动补偿完后的瞬时距离信息,对距离维插值处理后的回波信号矩阵进行bp积分,获得多幅低分辨子孔径图像sm×n。将全孔径数据分成具有相等长度l=l/nsub的nsub个子孔径,后端集成芯片中,利用运动补偿后的瞬时距离信息,用bp积分公式生成nsub幅低分辨子孔径图像,bp积分算法通过沿着距离压缩和方位时域做两维的相干积分实现精确聚焦,获得多幅低分辨子孔径图像sm×n。坐标(rp,αp)处的聚焦过程或者bp积分公式可以表示为:其中,s(rp,αp)表示极坐标下的多幅低分辨子孔径图像,rp和αp分别为点目标p(rp,θp)在极坐标系下的两个坐标,d表示轨迹位置,l表示雷达平台主天线合成孔径长度,m表示脉冲个数,krc=4π/λ表示距离波数中心,λ为合成孔径雷达发射信号时载频对应的波长。实施例七作为本发明一种可选的实施例,所述后端集成芯片,对低分辨子孔径图像进行方位维处理,获得全孔径高分辨sar图像的步骤包括:步骤a:计算各幅低分辨子图的波数谱中心kαu;步骤b:对低分辨子孔径图像sm×n在方位维进行逆傅里叶变换,获得子图像的波数谱;步骤c:将每个子图像的波数谱中心在方位向上进行移位,使其从零移至真实中心kαu,获得波数谱移位后的子孔径波数谱图像步骤d:对子孔径波数谱图像在方位维进行频谱拼接获得全孔径波数谱图像sm×n′;本实施例中可以申请一块全局内存用于存放最终频谱拼接后的全孔径波数谱图像sm×n′并全部置0,设置m×n个gpu线程对当前的子孔径图像与已融合的波数谱图像在方位维进行拼接,本发明中m为1024,n为64,每个gpu线程与当前子孔径图像中的每个点相对应,根据设计的重叠拼接范围,在该范围内的线程将对应位置的子孔径图像数据叠加到已融合的波数谱图像上,在该范围外的线程直接将对应位置的子孔径图像数据赋值到全孔径波数谱图像sm×n′上,具体的拼接过程如图5所示。步骤e:对全孔径波数谱图像在方位维做傅里叶变换,以使全孔径波数谱图像变换回图像域;步骤f:对图像域的全孔径图像求模,得到斜平面的全孔径高分辨图像。本发明采用fpga对弹载sar回波信号进行预处理,采用嵌入式gpu进行成像处理。现有方法以dsp为处理核心,成像处理采用3片dsp共24个核并行处理,并行度较低,本发明以嵌入式gpu为处理核心,成像处理采用256个cuda核并行处理,矩阵运算和向量运算并行度大大提高,减少了运算时间,提高了弹载sar成像的实时性。现有以dsp为处理核心的弹载sar成像方法采用的基于裸机的c语言编程方法,对于一些常规数学运算需要自己实现,编程较为复杂,本发明实现时采用基于嵌入式linux操作系统的cuda-c语言编程方法,相比现有采用基于裸板的c语言编程方法,有更多的运算库可以调用,降低了开发难度,易于实现。以下结合实测数据处理实验,对本发明的技术效果进行说明。基于嵌入式gpu的弹载sar前侧视时域成像方法,具体实施步骤如上所述:实验条件和内容:实测数据成像实验数据录取使用的雷达系统参数如表1所示:表1录取实测数据的雷达系统参数波段ku波段斜视角60°采样率60mhz带宽50mhz高度4000m波束宽度7°脉宽10us速度50m/s分别使用pc机上的matlab软件、fpga-多个多核dsp方法和本发明对实测数据进行成像实验,其中,pc机cpu为主频3.6ghz的英特尔酷睿i7-4790处理器,多核dsp为德州仪器的8核tms320c6678,本发明使用的高性能嵌入式gpu为英伟达tegraparker,获得成像结果。其中图6(a)为使用matlab处理实测数据的成像结果,图6(b)为使用“fpga-多个多核dsp”硬件平台处理实测数据的成像结果,图6(c)为使用本发明处理实测数据的成像结果。实验结果分析:参见图6,可以发现肉眼几乎无法分辨图6a、图6b和图6c两幅图像的区别,这是由于使用不同的方法处理的实测数据是同一份数据,成像效果都很好,为了更精确的区分两种处理方法成像结果图像的区别,表2给出了两幅成像图像的图像熵。表2三种处理方法成像图像的图像熵处理方法matlabfpga-多个多核dsp方法本发明图像熵7.57447.57647.5745参见表2,可以发现fpga-多个多核dsp方法处理下的成像图像的图像熵高于本发明成像处理的图像熵,且本发明的成像图像的图像熵又高于matlab成像处理的图像熵,表明matlab成像图像效果最好,本发明成像图像效果次之,fpga-多个多核dsp方法处理下的成像图像效果最差,这是由于matlab在运算中使用双精度浮点运算,fpga-多个多核dsp方法在运算中大多采用单精度浮点运算,而本发明基于嵌入式gpu平台只有在距离维插值处理中使用单精度浮点运算,在其他处理过程中均采用双精度浮点运算,因此工程实现精度略高于fpga-多个多核dsp方法,成像图像效果也略好。表3三种处理方法的成像时间处理方法matlabfpga-多多核dsp方法本发明成像时间12.645s726ms134ms加速比94.365.41参照表3,可以发现本发明的成像处理时间为134毫秒,成像时间远小于fpga-多个多核dsp方法的726毫秒,计算速度提升一个数量级,实时性得到巨大提升。相比matlab成像处理,本发明的成像处理时间的加速比提高到两个数量级,这是由于matlab中的成像处理是单核串行处理,fpga-多个多核dsp使用3片8核dsp,共24个核并行处理,而本发明使用256个cuda核并行处理,并行度比其他两种处理方法高得多。综上所述,本发明提出的一种基于嵌入式gpu的弹载sar前侧视时域成像方法,应用于信号处理机,该信号接收机中的前端模数转换器,接收弹载sar图像的回波数据,对该回波数据进行数据采样,获得原始回波采样矩阵;前端fpga,用于获取弹载sar图像的原始回波采样矩阵,并对该原始回波采样矩阵进行距离维脉冲压缩,获得脉冲压缩后的回波信号矩阵,将所述脉冲压缩后的回波信号矩阵发送至后端集成芯片中;后端集成芯片,用于接收脉冲压缩后的回波信号矩阵,对距离维脉冲压缩后回波信号矩阵进行距离维插值处理,获得距离维插值处理后的回波信号矩阵从雷达运动平台获取惯导数据矩阵,并对惯导数据矩阵中的每一行进行插值,获得雷达运动平台的实际三维位置信息;基于所述实际三维位置信息,对距离维插值处理后的回波信号矩阵进行积分处理,获得多幅低分辨子孔径图像;对低分辨子孔径图像进行方位维处理,获得全孔径高分辨sar图像:对全孔径聚焦sar图像进行几何校正,获得全孔径高分辨弹载sar图像。本发明通过采用时域成像算法提高了sar图像质量,通过提高成像并行度,充分利用信号处理机处理器资源,减少了成像运算时间,提高了实时性,应用于导弹导引头中,有助于导弹对目标的实时精确识别和打击。以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属
技术领域
的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1