一种无人机用多源成像载荷的制作方法_2

文档序号:8266377阅读:来源:国知局
V420格式视频数据进行电子变倍获得第二分辨率的YUV420格式视频数据,对第二分辨率的YUV420格式视频数据进行视频压缩编码获得第二分辨率的压缩视频数据或模拟视频信号;中心处理模块将第一分辨率的RawRGB格式视频数据进行降采样后获得第三分辨率的RawRGB格式视频数据并将其发送至目标检测模块;目标检测模块根据接收到的视频数据进行目标跟踪或动目标检测获得目标坐标,将目标坐标输出至中心处理模块;中心处理模块将压缩视频数据与目标坐标进行数据封装后获得数字视频数据并将数字视频数据输出至外部接口或者中心处理模块将模拟视频信号输出至外部接口 ;第一分辨率、第二分辨率和第三分辨率的分辨率依次变小。优选地,第一分辨率为2592x1944,第二分辨率为720*540,第三分辨率为320x240。
[0029]可见光成像模块采用1/2.5英寸的CMOS传感器作为感光成像器件,像元尺寸为2.2 X 2.2 μ m,感光幅面大小为5.70mm x 4.28mm。优选地可见光成像模块采用最高分辨率5MP的CMOS传感器设计,标称工作温度_30°C -+85°C ;直接输出12位并行数字信号;最高工作频率大于100MHz,为了提高信号的抗干扰性能,在电路板布线过程中严格遵循走线等长原则,并如附图2所示在PCB板高速信号之间做好地隔离,同时选用最高工作频率400MHz的信号传输线及相应的接插件,以减少信号恶化。
[0030]可见光成像模块使用如附图3所示的RawRGB格式进行输出,与三通道数据输出的方式不同,被称为Bayer色彩滤波阵列(以下简称Bayer格式)。与位图格式数据中一个像素点包含有RGB三色亮度数据的情况不同,Bayer格式的像素数据序列如GJGJG#.../BGbBGbBGb,每个位置上仅包含一个色彩通道的亮度数据,每个像素的实际RGB值依赖于相邻位置数据的线性拟合。
[0031]红外成像模块采用FLIR公司的TAU640红外传感器设计,成像器件为非制冷氧化钒探测器,原始分辨率为640 X 512,像元尺寸为17um。与可见光输出RGB三通道的数据不同,红外传感器获取的是灰度图像。选用焦距为19mm-100mm的定焦镜头。
[0032]出于视频采集引脚数量多、原始视频数据传输频率高、视频数据格式转换需求处理速度快等考虑,中心处理单元采用性能指标较为符合的FPGA芯片实现;出于视频处理算法实现的效果、视频处理算法需求的缓存空间等考虑,目标检测模块采用性能指标较为符合的DSP芯片实现;出于硬件驱动资源管理的需求、视频压缩技术复杂的程序间通信等考虑,视频压缩模块采用性能指标较为符合的ARM芯片实现。
[0033]两种成像模块产生的视频数据均进入视频处理模块。因此根据实际需要,可见光载荷与红外载荷可以同时使用并通过FPGA进行快速切换,也可以在使用目标明确的前提下仅开启单一成像载荷来降低能耗。其中可见光视频数据可以直接采集,而红外视频的数据在经过FPGA时,把灰度数据按照RGB三通道数据(其中灰度y = R = G = B)进行处理,转换为如上所述的RawRGB数据,保证成像载荷对外输出数据的接口一致性。即成像系统产生的视频数据在经过FPGA之后,均为时钟96Mhz、行有效长度2592、列有效长度1944的视频信号,其中可见光视频数据分辨率为2592x1944 (有效分辨率为2592x1944),红外视频数据分辨率为2592x1944 (有效分辨率为640x512,有效位置位于左上)。
[0034]DSP获取的视频数据在FPGA中经过降采样,分辨率降低为320x240,用以进行快速目标跟踪以及动目标检测;ARM获取的视频数据是FPGA直接将RawRGB数据进行转发得到的,分辨率保持2592x1944。
[0035]ARM的图像采集接口 ISIF从FPGA提供的行场信号中采集到RawRGB格式的数据,在这里图像分辨率为2592x1944 ;如图4所示,在ARM中进行图像压缩处理的过程如下:图像采集接口 ISIF将获得的数据传递给DDR,所述数据为2592x1944的RawRGB格式图像,为便于在CPU中进行图像运算,在经过图像管道IPIPE时进行色彩空间的转换,由RGB三原色转换为编码器要求的YUV420格式图像数据,分辨率保持2592x1944。至此之前由FPGA传出的视频数据并不区分可见光视频或红外视频,而在电子变倍RSZ环节,根据可见光与红外数据的不同,将采用不同的电子变倍方式:对于可见光数据,电子变倍功能将2592x1944分辨率图像,以图像中心为准截取全画幅图像的指定区域(目前提供分辨率2592x1944至640x480之间,以水平16像素为步长的步进选项),通过硬件实现三次线性拟合,缩放至目标输出分辨率(如720x540);对于红外数据,有效像素为2592x1944左上的640x512,电子变倍功能将兴趣区域指定为左上区域的640x480范围,即指定区域为以(0,16)为左上角,以(640,496)为右下角的区域,然后如可见光数据一样,缩放至目标输出分辨率(如720x540)后进行输出。电子变倍后的数据依然为YUV420格式的数据并将其存入DDR;然后进行叠加状态字,叠加状态字包括当前成像载荷类型、激光指示模块开关状态、电子变倍状态等字符信息,并根据目标检测模块获得的目标坐标数据在视频中叠加显示目标方框;然后进行H.264编码压缩,产生720*540分辨率的H264压缩视频数据,保存在DDR中。当外部接口为数字视频接口时,ARM输出H264压缩视频数据至FPGA,FPGA将H264压缩视频数据与DSP输出的目标坐标进行数据封装后获得数字视频数据,然后FPGA将采用同步422电平串口输出、异步422电平串口输出或网口输出所述数字视频数据。当外部接口为模拟视频接口时,ARM将H264压缩视频数据转换为PAL制式模拟视频信号后发送至FPGA,FPGA将PAL制式模拟视频信号输出至外部接口。
[0036]目标检测模块根据当前功能选择,可执行目标跟踪或动目标检测功能。目标跟踪或动目标检测的方法有很多种。在此进行简单介绍其工作过程:目标跟踪功能在初始化状态时,对于接收到的第一帧视频按照中心处理模块指定的目标坐标截取模板图像,提取模板图像的局部特征向量并进入执行状态,对于之后接收到的每一帧视频都提取局部特征向量,对当前帧的局部特征向量与上一帧的局部特征向量进行特征匹配,得到两帧视频之间的仿射变换矩阵,根据仿射变换矩阵对两帧视频进行局部的动目标检测,即随后采用与动目标检测功能类似的过程获得目标坐标;动目标检测功能以定焦镜头对远距离成像所成的像面接近平面为基础,合理假设相邻帧之间的运动模型为平面六自由度的仿射变换,对每一帧新接收的视频对比上一帧视频进行运动估计,求出变换矩阵后通过逆变换得到与上一帧视频的位置、旋转角、缩放相同的变换视频帧,将变换视频帧与上一帧视频进行差分运算,这样在很大程度上去除了无关的背景,得到差分视频帧,对差分视频帧进行形态学检测,即可获得运动目标在前后两帧的运动区域,进一步解算出运动目标在当前帧的坐标,即目标坐标,并输出至中心处理模块。
[0037]激光指示模块使用9个激光二极管形成3x3阵列,激光二极管的中心波长为SlOnm,具有功耗低、发热少等优点,不需要安装辅助散热措施,而且对驱动电压、电流的要求低,可以使用FPGA芯片直接驱动,从而有效控制电路板面积。驱动方式为根据激光二极管工作功率的要求,适当选用电阻与激光二极管串联,并使用FPGA的GP1管脚直接控制。
[0038]采用变焦镜头除了自身体积较大之外,还需要配合自动调焦装置使用,不适合应用于小空间的安装,因此本发明的可见光成像模块和红外成像模块采用定焦镜头代替变焦镜头,同时基于可见光成像模块的高分辨率,利用电子变倍功能模拟变焦镜头的视场调整功能,将成像模块的尺寸大幅降低。
[0039]按照典型的电路设计方式,载荷过于密集的线路将导致电路板面积将过大,在大量电路拆分合并实验的基础上,将电路板分拆为可见光成像模块的CMOS
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1