一种星载异构H.264视频压缩解码系统及解码方法

文档序号:34989737发布日期:2023-08-03 20:38阅读:29来源:国知局
一种星载异构H.264视频压缩解码系统及解码方法

本技术涉及星载异构视频压缩,特别是涉及一种星载异构h.264视频压缩解码系统及解码方法。


背景技术:

1、随着卫星技术变革性发展,我国卫星地面站面临着海量空间探测数据接收能力不足以及时效性不足的挑战。迫切通过新技术、新架构解决日益突出的星地不匹配之间的矛盾。视频压缩解码器是地面基站接收系统中的关键部件之一,将星载端通过无线通信链路传来的视频图像进行实时解压缩并播放。如图1所示是传统的解码框架,常规的解码器主要由熵解码模块、反量化模块、反dct变换模块、帧间预测模块、帧内预测模块以及滤波模块组成。通过测试分辨率分别为480p、720p、1080p的解码耗时情况得出反dct变换、反量化、帧内/帧间预测以及环路滤波占整个解码时间的60%左右。

2、常规的解码器存在计算量大、耗时长的问题。为了提高解码效率,往往采用并行技术优化解码速度。目前并行技术在业内主要有两种发展思路,一种是基于fpga流水线技术或者cpu多核并行技术实现加速;另一种是基于异构实现加速。常见的异构有基于fpga+cpu、基于fpga+arm、基于fpga+dsp、基于arm+dsp、基于cpu+gpu以及基于fpga+cpu+npu+dsp/gpu的异构形式。第一种并行优化方式的优点是单个器件功耗较低,但缺点是系统的流程控制和数据运算都由fpga或cpu实现处理能力相对有限,且fpga硬件描述语言开发难度较大。第二种并行优化方式的优点是算力强大。其中,基于fpga的异构需要考虑各种时序,基于dsp的异构相较于基于gpu的异构实现速度较慢,基于fpga+cpu+npu+dsp/gpu的异构实现成本较高。gpu虽然非常适合进行视频解码处理,但基于安全可靠的发展问题,急需一种基于国产cpu+gpu异构的h.264视频压缩解码系统及解码方法。


技术实现思路

1、针对现有解码技术中现有解码技术中反dct变换、反量化、帧内、帧间预测和环路滤波模块计算量大、耗时长的问题,本发明的目的在于克服上述现有技术缺陷,提出了一种星载异构h.264视频压缩解码系统及解码方法。

2、为了实现上述目的,本发明提出了一种星载异构h.264视频压缩解码系统,所述系统基于国产cpu和gpu实现,包括:地面端解码分系统和视频显示分系统;其中,

3、所述地面端解码分系统,用于通过网络抽象层实时读取卫星下传的待解码视频图像码流,通过熵解码得到预测信息和系数数据块,根据预测信息依次进行宏块级并行帧内预测和帧间预测得到预测图像块,对系数数据块依次进行宏块级并行反量化、宏块级并行反dct变换,得到残差数据块,对预测图像块和残差数据块经相加处理后,再通过宏块级并行环路滤波得到重建帧;

4、所述视频显示分系统,用于对地面端解码分系统得到的重建帧实时显示。

5、作为上述系统的一种改进,所述地面端解码分系统包括:部署在cpu上的码流分析模块和熵解码模块,以及部署在gpu上的宏块级并行帧内预测模块、宏块级并行帧间预测模块、宏块级并行反量化模块、宏块级并行反dct变换模块和8×8宏块级并行环路滤波模块;其中,

6、所述码流分析模块,用于从网络抽象层读取被压缩的码流,逐帧解析所有能够并行处理的宏块信息保存到中间变量,并发送至熵解码模块;

7、所述熵解码模块,用于对待解码码流进行熵解码得到量化系数数据块和预测信息,将量化系数数据块传递至宏块级并行反量化模块,将预测信息传递至宏块级并行帧内预测模块和宏块级并行帧间预测模块;

8、所述宏块级并行帧内预测模块,用于获得当前宏块的预测信息,通过表示预测方式相关的比特流利用空间相关性得到预测值;

9、所述宏块级并行帧间预测模块,用于利用视频图像帧的时间相关性根据预测信息得到预测图像块;

10、所述宏块级并行反量化模块,用于对量化系数数据块通过宏块级并行反量化处理得到反量化后的系数数据块;

11、所述宏块级并行反dct变换模块;用于对反量化后的系数数据块通过宏块级反dct处理,得到残差数据块;

12、所述8×8宏块级并行环路滤波模块,用于对重建像素块进行环路滤波处理,消除方块效应,得到重建帧,所述重建像素块通过残差数据块和预测图像块相加得到。

13、作为上述系统的一种改进,所述宏块级并行帧间预测模块根据帧间运动补偿函数中内插的特点进行并行优化设计,根据参考帧中的整像素点得到二分之一像素点,再通过二分之一像素点和整像素点得到四分之一像素点,其中二分之一像素点和四分之一像素点的内插过程相互独立,并行进行。

14、作为上述系统的一种改进,所述宏块级并行反dct变换模块和宏块级并行反量化模块的处理过程包括:将反dct变换和反量化两个过程中的乘法合二为一并采用整数运算,利用gpu并行处理乘法运算,提高解码实时性。

15、作为上述系统的一种改进,所述8×8宏块级并行环路滤波模块对8×8块边界进行去方块滤波,计算边界强度,由gpu线程并行处理整幅图像不同块的垂直边界和水平边界以减少数据依赖性。

16、作为上述系统的一种改进,所述国产cpu为龙芯cpu,国产gpu为威固gpu。

17、另一方面,本发明提出了一种星载异构h.264视频压缩解码方法,根据上述系统实现,所述方法包括地面端解码流程和视频显示流程,其中,

18、所述地面端解码流程包括:

19、码流分析模块从网络抽象层读取被压缩的码流,逐帧解析所有能够并行处理的宏块信息保存到中间变量,并发送至熵解码模块;

20、熵解码模块对待解码码流进行熵解码,得到量化系数数据块和预测信息,将量化系数数据块传递至宏块级并行反量化模块,将预测信息传递至宏块级并行帧内预测模块和宏块级并行帧间预测模块;

21、宏块级并行帧内预测模块获得当前宏块的预测信息,通过表示预测方式相关的比特流利用空间相关性得到预测值;

22、宏块级并行帧间预测模块利用视频图像帧的时间相关性,根据预测信息得到预测图像块;

23、宏块级并行反量化模块对量化系数数据块通过宏块级并行反量化处理,得到反量化后的系数数据块;

24、宏块级并行反dct变换模块对反量化后的系数数据块通过宏块级反dct处理,得到残差数据块;

25、8×8宏块级并行环路滤波模块对重建像素块进行环路滤波处理,消除方块效应,得到重建帧,所述重建像素块通过残差数据块和预测图像块相加得到;

26、所述视频显示流程包括:

27、视频显示分系统对重建帧实时显示。

28、与现有技术相比,本发明的优势在于:

29、1、本发明所述宏块级并行帧间预测模块用于通过视频图像帧的时间相关性得到预测数据。根据帧间运动补偿函数中内插的特点进行并行优化设计,实现耗时低、步骤简单的帧间预测;

30、2、本发明所述的宏块级并行反dct变换和宏块级并行反量化模块,在h.264编码标准固有的将两个过程中量化乘法和变换归一化合二为一通过乘法和移位实现并采用整数运算的基础上,利用gpu并行处理大量乘法运算,进一步降低计算规模,提高编码压缩的实时性;

31、3、本发明所述的8×8宏块级并行环路滤波模块是对8×8块边界进行去方块滤波而非4×4块边界,基于更大的块边界滤波可以明显减少需要处理的边界数量,数据依赖性较小,更适合并行处理。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1