基于多DSP+FPGA的卫星遥感图像压缩系统设计
令均可并行执行。
现代微处理器把指令分成几个子操作,每个子操作在微处理器内部可由不同的部件来完成。在同一时间内,可有多条指令交迭地在不同部件内处理,这种工作方式就是"流水线"(pipeline)工作方式。TMS320C6000的特殊结构可使多个指令包(每包最多8条指令)交迭地在不同部件内处理,大大提高了微处理器的吞吐量。
3.2 数据类型转换与数据溢出问题
TMS320C6000系列DSP的数据打包处理技术,可以使用宽长度的存储器对短字长的数据访问,这样可使编译出的代码性能显著提高。压缩算法在DSP实现中,采用short代替int来存储图像像素值和变换后的系数,并确保不会产生数据溢出。
对|T|的每一行求和,最大为2.8284。进行行列两次变换,最终变换系数最大为图像像素值的8倍。当图像像素占8位或10位时,包括符号位1位,16位存储变换系数不会溢出。
3.3 并行计算
压缩算法核心软件结构如图4所示。
各子函数采用汇编语言编写,在C6000系列DSP中优化代码的关键是如何实现代码的并行。针对C64XX系列处理器的指令特点,采取以下并行处理措施:
(1)双通路。处理系数平均安排,分别分布在A、B两通路;
(2)数据打包处理技术。用LDW和STW一次读取和存储两个16位系数;
(3)半字操作指令。每条指令处理两个16位系数;
(4)多功能单元。两通路内各8个系数的计算充分利用L、S、M和D四个功能单元。
4 实验结果与结论
以一组40幅中科院遥感所提供的1024×1024×8图像为样本,用4:1和8:1两种压缩比,对遥感图像压缩系统样机进行测试。测试结果如下:
(1)压缩比为4:1时,PSNR平均40dB以上,最低38dB;压缩比为8:1时,PSNR平均35dB以上,最低32dB。
(2)对1024×1024×8图像,压缩比为4:1时,单DSP处理时间在64ms以下;压缩比为8:1时,单DSP处理时间在48ms以下,为优化前时间的1/30。
(3)单DSP内部RAM能满足2路相机数据及中间系数缓存要求;
(4)单路功耗在0.5W以下,整机功耗不足15W。
结果表明,数据压缩系统设计合理,实际工作能满足图像质量和高速实时处理要求。但从人工判图的结果看,8:1压缩时,算法小目标保持情况不如JPEG2000。系统目前已进入初样阶段,希望在算法尤其是编码算法上继续研究并优化,进一步提高图像质量。
- 航空图像压缩系统的DSP设计及实现(07-05)
- 基于DSP的图像压缩无线传输系统设计 (03-04)
- 基于DSP的机载视频图像实时压缩与处理系统(10-01)
- 独立式多分辨率VGA/DVI压缩存储系统(06-05)
- 一种基于JPEG2000的新型率控制方法(10-20)
- Virtex-II系列应用指南(06-06)