维普资讯 http://www.cqvip.com 第11期 《红外》月刊 13 多光谱遥感图像无损压缩技术 孙春燕 (中国科学院上海技术物理研究所,上海,200083) 数据无损压缩技术特征 多光谱遥感图像来源于多光谱遥感技术,比 如用于气象卫星的成像光谱仪,其产生的图像 无损压缩的难点在于压缩率比较低。为了 尽可能地提高效率,必须在保证信息量无损的 前提下,尽可能在系统的各个环节上提高信息 的相关性,然后更好地做好去相关工作。 2.1.1如何提高信息的相关性 与一般图像相比多了一维光谱信息,数据量大, 远远超出了数据传输和存储等设备的要求,这 就必须对其进行压缩;图像的拍摄价格昂贵, 且有长远的保存价值,最好对其进行无失真压 缩,即无损压缩;日新月异发展的气象观测技 术,需要对图像的原始数据进行某些计算和应 用,因而需要对原始采集数据进行无损压缩。 将用于我国“风云三号”气象卫星的中分辨 率成像光谱仪是近十年发展起来的遥感仪器。 该成像光谱仪有20个光谱通道。在轨道上,红 外波段将每天覆盖地球2次,可见光/近红外 波段将每天覆盖地球1次。它将对全球进行观 对此,主要有两种处理方法,一是在空间 上进行信号的重排和聚集,以提高信息的相邻 相关性;二是对遥感图像进行波段排序,用一 个和当前谱段相关性很强的谱段来预测当前谱 段。 (1)空间维扫描。在图像处理中有一个“数 据扫描”的概念,即按照一定的顺序读入数据 源。好的扫描路径(顺序)能让预测器更好地 利用旧值预测下一个新值。扫描路径有如下几 种:①光栅扫描;②Z子形扫描;③Peano-Hilbert 扫描;④金字塔型扫描。根据CHOSHU的结论, 扫描路径对压缩效果并不一定是有效的,更重 要的是如何利用更多的“旧值”像素点来预测 “新值”像素点。从这个概念上说,一个好的扫 描路径或许应该是尽可能有效地利用旧值来预 测新值。 . 测并记录遥感数据,在卫星过境时将数据下发 到地面站,因此遥感数据的下传速率比较高, 需要进行实时数据无损压缩,以减轻大数据量 对卫星数据传输系统的压力。要求对成像光谱 仪的16Mbps数据,采用无损压缩技术将数据的 码速率降低至10Mbps左右。 (2)波段排序。多光谱图像的各个谱段对应 同一地面景物,因此谱段间具有相关性,但相 关性的大小不一样。如果用一个和当前谱段相 2无损压缩算法 无损压缩算法一般包括图像压缩预处理和 压缩熵编码两个步骤。 2.1图像压缩预处理 预处理就是在空间域尽可能对图像去相 关,以提高压缩比,同时将图像数据变换映射 成适于熵编码的数据源。 ’2000级硕士研究生 关性很强的谱段进行预测,预测就比较准确, 反之,预测效果就很差。因此就有了到底用哪 一个谱段能最好预测当前谱段的问题,即波段 排序问题。这可从谱段间的相关性方面进行研 究。根据以往的研究结果,压缩比大约能够提 高5%。 维普资讯 http://www.cqvip.com 14 《红外》月刊 2002年 图1 2.1.2去相关处理 的偏差值e --fN一 为最小。使用准则均方误差 去相关的方法主要根据差分脉冲编码调制 (MSE),就可得到MSE准则意义下的最优线性 (DPCM)原理进行预测编码。 DPCM预测。即使得 2=E{( 一 )。)=E{e ) (1)DPCM去相关原理。根据信息论知识, 为最小。 我们知道,对具有J种取值的符号序列{^)( 但是这样的最优预测算法对硬件实现来说 i=l,2,3,……),其第N个字符的信息熵满足 太复杂,即使对软件功能的实现,这种算法也 下式: 是非常浪费资源的,因此研究人员通过大量研 log2J (fuIfu一1) t-I(fuIfu一1fu一2) A 究,提出了各种相对简单且有效的次优预测器。 其中最著名的就是JPEG的七种无损压缩预测 日(.by JfJr一1fJr一2fAl1)>日oo (1) 式。 式(1)告诉我们:若知道第N个符号前面的 (3)JPEG无失真预测器。JPEG预测器结 一些符号屯(L<N),猜测后面接着的一个符 合三邻域的像素值(A、B和C)来生成用x表 号fN,则fL知道得越多,越容易猜中。容易猜 示的像素的预测值X:=0,1,2,3,4,5,6,7),然 中的就意味着信源的不确定度减小,即其信息 后用x的实际像素值减去这个预测值x:,再进 熵就小。其猜中的程度取决于信源的概率分布 行无失真熵编码。 和相关性。这就是预测编码的理论依据。 DPCM预测编码器输出的是当前的实际值 C B ● 与信号预测值之间的差值。DPCM系统的工作 原理如图1所示。 A X 图中xt为输入信号在t时刻的取样值,预 测器可以使用Xt的邻近像素值的函数。 DPCM预测编码的关键在于预测式的选 图2 X为当前采样值,A、B、 C为相对位置采样值 择,只有设计针对大量图像数据普适性强的预 测式,才能更好地进行去相关。 ①x =A;②X =B;③x =c;④X =A (2)最优线性预测器。由(1)式,我们可得 +B—C;⑤x :A+(B—C)/2;⑥x ---B+ 到如下预测式: (A—C)/2;O x =(A+B)/2。 =O ̄1fl+a2f2+a3f3+O ̄4f4+A (2) (4)自适应预测器。所谓自适应预测(AD— PCM),即预测器的预测系数可以是不固定的, 所谓最优线性预测,就是按照某种准则选 如上面提到的最优线性预测器。自适应预测一 择预测式(2)中的线性预测系数Q ,使得预测 般可分为线性自适应预测和非线性自适应预测 维普资讯 http://www.cqvip.com 第l1期 《红外》月刊 15 两种;也可以是预测器不固定,在多个预测器 中自适应选择相对最优的一个,随图像的局部 C。最佳线性系数预测算法会导致浮点计算,这 将大大提高硬件复杂度,并影响无损精度。 ③在空间维共用第一波段最佳预测模型预 测(如(3)式所示),再结合光谱维进行预测。 在对上海技术物理研究所研制的OMIS获得的 四幅不同地物目标和光谱波段的12bit遥感图像 进行的无损压缩研究中,研究人员用该算法做 的软件仿真获得的平均压缩比为1.85倍。 (注:图像压缩是非常具有图像针对性的, 压缩结果一般只具有一定的参照性,除非对同 一特性而有所变化。在实际操作过程中,后者应 用得较多。例如,我们可以利用JPEG预测来设 计以下的自适应最佳预测式: £( )=rain(IX一 l,lX一 l,lX—x;I,lX—x;I) (3) 但是这样每个像素就需要附加最佳预测信息, 如上式,最佳预测信息需要用2 bit表示。 又如被JPEG—LS选用的LOCO-IP算法采 用了针对DPCM方法在图像轮廓处性能较差而 改进设计的边缘检测预测式(MED),它是一个 图像,否则一般不能横向比较。) 实际上,在应用于硬件实现的无损压缩系 统中,为了抑制波段间的误码扩散,很少在算 非线性自适应预测器,其思想是根据当前像素 所处的位置来优选预测值。即在当前像素x的 左侧出现竖直边缘时选择上方领域点预测,在 上方出现水平边缘时选择左侧领域点预测,在 没有发现明显的边缘时则选择较平均的(A+B— 法设计中涉及到光谱维去相关。 2.2无损压缩编码技术 无损数据压缩编码算法可分为两大类:基于 概率统计的方法和基于字典的技术。基于概率 统计的方法是依据信息论中的变长编码定理和 信息熵有关知识,用较短代码代表出现概率大 的符号,用较长代码代表出现概率小的符号, C)作为预测值。这是一个复杂度低而效果好的 自适应预测器,采用上述JPEG预测器的模型, 可以表示如下: X = 从而实现数据压缩。主要有霍夫曼编码、算术 编码。基于字典技术的算法是将长度不同的符 号串(短语)编码成一个一个的新“单词”,它 IF C>MAX(A,B) MIN(A,B) 们形成了一本“短语词典”的索引。若单词的码 字短于它所代表的短语,就达到了数据压缩的 目的。基于字典技术的编码有游程编码和LZW 编码。空间数据系统咨询委员会(CCSDS)推荐 的图像无损压缩标准提出了一种自适应熵编码 MAX(A,B) IF C<MAX(A,B) A+B—C OTHERWISE E.三维遥感图像预测器 三维遥感图像与普通图像的区别是多了一 维(光谱维)信息,因此除了考虑空间(X,Y方 向)去相关外,还可以考虑光谱维去相关。经过 研究人员大量的算法设计和试验,得出以下几 种较好的三维去相关预测式: ①空间两维(X,Y方向)Hilbert扫描经一维 方案,即赖斯(Rice)通用无损压缩编码。这种自 适应熵编码适合于对不同位面即不同分辨率的 信源进行编码,是高分辨率图像无损压缩编码 的一个很好的参考和选择,其最大的优点是易 于硬件实现。下面介绍几种编码技术,其中赖 斯编码技术是重点。 2.2.1霍夫曼fHuffman)编码 DPCM后,再经光谱维(DPCM)去相关。 ②三维最佳预测,预测式如下: X ( ,J, )=aH(i一1,J, )+bX(j,J, 一1)+ (4) 根据每个字符出现的概率大小进行一一对 应的编码。 2.2.2算术编码 根据使∑,N o ( ( ,J, )一X ,J, ))。最小的 准则,每一波段的每一行可以求出一组a、b和 这种编码也利用概率分布特性,但是它是 对字符序列进行编码,而不是对字符序列中的 维普资讯 http://www.cqvip.com 16 《红外》月刊 2002年 单个字符进行编码。 2.2.3游程编码(RLC) 这一缺陷。其中赖斯编码技术已应用于美国宇 航局的一些科研探测项目中。CCSDS已将赖斯 算法作为一种好的适用于各种空间技术应用的 无损压缩算法加入建议标准。图3是带有预处 理器的赖斯自适应熵编码的原理图。 原始信源x经过预处理去相关后映射成适 于编码的 ,然后进入自适应熵编码模块,通 过各个的压缩模块并行处理,然后给最优 基于字典的压缩技术,适用于灰度级不多, 数据相关性很强的图像数据的压缩,但最不适 用于每个像素都与它周围的像素不同的情况。 2.2.4 LZW编码 基于字典技术,生成特定字符序列的表以 及它们对应的代码。每当表中尚没有的字符串 第一次出现时 它被原样存储,同时将分配给 它的代码也一起保存。当这个串再次出现时, 只保存它的代码,原字符就不保存。这样就去 掉了文件中的冗余信息。不但字符表是在压缩 过程中动态生成的,而且字符串标也不必压缩 在文件里,因为解压缩时可以由压缩文件中的 信息重构它。 2.2.5赖斯(Rice)编码 的结果添上选项标志位后输出压缩结果Y。 其中Fs是变长基础顺序码(FSC),如果 的值为m,则其Fs码由m个0和一个1组成 (00.01);K位选项是将 的值的低K位分 裂出来,对剩余的高位(MSB)做Fs编码,加上 低K位(LSB)即为其码字;二次编码是针对底 墒图像块设计的,将相邻的两个像素值合并为 一个,再做Fs编码,能达到很好的编码效率; 霍夫曼编码无疑是最著名的无损压缩编码 技术,但是在实际应用中,由于信源的千变万 化,只能在很窄数据熵范围内产生最优编码的 单个霍夫曼编码很难达到整体编码最优化。动 态霍夫曼编码和赖斯通用无损编码技术弥补了 零块编码是对出现一个或者多个连续的全零图 像块时,仅用一个码字就可表示,这样就可以 极大地提高压缩效率;而无压缩选项是在图像 块极其复杂,压缩效果很差甚至不如不压缩时 使用的,可防止压缩膨胀的恶劣情况。 图3自适应熵编码 维普资讯 http://www.cqvip.com 第11期 《红外》月刊 17 由于基于赖斯算法的无损压缩技术尽可能 考虑了各种数据熵的情况,所以它能够达到较 优的压缩效果,而且,其算法思想简单,易于硬 件实现。 2.3新思想——整型小波变换用于无损压缩 法精度的提高和算法复杂度的增加,要求存储 并加以利用的信号样本数会增多,硬件系统将 会变得庞大。因此,图像压缩系统的设计,不但 要考虑经系统处理后得到的重建图像的质量以 及压缩比是否满足要求,还应考虑算法的硬件 实现在工作速度、复杂度、功耗等方面是否具 图像无损压缩算法除了主流思想DPCM算 法外,也不断有新的思想算法溶入,比如有人 将整型小波变换应用到了遥感图像的无损压缩 方面。 ~ 有实用价值。另外,鉴于仪器在空间运行环境 的特殊要求,系统的可靠性是一个极为严格的 参考因素。为此,本人对可编程DSP芯片与现 场可编程逻辑门阵列FPGA两种硬件实现方式 进行了调研。 3.1可编程DSP芯片 人们已对基于小波变换的静止及序列图像 压缩进行了深入的研究并开始了初步的应用, 尤其是零树编码技术的出现,大大提高了压缩 比。但是一般情况下构造的小波系数都是浮点 数,它会使小波变换后的系数也成为浮点数。 这一特点使图像无损压缩无法直接在小波变换 域进行,造成无损压缩比很低,了小波在该 可编程DSP芯片是一种具有特殊结构的微 处理器,为了达到快速数字信号处理的目的, DSP芯片一般都具有程序和数据分开的总线结 构、流水线操作功能、单周期完成乘法的硬件 乘法器以及一套适合数字信号处理的指令集。 TI公司的TMS320系列DSP芯片的基本结构包 领域的应用。“提升”方案(1ifting scheme)实现 了整型小波变换(1wT),保证了小波变换以后 图像信息没有损失,从而可以直接在小波变换 域进行无损压缩,有利于提高压缩比。同时,在 括:(1)哈佛结构;(2)流水线操作;(3)专用的 硬件乘法器;(4)特殊的DSP指令;(5)快速的 指令周期。这些特点使得TMS320系列DSP芯 小波变换的基础上,也可结合遥感图像的谱间 相关性进行谱间预测,从而得到较好的结果。 片可以实现快速的DSP运算,并使大部分运算 (例如乘法)能够在一个指令周期内完成。由于 TMS320系列DSP芯片是软件可编程器件,因而 具有通用微处理器具有的方便灵活的特点。对 于要求在空间飞行器上应用的实时无损压缩系 3压缩电路设计 对于图像压缩硬件系统的性能,一般可以 从图像恢复质量、比特率、复杂度、功耗等几 方面考虑。信号质量取决于压缩系统选用的算 法,对无损压缩,重点在于如何在保证图像无 损的前提下尽可能提高压缩比,同时有两个问 题需要解决:一是如何抑制误码扩散;二是如 统,由于空间工作环境特殊,对元器件的性能 要求严格,可靠性、功耗等都是一个很重要的 因素,需要有空间级产品。考虑到这些因素, DSP芯片系统更适用于地面处理,相对的上天 经验不足,星载环境下工程化较为困难。 何将压缩后变比特率输出流转化为恒比特率输 出。从数据处理的角度看,图像数据输入比特 率常常是衡量一个实际压缩系统工作速度的标 准,而从通信的角度出发,最终的压缩数据比 特率还应与现行的数字传输相适应;压缩 系统的复杂度是指为实现编码算法所需的硬件 设备量,以算法的运算量和需要的存储量来度 量。图像压缩算法的选择及其硬件实现方法是 决定压缩系统复杂度的重要因素,随着压缩算 3.2现场可编程逻辑门阵列(FPGA) 现场可编程门阵列(FPGA),是开发大规模 集成电路的最新技术。通过FPGA,将压缩算 法映射到VLSI结构,并转化为实际硬件设备, 即图像压缩专用芯片。采用这样的图像压缩专 用芯片的硬件系统具有最高的数据处理速度, 同时,由于系统集成度的提高,功耗、体积、重 量亦可以很低,因此,这类处理系统最有可能 维普资讯 http://www.cqvip.com 18 《红外》月刊 2002年 达到星载环境下遥感图像高速实时压缩的各项 斯通用无损压缩算法是一种很好的选择。以下 技术要求。 是算法设计的流程: Actel公司是众多FPGA生产厂家中的佼 a.算法设计的一些考虑(硬件实现可行性、 佼者,美国发射的火星探路者使用了该公司的 复杂度、无损要求等); FPGA,其优异性可见一斑。该公司的最新一代 b.算法设计软件仿真及实验; 产品54SX系列相对其他FPGA厂家的产品还具 c.实验结果; 有以下优势: d.重复以上步骤,直至设计出达到要求的 (1)可靠性高:芯片内部采用金属一金属反 算法,综合评估,择优选择设计方案; 熔丝元件,编程后内部连接为永久的反熔丝型 e.映射到硬件压缩算法设计。 连接,而反熔丝互连就像纯金属连接一样,可 4.2从算法到硬件设计 防静电,并提高抗电磁干扰能力; 即便是很好的压缩算法,其仿真结果也是 (2)功耗低:反熔丝结构消除了静态存储器 比较理想化的。在真正的硬件实现时,有许多 互连开关的功耗,并且由于逻辑信息是永久性 因素会影响最后可实现的压缩比,这在硬件设 编程的,器件在通电序列中无需进行重构,信 计时是必须考虑的。 4.2.1误码扩散问题 息的存储与保持不消耗电流,从而减小静态电 误码扩散在信号传输中是不可避免的,只 流,降低功耗; 能在一定范围内,因此如何抑制误码扩散 (3)有空间级产品:Actel公司又专门针对 是一个很重要的问题。比如说,尽量不要做波 空间应用的产品,在54SX系列中,有两种型号 段去相关,或者帧间去相关。因为某一波段出错 的空间级产品,RT54SX32和RT54SX16。 或者某一帧出了问题,将会引起很严重的误码 Xilinks公司也是很好的FPGA生产厂家,用 扩散问题,而由此将影响仪器的可靠性设计。 户很多。也推出了适用于航天的Qpro Virtex系 4.2.2编码速率问题 列芯片。由于Xinlinks基于EPROM配置,调试 无损压缩的一个特征是压缩后输出码流是 成本低,升级容易,相对Actel研发周期能短一 变码速率的。但实际应用中要求输入输出都是 点,但是可靠性也许不及反熔丝结构的Actel。 恒码速率的。一般的设想是将压缩后码流放入 缓存,再以恒码速率输出。但是由于无损压缩 4算法设计问题以及压缩性能评价 的不定性,有些目标的空间频率较低,压缩率 很大,而有些地方细节特征丰富,压缩率很小, 4.1算法设计 . 甚至可能导致压缩膨胀。因此设计一个大的输 由于图像压缩算法具有图像针对性,因此 出缓存并不能完全解决问题。 首先要研究图像的具体性质,比如图像的各种 对此,有以下几种解决思想: 相关性(空间相关性、时间相关性、光谱维相关 (1)设计算法达到比较大的压缩比,有一个 性等)。从以上情况可知,对无损压缩,关键在 压缩比冗余,使绝大部分情况下都能够在输出 于如何选择最有效和最合适的DPCM预测式, 缓存饱和线下,有足够充裕的时间下传。这当 有效地进行去相关,尽可能地消除图像数据冗 然是比较理想的方法。 余度。还有选择合适的压缩编码算法,如霍夫 (2)设计一个输出缓存警告信号,在压缩比 曼编码、算术编码、LZW编码、行程编码以及 低的地方,如果输出缓存内数据来不及下传, 自适应熵编码等。而这些都需要通过对大量图 堆积到一定程度,给出警告信号。为了不让信 像数据进行实验分析后才能做到。对应用于空 号“满溢”流失,选择次优方案,比如直接去掉 间飞行器中的无损压缩系统,CCSDS推荐的赖 每个像素值的最后一位,然后进行压缩,同时 维普资讯 http://www.cqvip.com 第11期 《红外》月刊 19 给出溢出标志。在“满溢”危机过后,再跳回无 参考文献 [1】黄贤武等编著,数字图像处理与压缩编码技术, 电子科技大学出版社,2000/12. 损模式。 (3)原理同(2)方案,但是在达到压缩极限 时,干脆丢掉一些数据块,同时给出丢掉块的 标志,直到“满溢”危机后,继续进行压缩。这 样就全程无损,只是要冒丢失极少量数据的危 险。 [2】张雄伟等编著,DSP芯片的原理与开发利用,电 子工业出版社,2000/9. [3】何斌等编著,Visual c++数字图像处理,人民邮 电出版社,2001/4. 以上方案需与用户根据实际情况协商选 择。 [4】毋立芳等著,整型小波变换应用于遥感图像无损 压缩,遥感技术与应用,Vo1.15,No.3,2000/9. 4.3无损压缩评价 对无损压缩系统的性能评价主要有两方面 的指标。 (1)压缩比CR(compression rare)。压缩比是 无损压缩追求的目标,这里的压缩比应该是一 [5】王祖林,周荫清,用整数小波变换进行无失真SAR 图像压缩,北京航空航天大学学报,Vol 26,No. 3,2000/6. [6】M.Klimesh,V.Stanton,and D.Watola,HardWare Implementation of a Lossless Image Compression Algorithm Using a Field Programmable Gate Array, TMO Progress Report 42—144,February 15,2001. 个大量统计的平均值,但严格说来,压缩比是 一个针对选定图像块的瞬时值。由于图像压缩 的特征性,尤其是无损压缩绝对无失真的严格 要求,压缩比将随着目标细节特征的变化而变 化,一般在比较“平坦”一空间频率较低的 地方,压缩比比较高,而在细节特征比较丰富 [7】CCSDS 120.0-G・1.Lossless Data Compres— sion.Report Concerning Space Data System Stan— dards.Washington D.C.,May 1997.Green Book, Issue 1. 的地方,压缩比就比较小。因此对一个压缩系 统来说,对一定目标的压缩比变化程度的统计 研究是很重要的,这将直接影响到整个系统的 [8】CCSDS 121.0-B一1.Lossless Data Compression. Recommendation for Space Data System Standards. Washington D.C.,May 1997.Blue Book,Issue 1. 稳定性和容错性等。 (2)压缩系统能够处理的数据速率(bps)。对 一[9】Jack Ventrux,Greg Zweigle,Jody Gambles,Don Wiseman,Warner H.Miller and Pen—Shu Yeh,5th NASA Symposium On VLSI Design 1993. 个实际应用的压缩系统来说,数据处理速率 是另一个重要的指标,这一点更多的是针对电路 设计的要求。本课题要求的码速率为16Mbps, 相对来说不是太困难。 [10】Jack Ventrux,Greg Zweigle,Jody Gambles nd aPen‘ Shu YehI A Fixed|Variable Bit—Rate Data Corn- pression Architecture,5th NASA Symposium on VLSI Design 1993. 其他还有系统功耗和电气性能等,这里就 不多说了。 [1 1】C—C Lee.,Lossless adaptive diferential coding of im- ages,Proceedings of SPIE,Still—Image Compression, Vo1.2418,2-7,Febraury 1995. 5结束语 通过大量调研工作,本人认为,对于多光 [12】Stephen R.Tare,Band Ordering in Lossless Com- pression of Multispectral Images,IEEE Transac・ 谱遥感图像无损压缩系统的设计,CCSDS推荐 的赖斯通用无损压缩编码算法是一个很好的选 择,而对于空间飞行器应用的实时无损压缩系 tions on Computers,April 1997(Vo1.46,No.4), PP.477—483. [13】Sergei Vasilyev,Contour-Based Image Compression or Fafst Real—Time Codeing,Vo1.172,Astronomical Data Analysis Software and Systems VIII,1 999. 统,用经典的FPGA开发适于空间应用的集成 芯片电路应当可以很好地满足稳定性要求。