具有感兴趣区域的静止图像压缩编码算法研究

屈育成 2017-12-01 3645

电子常识

2647人已加入

描述

　　1、静止图像压缩编码简介

　　静止的、不变的、称为静止图像，一般从设备屏幕上看长时间保持不变。被摄事务一般是静止或者某一特定时刻保持静止的。按照应用场景的不同，传输文件、模型、图片等静止图像时常用静止图像传输；现场实时监控则常用凝固图像传输。

　　要求如下：

　　①清晰度：图像清晰度更高，从而满足人眼对观察图像细节的要求，而不是利用通常电影的原理。

　　②显示方式：逐渐浮现。即先传模糊的整体图像，再逐渐传输显示细节，从而使观看者不用等待太久时间，适应窄带传输的场景。

　　③抗干扰：在较长传输过程中，编码方法要有较强的抗干扰噪声能力，防止图像呈现在终端上时质量低下。

　　以下为对静态图像编码技术的介绍：

　　①预测编码：由相邻像素间相关性出发，通过前面像素值预测当前像素值，并经过实际数据的运算得到预测误差，而该误差通常接近实际值。因此对预测误差直接进行单符号的熵编码或对预测误差进行量化再进行熵编码是更高效率的计算方法，最主要的算法则是简称为DPCM的差分脉冲编码。

　　②变换编码：是目前几乎所有的图像、视频和视频等的压缩标准的核心编码算法。而新近发展的更多图像压缩技术中，该编码也是核心的基础算法，在实际中得到广泛应用。

　　JPEG是“Join Photographic Expert Group”的首字母简写，可将每24比特的单彩色像素图像压缩至2比特，而保持较高的图像质量。其定义的编码系统主要有以下三种：a DCT有损编码基本系统，大部分压缩应用场景下均采用该系统。b可扩展编码系统：用于高压缩、高精度、渐进重建应用。c无损系统：应用于无失真场合。

　　JPEG标准一般用于自然景象、连续色调数字图像编、解码。

　　简单归纳为：两种工作方式（顺序方式、渐进方式）、三种级别（基本系统、扩展系统、无失真系统）。

　　顺序方式：将图像的行和列分割成四方小块，从左到右、由上而下逐行逐列对所有的小块进行编码运算。并且解码时也按编码顺序逐块解码。这两个过程均一次完成。

　　渐进方式：整个图像需要经过多次编码运算才能完成，初次编码时质量低于最终要求的质量。逐次编码，质量逐次提升。解码时首先解码出较低质量全幅图像，增加附加信息后再次解码，重复若干次，最终得到满足质量要求。解码过程可随时终止。

　　基本系统：以离散余弦变换为核心，以顺序工作为方式，用于一般精度。按照要求，每个压缩编码器均实现了基本算法功能。

　　扩展系统：在若干方面增强并减少一些限制条件后就成为“扩展系统”。

　　无失真系统：以DPCM技术为基础，压缩比较低，但是能实现压缩时不失真。

　　JPEG标准是多年来图像压缩编码的研究成果。虽然DCT是它的核心，但它同时也采用了DPCM、自适应量化、游程编码、可变长熵编码等多种技术，所以应该说是一种混合算法。

　　被誉为数学显微镜的小波变换是从傅里叶变换和加窗傅里叶变换发展而来的。小波变换引入伸缩参数，实现了时域－频域局域化分析，从而可以对图像的任何局部区域进行多分辨率分析。由于小波变换有高频的方向选择性，与人眼的视觉特性相吻合，人眼最重要的视觉特性是视觉掩盖效应，即不变和有的区域很容易被遗忘，而对突变和极不规则变化的区域感兴趣。采用嵌入式零树小波编码及算法，通的区域和不感兴趣区域分别进行编码，可以达到充分利用信道资源和存储空间、提高感兴趣区域的图的。

静止图像压缩

　　2、视觉掩盖效应

　　在大多数应用场合，最终的图像总是由人眼来观测的，但是人类的视觉系统并不完美。通过对人眼的观察与研究发现，视觉掩盖效应可以用于改善图像信息的处理。

　　视觉选择性与客体的特性有关，人眼对空间频率接近于零的平滑区域和空间频率相似纹理区域有很大的钝性，所以不变与规则变化的场景很容易在人的意识中被遗忘，人类视觉通常只对突变和极不规则变化的区域感兴趣。这种与生俱来的选择性使视觉只限定在有限的目标上。

　　2.1 静态对比灵敏度

　　人眼主观上可辨别的最小亮度差别所需要的最小光强差值称为亮度的辨别阀值。也就是说，当刺激光强I增大时，最初感觉不出，直到I变化到I+ΔI时人眼就感觉到亮度有变化了。人眼对亮度光强变化的响应是非线性的，比值ΔI/I称为对比灵敏度。在相当宽的光强范围内，ΔI/I保持常数为0.02，但在I很低或很高时不是常数。如果有背景，则对比灵敏度不仅与目标物的光强度I有关，而且与背景亮度I。有关。图1给出了有背景和无背景时人眼的静态对比灵敏度曲线。

静止图像压缩

　　此外，人眼的对比灵敏度还与刺激的空间变化周期（空间变化周期是指刺激的明暗不变，只改变明暗的空间间隔）有关。如果亮度固定在一定水平下，则对比灵敏度与光刺激的空间变化周期之间的关系如图2所示。这一关系通常被称为人眼的调制传递函数。图2中还给出了等亮度的色差信号Y-R和Y-B的对比灵敏度曲线。由图1和图2可得到以下结论：

　　（1）恢复图像的误差如果低于对比灵敏度，则不会被人眼觉察。

　　（2）高频部分在相同的灵敏度阈值下，色差信号Y-R的空间频率只有亮度Y的一半，Y-B则为Y的1/4，通常表示色差信号所需的像素比亮度要少得多。

　　（3）在相同的灵敏度阈值下，斜向栅格的空间频率只有正常栅格的0.7，因此按斜向栅格对图像数据采样所需的频率较低。

静止图像压缩

　　（4）高频端的灵敏度要小于低频端，因此对这些部分的量化误差可大一些。

　　2.2 具有感兴趣区域的人眼视觉特性

　　人们在观察和理解图像时常常不自觉地对其中某些区域产生兴趣，把这些区域称为视觉感兴趣区域。整幅图像的主观视觉质量取决于感兴趣区域的视觉质量，而不感兴趣区域的降质常常不易被人觉察，对整幅图像视觉质量的影响较小。例如对一副人像照片，反映一个人主要特征的是面部信息，在进行图像压缩时，人的面部信息与其它不重要的信息不必采用相同的压缩比。显然，感兴趣区域的视觉特性也是一种视觉掩盖效应。

　　3、嵌入式零树小波编码及算法

　　3.1 EZW编码

　　一幅图像经过三级小波分解后形成十个子带，如图3所示。小波系数的分布特点是越往低频子带，系数值越大，包含的图像信息越多。如图3中的LL3子带，越是高频子带，系数值越小，包含的图像信息越小。在系数数值相同时，低频子带反映图像的低频信息，对视觉比较重要；而高频子带反映图像的高频信息，对视觉不太重要。应选择先传输较低频系数的重要比特，后传输较高频系数的重要比特。正是由于小波系数具有的这些特点，它非常适合于嵌入式编码算法。

静止图像压缩

　　嵌入式零树小波编码EZW（Embedded Zerotree Wavelet）方法是对整幅图像进行同一级别编码的方法，图像中的重要区域（感兴趣区域）与背景区域（非感兴趣区域）具有同样的编码级数。EZW编码算是一个简单而有效的图像编码算法，这种算法得到的比特流中的比特按其重要性排序。使用这种算法，编码者能够在任一点结束编码，允许精确到任一个目标比特率或目标失真率。

　　3.2EZW算法

　　EZW算法利用小波系数的特点较好地实现了图像编码的嵌入功能，为了改善小波系数重要图的压缩，定义了一个零数的数据结构，即一个小波系数χ。对于一个给定的门限T，如果|χ| 则称小波系数¦Ö是不重要的一个小波系数在一个粗尺度上，关于给定的门限是不重要的，且之后在较细的尺度上，对同样空间位置中的所有小波系数关于给定的门限Ｔ也是不重要的，则称小波系数形成了一个零数。这时，在粗尺度上的那个小波系母代小波系数，它是树根，在较细尺度相应位置上的小波系数称为了代小波系数。如果一个小波系数不重要的，但它的子代小波系数中关于门限Ｔ是重要的系数，则称这个小波系数是孤立零。因此，小波系情况：零数根（ＺＴＲ）、孤立零。因此，小波系数有三种情况：零数根（ＺＴＲ）、孤立零（ＩＺ）、重要系然，为了编码的需要还可把重要系数分为正重要系数（ＰＯＳ）和负重要系（ＮＥＧ）。

　　对于一个图像的数据流，图４给出了一个系数编码的流程图。

　　4、具有感兴趣区域的静止图像压缩编码算法研究

　　4.1 EZW_ROI编码算法

　　为了提高感兴趣区域的图像质量，在信道资源和存储空间有限的条件下，提出感兴趣区域的零树编码算法EZW_ROI（Embedded Zerotree Wavelet with Region of interests），它对感兴趣区域图像和背景图像采用不同的压缩步骤，使感兴趣区域内的图像比背景图像具有更好的图像质量。

　　对感兴趣区域内外的图像采用不同的零数小波编码。整个编码算法分三步进行：

　　（1）确定感兴趣区域：人像照片可以把感兴趣区域确定为面部区域。在视频监视系统中，可以把监视环境中的重要场景设为感兴趣区域。

　　（2）对低频子带中感兴趣区域内的系数进行编码：即对感兴趣区域内的图像进行编码，系数采用EZW算法的零树结构，按照EZW算法的思想进行零树扫描和编码。

　　（3）对低频子带中不在感兴趣区域内的系数进行编码：即对背景区域的图像进行编码，系数的编码不用EZW算法的零树结构，只对背景区域的低频信息进行编码。

静止图像压缩

　　4.2 EZW_ROI解码算法

　　对编码图像进行解码时，与编码过程相反，也分三步进行：

　　（1）对低频子带中的感兴趣区域内图像进行与EZW算法同样的零树编码。

　　（2）对低频子带中的感兴趣区域外图像进行简单的位解码。

　　（3）消除边缘效应：在以上两步的基础上，对感兴趣区域的四周做3%26;#215;3的均值滤波，以消除感兴趣区域边缘的影响，使得感兴趣区域外的图像在视觉上差别变弱。

静止图像压缩

　　5、应用实例

　　在研究中采用了一幅标准的8bpp的灰度人像，首先，确定感兴趣区域为人像的面部，对原始图像进行四级的小波分解，小波变换采用S+P变换；最后对图像进行32倍压缩，即压缩后的比特率为0.25bpp。用EZW算法和EZW_ROI算法恢复的图像如图7所示。在信道资源和存储空间有限的条件下，为了提高感兴趣区域的图像质量，采用具有感兴趣区域的图像压缩方式，对感兴趣区域背景图像采用不同的压缩步骤，使图像中的重要信息尽可能少损失。试验证明，在高压缩比的情况下，EZW_ROI算法的重建图像比EZW算法的重建图像具有更好的视觉效果。

打开APP阅读更多精彩内容

具有感兴趣区域的静止图像压缩编码算法研究

描述

1、静止图像压缩编码简介

2、视觉掩盖效应

2.1 静态对比灵敏度

2.2 具有感兴趣区域的人眼视觉特性

3、 嵌入式零树小波编码及算法

3.1 EZW编码

3.2EZW算法

4、具有感兴趣区域的静止图像压缩编码算法研究

4.1 EZW_ROI编码算法

4.2 EZW_ROI解码算法

5、应用实例

　　1、静止图像压缩编码简介

　　2、视觉掩盖效应

　　2.1 静态对比灵敏度

　　2.2 具有感兴趣区域的人眼视觉特性

　　3、嵌入式零树小波编码及算法

　　3.1 EZW编码

　　3.2EZW算法

　　4、具有感兴趣区域的静止图像压缩编码算法研究

　　4.1 EZW_ROI编码算法

　　4.2 EZW_ROI解码算法

　　5、应用实例