预测编码的基本过程: 在数字图像中,如果不是随机的噪声,那么每个像素与其周围的像素都会存在着一定的关联,关联像素差值会非常小,像素值很大程度上依赖于其邻域中其它像素的值。对于输入像素值x(n)可以首先利用已编码像素的重建值得到当前像素的预测值p(n),然后对二者的差值e(n)进行量化、熵编码。对应的解码过程为:经熵解码可以得到当前像素预测误差的重建值~e(n),将其与预测值p(n)相加即可得到当前像素的重建值~x(n)。 因此如果只存储预测误差,由预测误差也可以重构出原图像,而且这样可以降低图像中的冗余信息,实现图像的压缩。如果用前面几个样值的线性组合来预测当前的样值,称为线性预测,只用前一个样值进行预测,就称为 DPCM 。DPCM是差分预测编码调制的缩写,是比较典型的预测编码系统。在DPCM系统中,预测器的输入是已经解码以后的样本。不用原始样本来做预测的原因是因为在解码端无法得到原始样本,只能得到存在误差的样本。因此,在DPCM编码器中实际内嵌了一个解码器,如编码器中虚线框中所示。
在本次实验中,我们采用固定预测器和均匀量化器,预测器采用左侧、上方预测均可。量化器采用8比特均匀量化。 本实验的目标是验证DPCM编码的编码效率。首先读取一个256级的灰度图像,采用自己设定的预测方法计算预测误差,并对预测误差进行8比特均匀量化。 具体步骤是:采用实验二的工程文件将测试BMP文件转换到YUV格式,取Y值作实验,每一帧画面的最左边第一列元素默认以128电平值作预测,从每行的第二个像素开始均以左侧像素的重建电平值作预测操作。
1. DPCM编解码器实现的过程同时输出预测误差图像和重建图像,8bit量化测试结果如下: t01:Birds.bmp t02:lena256B.bmp t03:Clown256B.bmp t04:Camman256B.bmp t05:Noise256B.bmp t06:Odie256B.bmp t07:Zone256B.bmp t08:Fruit256B.bmp 2. 将原始图像文件、预测误差图像分别写入文件并将该文件输入Huffman编码器,得到输出码流,绘制概率分布图并计算压缩比结果如下图所示: 压缩比计算如下表: 3.结果分析:比较两种系统(DPCM+熵编码和仅进行熵编码)之间的编码效率(压缩比和图像质量)。 1. 可以明显观察到重建的图像与原始图像十分接近,而预测误差图像在边缘部分的某些差异与采取的预测方案有关。 2. 预测误差图像都为明显的灰色,电平集中分布在128附近,量化过程中我们将量化误差抬升128电平所以表明实际预测误差值集中分布在 0 左右,证明对于正常图像,相邻像素之间存在很强的关联性,利用相关性对像素量化后进行压缩压缩比会很理想。 3. DPCM+熵编码的方案比单纯只使用熵编码的效果更好,能达到很高的压缩率 4. t05:随机噪声,预测误差概率分布零散没有规律,使用 DPCM+熵编码 或者 Huffman 编码的方案进行压缩后得到的效果均不如其他有内容图片。 5. t07:虽然不是噪声图像,但是两个极端灰度值 0 和 255交替分布的,因此误差范围也很宽不易压缩。 6. 对于1、2、4、8bit量化,我想一想之后再补充。