离散余弦变换(DCT)及其应用ppt课件.ppt
《离散余弦变换(DCT)及其应用ppt课件.ppt》由会员分享,可在线阅读,更多相关《离散余弦变换(DCT)及其应用ppt课件.ppt(89页珍藏版)》请在三一办公上搜索。
1、离散余弦变换(Discrete Cosine Transform,DCT)的变换核为余弦函数。DCT除了具有一般的正交变换性质外,它的变换阵的基向量能很好地描述人类语音信号和图像信号的相关特征。因此,在对语音信号、图像信号的变换中,DCT变换被认为是一种准最佳变换。近年颁布的一系列视频压缩编码的国际标准建议中,都把DCT作为其中的一个基本处理模块。除此之外,DCT还是一种可分离的变换。,离散余弦变换(DCT)及其应用,离散余弦变换(DCT)及其应用,1.1一维离散余弦变换一维CT的变换核定义为:,(1-1),式中,x,u=0,1,2,N1;,(1-2),一维DCT定义如下:设f(x)|x=0,
2、1,N-1为离散的信号列。,离散余弦变换(DCT)及其应用,(1-3),式中,u,x=0,1,2,N1。,将变换式展开整理后,可以写成矩阵的形式,即,F=Gf,(1-4),其中,(1-5),离散余弦变换(DCT)及其应用,一维DCT的逆变换IDCT定义为,式中,x,u=0,1,2,N1。可见一维DCT的逆变换核与正变换核是相同的。,(1-6),1.2 二维离散余弦变换 考虑到两个变量,很容易将一维DCT的定义推广到二维DCT。其正变换核为,离散余弦变换(DCT)及其应用,(1-7),式中,C(u)和C(v)的定义同式(7-48);x,u=0,1,2,M1;y,v=0,1,2,N1。二维DCT定
3、义如下:设f(x,y)为MN的数字图像矩阵,则,(1-8),离散余弦变换(DCT)及其应用,式中:x,u=0,1,2,M1;y,v=0,1,2,N1。二维DCT逆变换定义如下:,(1-9),式中:x,u=0,1,2,M1;y,v=0,1,2,N1。类似一维矩阵形式的DCT,可以写出二维DCT的矩阵形式如下:F=GfGT(1-10),离散余弦变换(DCT)及其应用,同时,由式(1-8)和式(1-9)可知二维DCT的逆变换核与正变换核相同,且是可分离的,即,(1-11),式中:C(u)和C(v)的定义同式(1-2);x,u=0,1,2,M1;y,v=0,1,2,N1。,离散余弦变换(DCT)及其应
4、用,通常根据可分离性,二维DCT可用两次一维DCT来完成,其算法流程与DFT类似,即,(1-12),1.3 快速离散余弦变换,离散余弦变换(DCT)及其应用,离散余弦变换的计算量相当大,在实用中非常不方便,也需要研究相应的快速算法。目前已有多种快速DCT(FCT),在此介绍一种由FFT的思路发展起来的FCT。首先,将f(x)延拓为,x=0,1,2,N-1x=N,N+1,2N-1,(1-13),离散余弦变换(DCT)及其应用,按照一维DCT的定义,fe(x)的DCT为,(1-14),式中,Re表示取复数的实部。,离散余弦变换(DCT)及其应用,由于 为fe(x)的2N点DFT。因此,在作DCT时
5、,可把长度为N的f(x)的长度延拓为2N点的序列fe(x),然后对fe(x)作DFT,最后取DFT的实部便可得到DCT的结果。同理对于离散余弦逆变换IDCT,可首先将F(u)延拓为,离散余弦变换(DCT)及其应用,由式(1-9)可得,DCT的IDCT为,(1-16),由式(7-63)可见,IDCT可由 的2N点的IDFT来实现。,离散余弦变换(DCT)及其应用,最后要注意的是二维DCT的频谱分布,其谱域分布与DFT相差一倍,如图1-1所示。从图中可以看出,对于DCT而言,(0,0)点对应于频谱的低频成分,(N-1,N-1)点对应于高频成分,而同阶的DFT中,(N2,N2)点对应于高频成分(注:
6、此频谱图中未作频谱中心平移)。由于DFT和IDFT已有快速算法FFT和IFFT,因此可用它们实现快速DCT和IDCT算法FCT及IFCT。不过,由于FFT及IFFT中要涉及到复数运算,因此这种FCT及IFCT算法并不是最佳的。,离散余弦变换(DCT)及其应用,图1-1 DFT和DCT的频谱分布(a)DFT频谱分布;(b)DCT频谱分布,1.4 离散余弦变换在图像压缩中的应用1.4.1图像压缩概述 多媒体数据的显著特点:数据量非常大。例如,一张彩色相片的数据量可达10MB;视频影像和声音由于连续播放,数据量更加庞大。这对计算机的存储以及网络传输都造成了极大的负担。解决办法之一就是进行数据压缩,压
7、缩后再进行存储和传输,到需要时再解压、还原。在位图格式的图像存储方式中,像素与像素之间在行方向和列方向都具有很大的相关性,我们说整体数据的冗余度很大,需要对图像数据进行很大程度的压缩,离散余弦变换(DCT)及其应用,离散余弦变换(DCT)及其应用,多媒体数据的冗余类型,多媒体数据表示中存在着大量的冗余,数据压缩技术就是利用多媒体数据的冗余性来减少数据量的方法。常见图像、视频、音频数据中存在的冗余类型如下:,1.空间冗余,2.时间冗余,3.视觉冗余,离散余弦变换(DCT)及其应用,1.空间冗余,一幅图像表面上各采样点的颜色之间往往存在着空间连贯性,基于离散像素采样来表示物体表面颜色的像素存储方式
8、可利用空间连贯性,达到减少数据量的目的。例如,在静态图像中有一块表面颜色均匀的区域,在此区域中所有点的光强和色彩以及饱和度都是相同的,因此数据有很大的空间冗余。,帧内压缩,图Bitmap颜色相同的块帧内压缩,离散余弦变换(DCT)及其应用,2.时间冗余,运动图像一般为位于一时间轴区间的一组连续画面,其中的相邻帧往往包含相同的背景和移动物体,只不过移动物体所在的空间位置略有不同,所以后一帧的数据与前一帧的数据有许多共同的地方,这种共同性是由于相邻帧记录了相邻时刻的同一场景画面,所以称为时间冗余。同理,语音数据中也存在着时间冗余。,离散余弦变换(DCT)及其应用,3.视觉冗余,人类的视觉系统由于受
9、生理特性的限制,对于图像场的注意是非均匀的,人对细微的颜色差异感觉不明显。例如,人类视觉的一般分辨能力为26灰度等级,而一般的图像的量化采用的是28灰度等级,即存在视觉冗余。人类的听觉对某些信号反映不太敏感,使得压缩后再还原有允许范围的变化,人也感觉不出来。,离散余弦变换(DCT)及其应用,数据压缩方法的分类,按照压缩方法是否产生失真分类(1)无失真压缩 无失真压缩要求解压以后的数据和原始数据完全一致。解压后得到的数据是原数据的复制,是一种可逆压缩。无失真压缩法去掉或减少数据中的冗余,恢复时再重新插到数据中,因此是可逆过程根据目前的技术水平,无损压缩算法一般可以把普通文件的数据压缩到原来的1/
10、21/4。一些常用的无损压缩算法有赫夫曼(Huffman)算法和LZW(Lenpel-Ziv&Welch)压缩算法,(2)有失真压缩 解压以后的数据和原始数据不完全一致,是不可逆压缩方式。有失真压缩还原后,不影响信息的表达例如,图像、视频、音频数据的压缩就可以采用有损压缩方法,因为其中包含的数据往往多于我们的视觉系统和听觉系统所能接收的信息,丢掉一些数据而不至于对声音或者图像所表达的意思产生误解,但可大大提高压缩比。图像、视频、音频数据的压缩比可高达100:1,但人的主观感受仍不会对原始信息产生误解。,离散余弦变换(DCT)及其应用,数据压缩方法的分类,按照压缩方法的原理分类预测编码:基本思想
11、是利用已被编码的点的数据值,预测邻近的一个像素点的数据值变换编码:基本思想是将图像的光强矩阵变换到系数空间上,然后对系数进行编码压缩统计编码:根据信息出现概率的分布特性而进行的压缩编码*无失真编码*分析合成编码:基元和特征参数混合编码:混合压缩是利用了各种单一压缩的长处,以求在压缩比、压缩效率及保真度之间取得最佳折衷,离散余弦变换(DCT)及其应用,数据压缩方法的分类,离散余弦变换(DCT)及其应用,影响数据压缩的要素,压缩比压缩前后文件大小之比,越高越好,但受速度、消耗资源等的影响图像质量还原后与原图像相比,评估的方法有客观评估和主观评估压缩与解压缩速度与压缩方法和压缩编码的算法有关,一般压
12、缩比解压缩计算量大,因而压缩比解压缩慢,离散余弦变换(DCT)及其应用,图像压缩编码举例,(1)、行程编码(RLE)现实中有许多这样的图像,在一幅图像中具有许多颜色相同的图块。在这些图块中,许多行上都具有相同的颜色,或者在一行上有许多连续的像素都具有相同的颜色值。在这种情况下就不需要存储每一个像素的颜色值,而仅仅存储一个像素的颜色值,以及具有相同颜色的像素数目就可以,或者存储像素的颜色值,以及具有相同颜色值的行数。这种压缩编码称为行程编码(run length encoding,RLE),具有相同颜色并且是连续的像素数目称为行程长度。例如,字符串AAABCDDDDDDDDBBBBB利用RLE原
13、理可以压缩为3ABC8D5B,RLE编码简单直观,编码/解码速度快,因此许多图形和视频文件,如.BMP.TIFF及AVI等格式文件的压缩均采用此方法.由于一幅图像中有许多颜色相同的图块,用一整数对存储一个像素的颜色值及相同颜色像素的数目(长度)。例如:(G,L),离散余弦变换(DCT)及其应用,图像压缩编码举例,长度颜色值,编码时采用从左到右,从上到下的排列,每当遇到一串相同数据时就用该数据及重复次数代替原来的数据串。,离散余弦变换(DCT)及其应用,图像压缩编码举例,000000003333333333222222222226666666111111111111111111111111555
14、555555555888888888888888888555555555555553333222222222222222222,(0,8)(3,10)(2,11)(6,7)(1,18)(1,6)(5,12)(8,18)(5,14)(3,4)(2,18),18*7的像素颜色仅用11对数据,离散余弦变换(DCT)及其应用,图像压缩编码举例,游程长度编码特点:直观,经济;是一种无损压缩;压缩比取决于图像本身特点,相同颜色图像块越大,图像块数目越少,压缩比越高。适用于计算机生成的图像,例如。BMP、TIF等,不适于颜色丰富的自然图像。这并不是说RLE编码方法不适用于自然图像的压缩,相反,在自然图像的压
15、缩中少不了RLE,只不过是不能单纯使用RLE一种编码方法,需要和其他的压缩编码技术联合应用。,离散余弦变换(DCT)及其应用,图像压缩编码举例,(2)、哈夫曼编码(Huffman):由于图像中表示颜色的数据出现的概率不同,对于出现频率高的赋(编)予较短字长的码,对出现频率小的编于较长字长的码,从而减少总的代码量,但不减少总的信息量。,离散余弦变换(DCT)及其应用,(1)初始化,根据符号概率的大小按由大到小顺序对符号进行排序(2)把概率最小的两个符号组成一个节点,如图4-02中的D和E组成节点P1。(3)重复步骤2,得到节点P2、P3和P4,形成一棵“树”,其中的P4称为根节点。(4)从根节点
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 离散 余弦 变换 DCT 及其 应用 ppt 课件
链接地址:https://www.31ppt.com/p-2132190.html