欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第7信源编码.ppt

    • 资源ID:4722436       资源大小:1.14MB        全文页数:79页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第7信源编码.ppt

    1,第 7 章 信源编码,本章要点,抽样定理 脉冲编码调制(PCM)调增量调制(M)-M、DPCM和数字音节压扩系统 语音与图像压缩编码简介,2,1 抽样 概念:抽样又可称为取样或者采样。任务:是对模拟信号进行时间上的离散化处理,即每隔一段时间对模拟信号抽取一个样值。2 抽样定理,7.1 抽样定理,一个频带限制在(0,fH)Hz内时间连续的信号m(t),如果以1/2fH 的时间对其进行等间隔抽样,则m(t)将被得到的抽样值完全确定。,3,抽样定理模型可用一个乘法器表示,即 ms(t)=m(t)s(t)式中:s(t)是重复周期为Ts、脉冲幅度为1、脉冲宽度为 的周期性脉冲序列,即抽样脉冲。,可以看出:s(t)1时,ms(t)m(t);s(t)0时,ms(t)0,4,样值信号频谱:S(t)的傅里叶级数表示为:式中:,则:,5,若m(t)为单一频率的正弦波,即 则式中各项所包含的频率成分分别为:第一项:,第二项:s;第三项:2;第n项:n 结论:抽样后信号的频率成分除含有外,还有ns的上、下边带;第一项中包含了原模拟信号的全部信息,只是幅度差 倍。,6,若m(t)信号的频率为fLfH,即为一定带宽信号,其m(t)、s(t)、ms(t)信号频谱及波形如图所示。,7,结论:只要频谱间不发生重叠现象,在接收端就可通过截止频率为fc=fH的理想低通滤波器从样值信号中取出原模拟信号。因此,对于低频频率fL很低,最高频率为fm的模拟信号来说,只要抽样信号频率fs2fm,在接收端就可不失真地取出原模拟信号。抽样信号s(t)的重复频率fs必须不小于模拟信号最高频率的两倍,即fs2fm,它是模拟信号数字化的理论根据。实际滤波器的特性不是理想的,因此常取fs2fm。在选定fs后,对模拟信号的fm必须给予限制。其方法为在抽样前加一低通滤波器,限制fm,保证fs2fm。,8,3 信号的重建 利用一低通滤波器即可完成信号重建的任务。由前面分析知道,样值信号中原模拟信号的幅度只为抽样前的 倍。因为很窄,所以还原出的信号幅度太小。为了提升重建的语音信号幅度,通常采取加一展宽电路,将样值脉冲展宽为Ts,从而提升信号幅度。理论和实践表明:加展宽电路后,在PAM信号中,低频信号提升的幅度多,高频信号提升的幅度小,产生了失真。为了消除这种影响,在低通滤波器之后加均衡电路。要求均衡电路对低频信号衰减大,对高频信号衰减小。,9,在数字通信系统中,脉冲编码调制通信是数字通信的主要形式之一。一个基带传输PCM单向通信系统如图所示。,7.2 脉冲编码调制(PCM),10,发信端:完成A/D变换,主要步骤为抽样、量化、编码。收信端:完成D/A变换,主要步骤是解码、低通滤波。信号在传输过程中要受到干扰和衰减,所以每隔一段距离加一个再生中继器,使数字信号获得再生。为了使信码适合信道传输,并有一定的检测能力,在发信端加有码型变换电路,收信端加有码型反变换电路。,11,抽样、量化、编码过程的示意图:,图b:根据抽样定理,m(t)经过抽样后变成了时间离散、幅度连续的信号mS(t)。图c:将其送入量化器,就得到了量化输出信号mq(t)。这里采用了“四舍五入”法将每一个连续抽样值归结为某一临近的整数值,即量化电平,这里采用了8个量化级,将图(b)中7个准确样值4.2、6.3、6.1、4.2、2.5、1.8、1.9分别变换成4、6、6、4、3、2、2。图d:量化后的离散样值可以用一定位数的代码来表示,也就是对其进行编码。因为只有8个量化电平,所以可用3位二进制码来表示。图d是用自然二进制码对量化样值进行编码的结果。,12,二进制编码位数与量化电平数目的关系:如果有M个量化电平,则需要的二进制码位数n为,进制编码位数与量化电平数目M的关系:如果用进制脉冲进行编码,n个码元所代表的量化电平数目为,但实际中,实现这种方法的电路较复杂,因此,实用电路中常常在发信端采用取整量化,在收信端再加上半个量化级差的方法。,13,7.2.1 量化1.量化的任务 将抽样后的信号在幅度上离散化,即将模拟信号转换为数字信号。做法:将PAM信号的幅度变化范围划分为若干个小间隔,每一个小间隔叫做一个量化级。相邻两个样值的差叫做量化级差,用表示。当样值落在某一量化级内时,就用这个量化级的中间值来代替。该值称为量化值。2.量化误差 用有限个量化值表示无限个取样值,总是含有误差的。由于量化而导致的量化值和样值的差称为量化误差,用e(t)表示。即 e(t)量化值-样值,14,15,当输入信号幅度在44之间时,量化误差的绝对值都不会超过/2,这段范围称为量化的未过载区。在未过载区产生的噪声称为未过载量化噪声。当输入电压幅度u(t)4或u(t)4时,量化误差值线性增大,超过/2,这段范围称为量化的过载区。在量化过载区产生的噪声称为过载量化噪声。,过载量化噪声在实用中应避免,16,3.均匀量化中量化噪声对通信的影响 通信中常用信噪比表示通信质量。量化信噪比:指模拟输入信号功率与量化噪声功率之比。对一正弦信号,均匀量化的信噪比为:()dB1.766n20lg 对一语音信号,均匀量化的信噪比为:()dB6n920lg 式中,n:二进制码的编码位数;Um:有用信号的幅度;+V-V:未过载量化范围。我们把满足一定量化信噪比要求的输入信号取值范围定义为量化器的动态范围。,17,结论:为保证通信质量,要求在信号动态范围达到40dB(即20lg 40dB)时,信噪比()dB26dB 261.766n40 解得n10.7,即在码位n11时,才满足要求。信噪比同码位数n成正比,即编码位数越多,信噪比越高,通信质量越好。每增加一位码,信噪比可提高6dB。有用信号幅度Um越小,信噪比越低。语音信号信噪比比相同幅值的正弦信号输入时信噪比低11dB。,18,均匀量化信噪比的特点:码位越多,信噪比越大;在相同码位的情况下,大信号时信噪比大,小信号时信噪比小。二.非均匀量化 1非均匀量化 非均匀量化是对大小信号采用不同的量化级差,即在量化时对大信号采用大量化级差,对小信号采用小量化级差。这样就可以保证在量化级数(编码位数)不变的条件下,提高小信号的量化信噪比,扩大了输入信号的动态范围。,19,一个非均匀量化的具体分析:,幅值为正时的量化特性,过载电压V4,其中为常数,其数值视实际而定。量化级数M8,幅值为正时,有四个量化级差。从图中看出:在靠近原点的(1)、(2)两级量化间隔最小且相等(120.5),其量化值取量化间隔的中间值,分别为0.25和0.75;以后量化间隔以2倍的关系递增。所以满足了信号电平越小,量化间隔也越小的要求。,20,2压缩与扩张 实现非均匀量化的方法之一是采用压缩扩张技术,其特点是在发送端对输入模拟信号进行压缩处理后再均匀量化,在接收端进行相应的扩张处理。如图所示。,由图中看出,非线性压缩特性中,小信号时的压缩特性曲线斜率大,而大信号时压缩特性曲线斜率小。经过压缩后,小信号放大变成大信号,再经均匀量化后,信噪比就较大了。在接收端经过扩张处理,还原成原信号。压缩和扩张特性严格相反。,21,3A律压缩特性 A律压缩特性公式为:,式中A为压缩系数,表示压缩程度。在上图的曲线中:A1时,y=x,为无压缩即均匀量化情况。A值越大,在小信号处斜率越大,对提高小信号信噪比越有利。,22,4A律13折线压缩特性 将第象限的y、x各分8段。Y轴均匀的分段点为1、7/8、6/8、5/8、4/8、3/8、2/8、1/8、0。X轴按2的幂次递减的分段点为1、1/2、1/4、1/8、1/16、1/32、1/64、1/128、0。这8段折线从小到大依次为、段。各段斜率分别用k1、k2k7、k8表示 k116、k216、k38、k44、k52、k61、k71/2、k81/4。第、段斜率最大,说明对小信号放大能力最大,因此信噪比改善最多。,23,x、y为负值的第象限的情况:由于第象限和第I象限的第、的斜率相同,可将此四段视为一条直线,所以两个象限总共13段折线,称为13折线。实际中A87.6时,其13折线压缩特性与A律压缩特性相似。因此简称13折线A律特性或13折线特性。A律13折线压缩特性对小信号信噪比的改善是靠牺牲大信号的量化信噪比换来的。非均匀量化后量化信噪比的公式可表示为:()dB1.766n20lg 1.766n20lg 20lg 式中,20lg 为量化信躁比的改善量,24,13折线各段折线的斜率及量化信噪比的改善量,根据以上分析,采用13折线压缩特性进行非均匀量化时,编7位码(即n7)就可满足输出信噪比大于26dB的要求。,25,5 律压缩特性 律压缩特性公式为:y(0 x1,0y1),其中为压缩系数,如图所示。0时,相当于无压缩情况。实用中取255,律压缩特性可用15折线来近似。,1=0,26,极性码:x1=1 表示正样值,x1=0 表示负样值,27,每个大段落区间称为段落差,符合2的幂次规律,即每一段的段落差是前一段的两倍(第一段除外)每个大段的起始值称为起始电平 每个大段落分为16个均匀的小段 每个小段的间隔即为量化级差i(i18),28,每一段落的量化级差不等,从而实现了大信号量化级差大,小信号量化级差小,改善了小信号时的量化噪声的影响,这进一步说明了非均匀量化的实质。用表示,共2(161162163168)4096。若按进行均匀量化时,相当于(2124096)编12位码,因此可以看出,利用压缩扩张法提高了小信号信噪比,在直接非均匀量化编码中,得到了完全等效的体现,因此,实际线路中不必单独配置压扩器和均匀量化器。,29,2编码器 PCM系统常用的编码方式有:逐次反馈型编码器、级联型编码器和混合型编码器。(1)逐次反馈型编码器组成原理 段内码x5x8的权值的确定:,ur5=段落起始电平 段落差,ur6=段落起始电平 段落差 段落差,ur7=段落起始电平 段落差 段落差 段落差,ur8=段落起始电平 段落差 段落差 段落差 段落差,30,31,x1 x2 x3 x4 x5 x6 x7 x8 取样值为1270的PCM码为 1 1 1 1 0 0 1 1 在收端,解码电平码字电平1/2812161/2641248 量化误差22,(2)编码器的构成,32,极性判决电路是将样值信号us与下权值ur10进行比较,根据样值的正或负确定极性码x1是1还是0。幅度比较电路是根据全波整流电路送来的us和uri(i28)的比较结果确定幅度码x2x8。本地解码电路由记忆电路,7/11变换电路,11个控制逻辑开关和11个恒压源(或恒流源)组成。3.解码器 解码器是完成数模变换的部件,通常又称为数模变换器,简记为DAC。PCM接收端译码器的工作原理与本地译码器基本相同,唯一不同之处是接收端译码器在译出幅度的同时,还要恢复出信号的极性。,33,4.2.3 PCM系统的噪声性能 PCM系统输出的信号是模拟信号,因此系统的可靠性仍然可用系统输出信噪比来衡量。PCM系统的噪声来自两方面,即量化过程中形成的量化噪声,以及在传输过程中经信道混入的加性高斯白噪声。因此通常将PCM系统输出端总的信噪比定义为,式中,S0系统输出端信号的平均功率;Nq系统输出端量化噪声的平均功率;Ne系统输出端信道加性噪声的平均功率。,34,一.量化对噪声系统的影响 PCM系统输出端的量化信号与量化噪声的平均功率比为,对于二进制编码,设其编码位数为n,则上式又可写为,二.加性噪声对系统的影响 仅考虑信道加性噪声时PCM系统的输出信噪比为,35,三.PCM系统接收端输出信号的总信噪比 可求得PCM系统输出端总的信号噪声功率比为,当误码率较低时,例如Pe 10-6,PCM系统的输出信噪比主要取决于量化信噪比S0/Nq。当信道中信噪比较低,即误码率Pe较高时,PCM系统的输出信噪比取决于误码率,且随误码率Pe的提高而下降。一般来说,Pe=10-6是很容易实现的,所以加性噪声对PCM系统的影响往往可以忽略不计,这说明PCM系统抗加性噪声的能力是非常强的。,36,7.3 增量调制(M),7.3.1 增量调制的基本原理 将信号瞬时值与前一个抽样时刻的量化值之差进行量化,而且只对这个差值的符号进行编码。因此量化只限于正和负两个电平,即用一位码来传输一个抽样值。如果差值为正,则发“1”码;如果差值为负,则发“0”码。显然,数码“1”和“0”只是表示信号相对于前一时刻的增减,而不代表信号值的大小。这种将差值编码用于通信的方式就称为增量调制。,37,发送端:m(t)是一个频带有限的模拟信号 时间轴t被分成许多相等的时间段t;把代表m(t)幅度的纵轴也分成许多相等的小区间;模拟信号m(t)可用如图所示的阶梯波形m(t)来逼近。编码:“1”码表示上升一个台阶“0”码表示下降一个台阶 m(t)可以用一串二进码序列来表示,从而实现了模/数转换。接收端:每收到一个“1”码就使输出上升一个值,每收到一个“0”码就使输出下降一个值,当收到连“1”码时,表示信号连续增长,当收到连“0”码时,表示信号连续下降。这样就可以恢复出与原模拟信号m(t)近似的阶梯波形m(t),从而实现了数/模转换。,38,增量调制系统框图:,39,积分器的输入与输出波形:积分器的输出波形并不是阶梯波形,而是一个斜变波形。但因E=,故在所有抽样时刻ti上斜变波形与阶梯波形有完全相同的值。因而,斜变波形与原来的模拟信号相似。积分器输出的斜变波经低通滤波器之后就变得十分接近于信号m(t)。,40,7.3.2 量化噪声和过载噪声 1.量化噪声 由于M信号是按台阶来量化的,因而也必然存在量化误差eq(t),也就是所谓的量化噪声。量化误差可以表示为,正常情况下,eq(t)在(-,+)范围内变化。设随时间变化的eq(t)在区间(-,+)上均匀分布,则eq(t)的平均功率可表示成,上式表明,M的量化噪声功率与量化阶距电压的平方成正比。因此若要想减小Nq,就应减小阶距电压。,41,2.过载噪声 因为在M中每个抽样间隔内只容许有一个量化电平的变化,所以当输入信号的斜率比抽样周期决定的固定斜率大时,量化阶的大小便跟不上输入信号的变化,因而产生斜率过载失真,它所产生的噪声称为斜率过载噪声。如图所示。,42,(2)不发生过载失真的条件 m(t)每隔Ts时间增长,因此其最大可能的斜率为/Ts。而模拟信号m(t)的斜率为d m(t)/d t。为了不发生过载失真,必须使信号的最大可能斜率小于斜变波的斜率,即有,:信号m(t)的最大斜率。当输入是单音频信号m(t)=Acos t时,此时,43,为了控制量化噪声,则量化阶距电压不能过大。因此若要避免过载噪声,在信号幅度和频率都一定的情况下,只有提高频率fs,即使fs满足,一般情况下,A,为了不发生过载失真,fs的取值远远高于PCM系统的抽样频率。例如,M系统的动态范围(D)M定义为最大允许编码幅度Amax=fs/2f与最小可编码电平Amin=/2的之比,即,44,若设语音信号的频率为f=1kHz,并要求其变化的动态范围为40dB,则有,因此不发生过载,fs的取值为 在PCM系统中,对于频率为1kHz的语音信号进行抽样,抽样频率为2kHz。与之相比,M系统的fs比PCM系统的抽样频率大很多。在抽样频率和量化阶距电压都一定的情况下,为了避免过载发生,输入信号的频率和幅度关系应保持在图中过载特性所示的临界线之下。,45,在临界情况下,该式说明,输入信号所允许的最大幅度与fs成正比,与输入信号的频率成反比,因此输入信号幅度的最大允许值必须随信号频率的上升而下降。频率增加一倍,幅度必须下降6dB。这正是增量调制不能实用的原因。在实际应用中,多采用M的改进型总和增量调制(-M)系统和数字压扩调制。,46,7.3.3 增量调制系统的抗噪声性能 一.量化产生的量化信噪比 M系统输出最大的信噪比为:,式中:fs为抽样频率,fc为信号的频率,fm为低通滤波器的截止频率。二.由于加性干扰噪声的误码信噪比,47,考虑到量化信噪比及误码信噪比,M系统输出总信噪比由下式决定,当误码率很小时,M系统的输出信噪比主要由量化信噪比决定。,7.3.4 PCM和M的性能比较 在不同的n值情况下,PCM与M系统的比较曲线如图所示。可以看出,在相同的传输速率下,如果PCM系统的编码位数n小于4,则它的性能将比f=1000Hz,fm=3000Hz的M系统差;如果n4,PCM的性能将超过M系统,且随n的增大,性能越来越好。,48,增量调制与PCM比较有如下特点:1在比特率较低时,增量调制的量化信噪比高于PCM;2增量调制抗误码性能好,可用于比特误码率为 102103 的信道,而PCM则要求104106;3增量调制通常采用单纯的比较器和积分器作编译码器(预测器),结构比PCM简单。,49,7.4-M、DPCM和数字音节压扩系统,7.4.1 总和增量调制(-M)我们知道,对于高频成分丰富的输入信号m(t),由于其在波形上急剧变化的时刻比较多,所以,如果直接进行M调制,则往往造成阶梯波形m(t)跟不上m(t)的变化,产生比较严重的过载噪声;而对低频成分丰富的输入信号m(t),由于其在波形上缓慢变化的时刻比较多,当幅度的变化在/2以内,又会出现连续的“0”、“1”交替码,导致信号平稳期间幅度信息的丢失。总和增量调制技术解决了这一问题,其基本思想是,在发送端让输入信号m(t)先通过一个积分器,然后再进行增量调制。,50,积分器的作用是使m(t)波形中原来变化急剧的部分变得缓慢,而原来变化平直的部分变得比较陡峭,这样就可以解决原输入信号急剧变化时易出现过载失真和缓慢变化时易出现空载失真的问题。由于对m(t)先积分再进行增量调制,所以在接收端解调以后要再增加一级微分器,以便恢复出原信号。实际上,由于接收端的积分器和微分器的相互抵消作用,所以,在-M系统的接收端只需要一个低通滤波器就可以恢复出原信号。其系统构成框图如图所示。,51,与M系统类似,-M系统也会发生过载现象。在-M系统中,输入信号先经过积分器,然后再进行增量调制。这时上图中减法器的输入信号为,因此,-M系统不发生斜率过载的条件应为,由于,所以上式又可写为,为了与M系统比较,仍设输入为单音频信号m(t)=Asinkkt。若要求不发生过载现象,则必须满足,52,或写为,由此看出,-M系统不发生过载的条件与信号的频率fk无关。这意味着-M系统不仅适合于传输缓慢变化的信号,也适合于传输高频信号。由于两个信号积分后的结果相减,与先相减后积分是等效的,所以图4.22中的差值信号e(t)可以写成,这样就可以把发送端的两个积分器合并成为在相减器后的一个积分器。合并后的-M系统组成如下图所示。,53,7.4.2 数字压扩自适应增量调制 在增量调制系统中,量化阶距是固定不变的。因此,当输入信号出现剧烈变化时,系统就会过载。为了克服这一缺点,希望值能随f(t)的变化而自动地调整大小,这就是自适应增量调制(AM)的概念。它的基本思想是要求量阶随输入信号m(t)的变化而自动地调整,即在检测到斜率过载时开始增大量阶;斜率减小时降低量阶。目前,自适应增量调制的方法有多种,采用较为广泛的是数字压扩增量调制系统,它是数字检测、音节压缩与扩张自适应增量调制的简称,其工作原理框图如下图所示。,54,与M系统相比,增加了数字检测电路、平滑电路和脉冲幅度调制电路。数字检测指的是,自适应地改变量阶的控制信息。音节是指输入信号包络变化的一个周期。这个周期一般是随机的,但大量统计证明,这个周期趋于某一固定值。确切讲,音节指的就是这个固定值。对于话音信号而言,一个音节一般约为10ms。那么,音节压扩指的是量阶并不瞬时地随输入信号幅度变化,而是随输入信号的音节变化。,55,由M系统的原理可知,在输入信号斜率的绝对值很大时,M系统的编码输出中就会出现很多的连“1”码(对应正斜率)或连“0”码(对应负斜率)。连“1”或连“0”码的数越多,说明信号的斜率就越大。可见,编码输出信号中包含着斜率大小的信息。数字检测器的作用就是检测连“1”或连“0”码的长度。当它检测到一定长度的连“1”或连“0”码时,就输出一定宽度的脉冲,连“1”或连“0”码越多,检测器输出的脉冲宽度就越宽。然后,将这个输出脉冲加到平滑电路进行音节平均。平滑电路实际上是一个积分电路,它的时间常数与语音信号的音节相近(为5 20ms)。因此,它的输出信号是一个以音节为时间常数缓慢变化的控制电压,其电压的幅度与语音信号的平均斜率成正比。在这个电压的作用下,PAM使输入端的数字码流脉冲幅度得到加权。控制电压越大,PAM输出的脉冲幅度就越高,反之就越低。这就相当于本地译码输出信号的量化阶距随控制电压的大小线性地变化。由于控制电压在音节内已被平滑,因此可以认为在一个音节内它基本上是不变的,在不同的音节内才发生变化。,56,7.4.3 差分脉冲编码调制(DPCM)在图像编码中一般采用差分脉冲编码调制(DPCM)来压缩数码率,其工作原理如图所示。DPCM综合了PCM和M的特点。它与PCM的区别是:PCM系统是对信号抽样值进行独立编码,与其它抽样值无关,而DPCM则是对信号抽样值与信号预测值的差值进行量化、编码。它与M的区别是:M系统是用一位二进码表示增量,而在DPCM中是用N位二进码表示增量。所以说它是介于PCM和M之间的一种调制方式。,57,由于DPCM是对差值进行编码,而差值信号的幅度要比原始信号的幅度小得多,因此可以用较少的位数对差值信号进行编码。在较好图像质量的情况下,每一抽样值只需4比特就够了,所以大大压缩了传送的比特率。另外,在比特率相同的条件下,DPCM比PCM信噪比改善1417dB。与M相比,由于它增加了量化级,所以它的信噪比改善程度也优于M。,58,DPCM的缺点是抗传输噪声的能力差,即在抑制信道噪声方面不如M。因为发生误码时在M中只产生一个增量的变化,而在DPCM中就可能产生几个量阶的变化,从而输出较大的输出噪声。因此,DPCM很少独立使用,一般要结合其它的编码方法使用。,59,7.4.4 增量调制解调器芯片 MOTOROLA公司生产的连续可变斜率增量调制解调器(CVSD)电路芯片共有四种,它们是MC3417、MC3418、MC3517和MC3518。相同功能的芯片还有HARRIS公司生产的HC55564、HC55536等。这些芯片主要应用在低传输数码率的军事、野外及保密数字电话通信设备和M程控数字交换机中,右图所示为MC3418的原理功能框图。,60,话音、图像、数据等都是携带信息的主要载体,其中语音和图像属模拟信号范畴。由于数字通信和模拟通信比较有较多的优点,将语音和图像信号通过编码以实现数字化是必然趋势。但数字化的语音和图像与模拟时相比,需要用较高的数码率,占用较大的带宽和存储空间,是语音和图像数字化的主要障碍。压缩数字化语音和图像信信号的数码率是实现语音和图像数字化的关键。编码技术的核心就是研究编码算法,用尽可能低的数码率获得尽可能好的语音和图像质量。,7.5 语音与图像压缩编码简介,61,7.5.1 语音压缩编码简介 音频信号可分为话音信号和声音信号两大类。语音信号通常又被称为话音信号,一般是指人讲话时发出的声音,其频率范围通常为0.33.4kHz。语音信号是公用电话交换网传输的对象。在传输速率一定的情况下,衡量语音压缩算法好坏的主要指标是重建信号的可懂度和自然度。而声音信号是指人的听觉器官所能分辨的声音,通常又称其为自然声,其频谱从3Hz、4Hz一直扩展到20kHz以上。对声音压缩的基本要求是高的抽样率,好的时间/频率分辨率,大的动态范围和低的失真度,且对音源的性质没有任何假设。,62,从编码方法上讲,语音压缩编码可以分为波形编码、参量编码和混合编码三大类。波形编码方法可以获得较高的语音质量,但数据压缩量不大。常见的语音编码国际标准有脉冲编码调制(PCM)的律或A律压缩,即国际电信联盟ITUT的G.711标准;自适应差分脉码调制(ADPCM),即ITUT的G.721标准;子带编码的自适应脉码调制(SBADPCM),即ITUT的G.722标准等等。,63,参量编码是根据输入语音信号分析出模型参数,并传送给接收端,接收端根据得到的模型参数重新合成语音信号。这种编码方法并不是忠实地反映输入信号的原始波形,而是着眼于人耳的听觉特性,以保证解码语音信号的可懂度和自然度为目标。参量编码可以大大地降低编码速率。混合编码是把波形编码的高质量和参量编码的低数据率相结合,因此可以得到较高的语音质量和较好的压缩效果,是语音编码的发展方向。,64,其中效果较好的混合编码方法有多脉冲线性预测编码MPLPC、码激励线性预测编码CELPC(Code Excited Liner Prediction Coding);规则脉冲激励长时预测LPC编码RPELTP(Regular Pulse ExcitedLong Term Prediction);低延时码激励LPC编码LDCELPC(Low DelayCELPC)等。它们是靠传输语音的基本参数,如基音周期、共振峰、语音谱或声强等来压缩语音信号的冗余度,因此压缩比一般都较高。,65,相应的国际标准有1992年ITUT推荐的低延时码激励LPC编码(LDCELPC)标准G.728,其传输速率为16kb/s,延时小于2ms,音质可以达到ADPCM的32kb/s编码水平。1996年ITUT推出了G.723极低码率语音压缩编码标准,传输速率为5.27kb/s和6.3kb/s两档,采用ACELPC方法。与其它相同码率的语音编码方法相比较,这两种编码方法都具有较高的语音质量和较低的编码延时(3040ms)。,66,对于声音压缩编码,国际标准化组织(ISO)推出的MPEG1(Moving Picture Experts Group)声音编码算法作为一种开放、先进、可分级的编码技术,是高保真声音压缩领域的第一个国际标准(ISO 111723)。MPEG系列标准是关于视频和音频的压缩标准,有关图像压缩的内容将在后面介绍。MPEG1声音编码算法按照复杂度和压缩比递增分为一、二、三层。第一层的复杂度最低,在每声道192kb/s提供高质量的声音;第二层有中等复杂度,可在128 kb/s的速率提供近CD质量的声音;,67,第三层结合了MUSICAM(Masking Patern Universal Subband Integrated Coding And Multiplexing)和ASPEC的优点,可在每声道低于128 kb/s的速率获得满意的质量。在使用时,可以根据不同的应用要求,使用不同的层来构成音频编码器。由于MUSICAM只能传送两个声道,为此MPEG开展了低码率多声道编码方面的研究,将多声道扩展信息附加到MPEG-1音频数据帧结构的辅助数据段中,这样可以将声道扩展到5.1个,即3个前声道(左L、中C和右R)、两个环绕声道(左LS和右RS)和一个超低音声道LFE(常称为0.1),由此形成了MPEG-2音频编码标准(ISO 13818-3)。,68,MPEG-2音频编码标准通常被称为MUSICAM环绕声。ISO于1998年公布的MPEG-4声音编码标准将语音合成与自然音编译码相结合,更加注重多媒体系统的交互性和灵活性。MPEG-4支持2 kb/s64 kb/s的自然声编码,在技术上借鉴了已有的音频编码标准,如G.732、G.728、MPEG-1、MPEG-2等。为了在整个传输速率范围内得到较高的音频质量,规定了三种类型的编译码器:参量编译码器,用于比特率从210 kb/s的语音编码;码激励线性预测编译码器,用于中比特率616 kb/s的语音编码;采用以MPEG2音频编码和矢量化技术的编译码器,用于高达64 kb/s的声音编码。,69,几种音频压缩编码的比较:,70,7.5.2 图像压缩编码简介 由于图像信号经过数字化以后,数码率极高,可达216Mb/s,所以,如果将PCM数字图像用于传输与存储显然是不可取的,因而必须进行数据压缩。1.图像压缩机理 能够进行图像压缩的机理主要来自两个方面,一是图像信号中存在着大量的冗余度可供压缩,这种冗余度在解码之后可无失真地恢复;二是利用人眼的视觉特性,在不被主观视觉察觉的容限内,通过减少信号的精度,以一定的客观失真换取数据压缩。,71,图像信号的冗余度存在于结构和统计两个方面。图像信号结构上的冗余度表现为很强的空间(帧内的)和时间(帧间的)相关性。图像信号统计上的冗余度来源于被编码信号概率分布的不均匀性由于图像的最终接受者是人的眼睛,因此充分利用人眼的视觉特性,是实现码率压缩的第二途径。人眼对图像细节、运动及对比度的分辨能力都有一定的限度,超过这个限度毫无意义。如果编码压缩方案能与人眼的视觉特性相匹配,就可以得到较高的压缩比。,72,2.图像压缩编码标准简介(1)JPEG静止图像编码标准 JPEG(Joint Photographic Experts Group)是联合专家组的简称,成立于1986年。JPEG采用的是帧内编码技术。它规定了基本系统和扩展系统两个部分。在基本系统中,每幅图像都被分解为相邻的88图像块。对每个图像块采用离散余弦变换(DCT),得到64个变换系数,它们代表了该图像块的频率成分。然后,再用一个非均匀量化器来量化变换系数。对DCT系数量化后,再用Z字形扫描将系数矩阵变成一维符号序列,然后再进行Huffman编码,分配较长的码字给那些出现概率较小的符号。,73,除了基本系统之外,JPEG还包括“扩展系统”,它可提供更多的算法、更高精度的像素值和更多的Huffman码表等等。(2)H.261会议电视图像编码标准 H.261是ITUT第十五研究组在1990年12月针对可视电话和会议电视、窄带ISDN等要求实时编解码和低延时提出的一个编码标准。该标准的比特率为P64kb/s,这里P是整数,范围从1到30,对应的比特率从64 kb/s到1.92Mb/s。,74,H.261采用的是一个典型的混合编码方案。它大体上分为两种编码模式:帧内模式和帧间模式。对于平缓运动的人物图像,帧间模式将占主导地位;对于画面切换频繁和运动剧烈的序列图像,则采用帧内模式。采用哪一种模式,编码器作出判断。基本的判断准则是:哪一种模式给出较小的编码比特,那么就采用这种模式。,75,(3)MPEG-1存储介质图像编码标准 MPEG(Moving Picture Experts Group)是活动图像专家组的简称,是从属于ISO的一个工作组。MPEG-1标准于1992年通过,主要是为了数字存储介质中的视频、音频信息压缩,应用于CD-ROM、数字录音带、计算机硬盘和可擦写光盘等存储介质。比特率不超过1.5Mb/s,传输信道可以是ISDN和LAN等。MPEG-1对视频图像的编码过程类似于H.261标准,不同点是在MPEG-1中引入了双向运动补偿。,76,(4)MPEG-2一般视频编码标准 尽管MPEG-1标准通过参数变更途径可以提供很宽比特率范围,但该标准主要的目的却是为了低于1.5Mb/s的CD-ROM的应用。为了满足高比特率、高质量的视频应用,MPEG在1994年发布了MPEG-2标准,它特别适用于数字电视,比特率在415Mb/s之间,也可以进一步扩展到高清晰度电视(HDTV),比特率不超过100Mb/s。MPEG-2与MPEG-1的主要差别在于对隔行视频的处理方式上。此外,MPEG-2标准还提供了图像等级选择编码方式,还有支持扩充到高清晰度电视格式图像编码的能力,可以说它是迄今为止关于活动图像编码最完善的标准。,77,(5)H.263极低码率的编码标准 H.263建议是用于实现比特率低于20kb/s的窄带视频压缩的国际标准。它是在H.261基础上发展起来的,因而两者有许多相似处。除了与H.261相类似的混合编码器之外,H.263还参照MPEG标准引入了I帧、P帧和PB帧三种帧模式和帧间编码、帧内编码二种编码模式。为了进一步提高压缩比,H.263较H.261又采取了一些新的措施:例如取消了H.261中的可选环路滤波器,将运动补偿精度提高到半像素机构度;改进了运动估值方法,充分利用了运动矢量的相干性来提高预测质量,减轻块效应;精简了部分附加信息的编码,提高了编码效率;采用三维Huffman编码、算术编码来进一步提高压缩比等等。,78,(6)MPEG-4多媒体通信编码标准 1998年11月公布的MPEG-4是针对多媒体通信制定的国际标准。MPEG-4旨在建立一种能被窄带、宽带网络、无线网络、多媒体数据库等各种存储和传输设备所广泛支持的通用音、视频数据格式,它不仅针对一定比特率下的音、视频编码,同时更加注重多媒体系统的交互性和灵活性。与音频编码类似,MPEG-4视频编码也支持自然和合成视频对象。合成视频对象包括2D、3D动画和人面部表情动画。对于静止视频对象,MPEG-4采用小波编码,可提供多达11级的空间分辨率和质量可伸缩性。对于运动视频对象,为了支持基于对象的编码,引入了形状编码模型;为了支持高的压缩比,MPEG-4仍然采用了MPEG-1、MPEG-2中的变换、预测混合编码框架。,79,再 见,

    注意事项

    本文(第7信源编码.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开