【精品】ppt资料pcm编码详解.ppt

资源ID：2880016 资源大小：416.50KB 全文页数：40页
资源格式： PPT 下载积分：8金币

快捷下载

会员登录下载

三方登录下载：

下载资源需要8金币

邮箱/手机：
温馨提示：	用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

网站客服

侵权投诉

【精品】ppt资料pcm编码详解.ppt

PCM 与音频编码,第3章话音编码,重点：脉冲编码调制(PCM)增量调制与自适应增量调制自适应差分脉冲编码调制（ADPCM）难点：非均匀量化增量调制子带编码,波形声音的数据压缩,波形声音的码率=取样频率量化位数声道数全频带声音的压缩编码：第1代压缩编码：PCM编码第2代压缩编码：感知声音编码数字语音的压缩编码：波形编码参数编码（模型编码）混合编码,语音压缩编码的3类方法,波形编码(Perception model-based compression)benefits:genericdrawbacks:highest compression rates are difficult to achieve 16kb/sExamples:PCM,ADPCM,Subband参数编码,源编码(Production model-based compression)benefits:highest possible compression 2.4Kb/sdrawbacks:signal source(s)must be knowExamples:vocoder混合编码(Hybrid compression)Examples:CELP 4.8kb/s16kb/s,脉冲编码调制(PCM),“防失真滤波器”是一个低通滤波器，用来滤除声音频带以外的信号；“波形编码器”可暂时理解为“采样器”；“量化器”可理解为“量化阶大小(step-size)”生成器或者称为“量化间隔”生成器。,PCM编码框图,声音数字化有两个步骤：第一步是采样，就是每隔一段时间间隔读一次声音的幅度；第二步是量化，就是把采样得到的声音信号幅度转换成数字值。但那时并没有涉及如何进行量化。量化有好几种方法，但可归纳成两类：一类称为均匀量化，另一类称为非均匀量化。采用的量化方法不同，量化后的数据量也就不同。因此，可以说量化也是一种压缩数据的方法。,均匀量化,采用相等的量化间隔对采样得到的信号作量化，那么这种量化称为均匀量化。均匀量化就是采用相同的“等分尺”来度量采样得到的幅度，也称为线性量化量化后的样本值Y和原始值X的差E=Y-X称为量化误差或量化噪声,非均匀量化,非线性量化：对输入信号进行量化时，大的输入信号采用大的量化间隔，小的输入信号采用小的量化间隔。这样就可以在满足精度要求的情况下用较少的位数来表示。声音数据还原时，采用相同的规则。在非线性量化中，采样输入信号幅度和量化输出数据之间定义了两种对应关系，一种称为m 律压扩(companding)算法，另一种称为A律压扩算法。采样频率为8 kHz，样本精度为13位、14位或者16位的输入信号，使用m 律压扩编码或者使用A律压扩编码，经过PCM编码器之后每个样本的精度为8位，输出的数据率为64 kb/s。这就是CCITT推荐的G.711标准。,m 律压扩和A律压扩,m 律压扩：北美和日本等地区 13位PCM编码转换城8位。A律压扩欧洲和中国大陆等地区，14位PCM编码转换城8位输出信号均为64Kb/s,PCM在通信中的应用,提高线路利用率通常用下面两种方法频分多路复用:把传输信道的频带分成好几个窄带，每个窄带传送一路信号。例如，一个信道的频带为1400 Hz，把这个信道分成4个子信道(subchannels)：820990 Hz,12301400 Hz,16401810 Hz和20502220 Hz，相邻子信道间相距240 Hz，用于确保子信道之间不相互干扰。每对用户仅占用其中的一个子信道。这是模拟载波通信的主要手段。时分多路复用:把传输信道按时间来分割，为每个用户指定一个时间间隔，每个间隔里传输信号的一部分，这样就可以使许多用户同时使用一条传输线路。这是数字通信的主要手段。例如，话音信号的采样频率f8000 Hz，它的采样周期125 m s，这个时间称为1帧(frame)。在这个时间里可容纳的话路数有两种规格：24路制和30路制。,PCM在通信中的应用,PCM在通信中的应用,24路制的重要参数如下：每秒钟传送8000帧，每帧125 m s。12帧组成1复帧(用于同步)。每帧由24个时间片(信道)和1位同步位组成。每个信道每次传送8位代码，1帧有24 8 1193位(位)。数据传输率R80001931544 kb/s。每一个话路的数据传输率80008=64 kb/s。30路制的重要参数如下：每秒钟传送8000帧，每帧125 m s。16帧组成1复帧(用于同步)。每帧由32个时间片(信道)组成。每个信道每次传送8位代码。数据传输率：R80003282048 kb/s。每一个话路的数据传输率80008=64 kb/s。,PCM在通信中的应用,PCM信号复用的复杂程度，通常用“群(group)”表示一次群(基群)的30路(或24路),北美叫做T1远距离数字通信线，在欧洲叫做E1远距离数字通信线和E1等级。二次群的120路(或96路)三次群的480路(或384路),预测编码,预测编码(Prediction Coding)：是指利用前面的一个或多个信号对下一个信号进行预测，然后对实际值和预测值的差进行编码。两种典型的预测编码：差分脉码调制（DPCM）自适应差分脉码调制（ADPCM）,DPCM,DPCM编码,简称差值编码，是对模拟信号幅度抽样的差值进行量化编码的调制方式(抽样差值的含义请参见“增量调制”)。原始的模拟信号经过时间采样，然后对每一样值进行量化，作为数字信号传输。这种方式是用已经过去的抽样值来预测当前的抽样值，对它们的差值进行编码。差值编码可以提高编码频率，这种技术已应用于模拟信号的数字通信之中。,差分脉码调制(DPCM),DPCM不对每一样值都进行量化，而是预测下一样值，并量化实际值和预测值之间的差。DPCM是基本的编码方法之一，在大量的压缩算法中被采用，比如JPEG的DC分量就是采用DPCM编码的。,举例说明DPCM编码原理：设DPCM系统预测器的预测值为前一个样值，假设输入信号已经量化，差值不再进行量化。若系统的输入为0 1 2 1 1 2 3 3 4 4，则预测值为0 0 1 2 1 1 2 3 3 4，差值为0 1 1 1 0 1 1 0 1 0，差值的范围比输入样值的范围有所减小，可以用较少的位数进行编码。,DPCM,对于有些信号(例如图像信号)由于信号的瞬时斜率比较大，很容易引起过载，因此，不能用简单增量调制进行编码，除此之外，这类信号也没有像话音信号那种音节特性，因而也不能采用像音节压扩那样的方法，只能采用瞬时压扩的方法。但瞬时压扩实现起来比较困难，因此，对于这类瞬时斜率比较大的信号，通常采用一种综合了增量调制和脉冲编码调制两者特点的调制方法进行编码，这种编码方式被简称为脉码增量调制，或称差值脉码调制，用DPCM表示。,DPCM,这种调制方式的主要特点是把增量值分为个等级，然后把个不同等级的增量值编为位二进制代码()再送到信道传输，因此，它兼有增量调制和PCM的各自特点。设这个误差电压经过量化后变为个电平中的一个，电平间隔可以相等，也可以不等，这里认为它是间隔相等的均匀量化。量化了的误差电压经过脉冲调制器变为PAM脉冲序列，这个PAM信号一方面经过PAM编码器编码后得到DPCM信号发送出去。另一方面把它经过积分器后变为与输入信号x(t)进行比较，通过相减器得到误差电压e(t)。,DPCM,实验表明，经过DPCM调制后的信号，其传输的比特率要比PCM的低，相应要求的系统传输带宽也大大地减小了。此外，在相同比特速率条件下，DPCM比PCM信噪比也有很大的改善。与M相比，由于它增多了量化级，因此，在改善量化噪声方面优于M系统。DPCM的缺点是易受到传输线路上噪声的干扰，在抑制信道噪声方面不如M。,ADPCM,Adpcm是自适应差分脉冲编码调制的简称，最早使用于数字通信系统中。该算法利用了语音信号样点间的相关性，并针对语音信号的非平稳特点，使用了自适应预测和自适应量化，在32kbps8khz速率上能够给出网络等级话音质量。,ADPCM,为了进一步改善量化性能或压缩数据率，可采用自适应量化或自适应预测的方法。只要采用了其中的任一种自适应方法，均称为ADPCM。自适应预测：预测参数的最佳化依赖于信源的统计特性，要得到最佳的预测参数是一件繁琐的工作。而采用固定的预测参数往往又得不到好的性能。为了既能使性能较佳，又不致于有太大的工作量，可以将上述两种方法折衷考虑，采用自适应预测,ADPCM,现在我们使用的是IMA ADPCM算法，该算法中对量化步长的调整使用了简单的查表方法，对于一个输入的PCM值X(n)，将其与前一时刻的X(n-1)预测值做差值得到d(n)，然后根据当前的量化步长对d(n)进行编码，再用此sample点的编码值调整量化步长，同时还要得到当前sample点的预测值供下一sample点编码使用。通过此算法可将样点编码成4bit的码流，一个符号位和三个幅度位。,ADPCM,该算法较简单，通过查表简化了运算。对于编码后的数据我们采用了wav文件格式，该格式对编码后的数据流进行了包装，由文件头和数据码流组成，文件头中指出了音频数据所采用格式、采样率、比特率、块长度、比特数及声道数等信息。数据码流以块为单位，块头指出了该块起始的预测值和index值，码流中每byte的高四位和低四位分别对应一个PCM。当前该算法以其简单实用的特点广泛应用到数字音乐盒和数字录音笔中。,自适应差分脉码调制(ADPCM),具体方法是：预测参数仍采用固定的；但此时有多组预测参数可供选择。这些预测参数根据常见的信源特征求得。编码时具体采用哪组预测参数根据信源的特征来自适应的确定。为了自适应地选择最佳参数，通常将信源数据分区间编码，编码时自动地选择一组预测参数，使该区间实际值与预测值的均方误差最小。随着编码区间的不同，预测参数自适应的变化，以达到准最佳预测。,自适应量化：根据信号分布不均匀的特点，系统具有随输入信号的变化而改变量化区间大小,以保持输入给量化器的信号基本均匀的能力，这种能力称为自适应量化。,例如，Microsoft 的ADPCM采用二预测参数，提供7组预测系数，如右表所示。编码时，根据选定的准则(如最小均方误差准则)，每个编码区间自动地选取一组最佳的参数。,增量调制与自适应增量调制,增量调制(DM)增量调制也称调制(delta modulation，DM)，它是一种预测编码技术，是PCM编码的一种变形。PCM是对每个采样信号的整个幅度进行量化编码，因此它具有对任意波形进行编码的能力；DM是对实际的采样信号与预测的采样信号之差的极性进行编码，将极性变成“0”和“1”这两种可能的取值之一。如果实际的采样信号与预测的采样信号之差的极性为“正”，则用“1”表示；相反则用“0”表示，或者相反。由于DM编码只须用1位对话音信号进行编码，所以DM编码系统又称为“1位系统”。,增量调制(DM),在输入信号变化快的区域，斜率过载是关心的焦点，而在输入信号变化慢的区域，关心的焦点是粒状噪声。为了尽可能避免出现斜率过载，就要加大量化阶，但这样做又会加大粒状噪声；相反，如果要减小粒状噪声，就要减小量化阶，这又会使斜率过载更加严重。这就促进了对自适应增量调制(adaptive delta modulation，ADM)的研究,自适应增量调制(ADM),基本方法：在检测到斜率过载时开始增大量化阶，而在输入信号的斜率减小时降低量化阶。例如，宋(Song)在1971描述的自适应增量调制技术中提出：假定增量调制器的输出为1和0，每当输出不变时量化阶增大50%，使预测器的输出跟上输入信号；每当输出值改变时，量化阶减小50%，使粒状噪声减到最小，这种自适应方法使斜率过载和粒状噪声同时减到最小。又如，使用较多的另一种自适应增量调制器是由格林弗基斯(Greefkes)1970提出的，称为连续可变斜率增量调制(continuously variable slope delta modulation，CVSD)。它的基本方法是：如果连续可变斜率增量调制器(continuously variable slope delta modulator，CVSD)的输出连续出现三个相同的值，量化阶就加上一个大的增量，反之，就加一个小的增量。,自适应差分脉冲编码调制,自适应脉冲编码调制(adaptive pulse code modulation，APCM)是根据输入信号幅度大小来改变量化阶大小的一种波形编码技术。这种自适应可以是瞬时自适应，即量化阶的大小每隔几个样本就改变，也可以是音节自适应，即量化阶的大小在较长时间周期里发生变化。改变量化阶大小的方法有两种：一种称为前向自适应(forward adaptation)，另一种称为后向自适应(backward adaptation)。前向自适应：根据未量化的样本值的均方根值来估算输入信号的电平，以此来确定量化阶的大小，并对其电平进行编码作为边信息(side information)传送到接收端。后向自适应：从量化器刚输出的过去样本中来提取量化阶信息。由于后向自适应能在发收两端自动生成量化阶，所以它不需要传送边信息。,自适应差分脉冲编码调制,差分脉冲编码调制的思想：根据过去的样本去估算(estimate)下一个样本信号的幅度大小，这个值称为预测值，然后对实际信号值与预测值之差进行量化编码，从而就减少了表示每个样本信号的位数。它与脉冲编码调制(PCM)不同的是，PCM是直接对采样信号进行量化编码，而DPCM是对实际信号值与预测值之差进行量化编码，存储或者传送的是差值而不是幅度绝对值，这就降低了传送或存储的数据量。此外，它还能适应大范围变化的输入信号。自适应差分脉冲编码调制(ADPCM)ADPCM(adaptive difference pulse code modulation)综合了APCM的自适应特性和DPCM系统的差分特性，是一种性能比较好的波形编码。它的核心想法是：利用自适应的思想改变量化阶的大小，即使用小的量化阶(step-size)去编码小的差值，使用大的量化阶去编码大的差值,使用过去的样本值估算下一个输入样本的预测值，使实际样本值和预测值之间的差值总是最小。它的编码简化框图如下图所示。,ADPCM编译码器,G.721推荐标准，这个标准叫做32 kb/s自适应差分脉冲编码调制。在此基础上还制定了G.721的扩充推荐标准，即G.723，使用该标准的编码器的数据率可降低到40 kb/s和24 kb/s。,G.722 SB-ADPCM编译码器,G.722推荐标准，叫做“数据率为64 kb/s的7 kHz声音信号编码这个标准把话音信号的质量由电话质量提高到AM无线电广播质量，而其数据传输率仍保持为64 kb/s。子带编码(subband coding，SBC)的基本思想是：使用一组带通滤波器(band-pass filter，BPF)把输入音频信号的频带分成若干个连续的频段，每个频段称为子带。对每个子带中的音频信号采用单独的编码方案去编码。在信道上传送时，将每个子带的代码复合起来。在接收端译码时，将每个子带的代码单独译码，然后把它们组合起来，还原成原来的音频信号。子带编码的编码/译码器，可以采用ADPCM，APCM，PCM等。等带宽的子带不等带宽的子带,G.722 SB-ADPCM编译码器,窄带和宽带音频信道频率特性,全频带声音的第1代编码技术,全频带声音指的是10 Hz20,000 Hz范围里的所有可听声音.也叫做宽带声音或高保真(high-fidelity)声音;第1代全频带数字声音（CD，DAT）的编码采用PCM编码：采样频率：44.1 kHz 或 48 kHz量化精度：16位声道数目：1或2码率：705.6/768(kb/s)或 1.41/1.54(Mb/s),全频带声音的第2代编码技术,目标：在保持高保真声音质量（transparent compression）的前提下，降低码率，减轻网络带宽的压力；不但充分使用声音信息的统计冗余，而且利用人耳的听觉特性，即使用“心理声学模型(psycho-acoustic model)”，来达到压缩数据的目的,称为感知声音编码(perceptual audio coding)。,全频带数字音频的编码标准,MP3音乐是什么？Dolby AC-3是什么？Real Audio是什么？,数字语音编码标准,标准方法比特率质量时间应用G.711PCM644.41972PSTNANSI 1015LPC-102.42.71976保密通信G.721ADPCM324.11984PSTNGSM(欧洲蜂窝通信)RPE-CELP133.61991ANSI 1016CELP4.83.21991G.728低延时CD-CELP164.01992IS 54(北美TDMA)VSELP83.51992IS 96(北美CDMA)QCELP1-83.41993日本蜂窝通信VSELP6.83.31993G.729ACS-ACELP84.21995IP电话G.723.1(H.323,H.324)ACELP6.33.981995IP电话半速率GSM(欧洲蜂窝通信)AMR5-63.41995新的低速率ANSI标准MELP2.43.31996,数字语音的应用,记录/回放方式的应用数字录音机（DAT）数码录音笔语音复读机，电子有声读物,通信/广播方式的应用电话，移动电话IP电话DAB,合成声音的应用自动应答系统虚拟播音员Story on demand,语音合成（TTS）,查找拼写错误，对不规范或无法发音的字符进行过滤。分析文本中词或短语的边界，分析文本中的数字、姓氏、特殊字符、专有词语等有关词语读音的性质。,根据文本的结构、组成和标点符号，确定发音时语气的变换以及不同音的轻重方式。分析并决定各个音节的声调、语气和停顿方式，发音的轻重、长短等,

注意事项

本文（【精品】ppt资料pcm编码详解.ppt）为本站会员（仙人指路1688）主动上传，三一办公仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一办公（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。