欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第5章 数字媒体及应用.ppt

    • 资源ID:5651092       资源大小:1.51MB        全文页数:100页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第5章 数字媒体及应用.ppt

    5.1 文本与文本处理 5.2 图像与图形及应用5.3 波形声音的获取与播放5.4 数字视频及应用,第五章 数字媒体及应用,文字、文本文字:一种书面语言,由一系列称为“字符”(character)的书写符号构成。文本:文字信息在计算机中的表示形式,是基于特定字符集的、具有上下文相关性的一个(二进制编码)字符流,是计算机中最常用的一种数字媒体。组成文本的基本元素是字符,字符在计算机中采用二进制编码表示。,文本的输入文本输入是将文字输入到计算机中,建立文本文件(电子文档)的操作。文字输入方法概述(1)人工输入。方法:键盘输入、手写笔联机识别输入、语音识别输入。(2)文字自动识别输入。将纸介质上的文本通过识别技术自动转换为文字的编码。方法:印刷体文字识别输入,手写体文字脱机识别输入。,5.1.2 文本的表示与字符的编码1、文本的表示文本是计算机表示文字及符号信息的最常用也是最基本的一种数字媒体。由于文字和符号采用了二进制编码表示,因而可以方便地进行编辑、排版和各种分析处理(如统计、排序、分类、索引、检索等)。,西文字符集:由拉丁字母、数字、标点符号及一些特殊符号组成。字符的编码:字符集中每一个字符各有一个代码,即字符的二进制表示,称为该字符的编码。(1)标准ASCII编码字符集。美国标准信息交换码:使用7个二进位对字符进行编码(叫做标准ASCII码),称为ISO-646标准。基本的ASCII字符集共有128个字符。,在计算机中的存储方法是:用一个字节(8位)来存储一个字符的ASCII码。每个字节中多出来的最高位一般保持为“0”。常用的特殊字符的ASCII码:空格(32)、A(65)、a(97)、数字0(48)。,(2)扩充ASCII编码字符集。每个扩充ASCII字符集分别可以扩充128个字符,这些扩充字符的编码均是高位为“1”的8位代码(十进制数128255),称为扩展ASCII码。,汉字编码字集(1)GB2312-80汉字编码字符集。信息交换用汉字编码字符集基本集(GB2312-80)第一部分:字母、数字和各种符号,包括拉丁字母、俄文、日文平假名与片假名、希腊字母、汉语拼音等共682个(统称为GB2312图形符号)。第二部分:一级常用汉字,共3755个,按汉语拼音排列。第三部分:二级常用字,共3008个,按偏旁部首排列。,区位码:GB2312国标字符集构成一个二维平面,它分成94行、94列,行号称为区号,列号称为位号。每一个汉字或符号在码表中都有各自的位置,字符的位置用它所在的区号(行号)及位号(列号)来表示。每个汉字的区号和位号分别用1个字节来表示。,国标交换码:将GB2312字符集中每个汉字的区号和位号必须分别加上32(即二进制0010 0000,十六进制20H),就可以得到该汉字的“国标交换码”(简称交换码)。,机内码:把一个汉字看作两个扩展ASCII码,使表示GB2312汉字的两个字节的最高位(b7)都等于“1”。这种高位为1的双字节(16位)汉字编码就称为GB2312汉字的“机内码”,又称内码。国标码=区位码+2020H,机内码=区位码+A0A0H,2)GBK汉字编码字符集。1995年发布GBK,全称为汉字内码扩展规范GBK字符集中一共有21003个汉字和883个图形符号,它与GB2312国标汉字字符集及其内码保持兼容。GBK的编码是用2字节编码表示,第1字节的最高位必为“1”,第2字节的最高位不一定是“1”。,(3)UCS/Unicode与GB18030汉字编码标准。通用编码字符集UCS/Unicode。UCS/Unicode用4个字节对全世界现代书面文字所使用的所有字符、符号进行编码(记作UCS-4)。其优点是编码空间极大,能容纳足够多的各种字符集(13亿字符);缺点是4字节的字符编码使存储空间浪费严重。,GB18030-2000编码。GB18030-2000汉字编码标准是为了既兼容GB2312和GBK,又尽快向UCS/Unicode编码标准过渡,而在2000年颁布的汉字编码国家标准。该标准在GB-2312和GBK的基础上进行扩充,增加了4字节编码。,例:(单选)在ASCII编码中,字母A的ASCII编码为41H,那么字母f的ASCII编码为()。A46H B66H C67H D78H,参考答案:B由题目中所给的字母A的ASCII编码为41H这个已知条件,可以推导出a的ASCII编码为61H,再考虑ASCII编码表中字母的顺序是连续的,所以可以得出b的ASCII编码为62H,以此类推可得出f的ASCII编码为66H。,例:(判断)西文字符在计算机中通常采用ASCII码表示,每个字节存放1个字符。(),参考答案:对目前计算机中使用得最广泛的西文字符集的编码称为ASCII码,它一共有128个字符,每个字符使用7个二进位进行编码。还有一种扩充ASCII码,每个字符使用8个二进位进行编码。无论是7位的标准ASCII码还是8位的扩充ASCII码,一个字节只存放一个ASCII字符。若使用7位标准ASCII码,每个字节多余出来的一位(最高位)通常保持为“0”。,例:(判断)采用GB2312、GBK和GB18030三种不同的汉字编码标准时,一些常用的汉字如“中”、“国”等,它们在计算机中的表示(内码)都是相同的。(),参考答案:对分析:GB2312、GBK和GB18030是我国从20世纪80年代开始先后制订与发布的三个汉字编码标准,它们的主要区别是字符集中所包含的图形符号和汉字的数目不同,后发布的标准中收录的字符总是涵盖了已发布标准中的所有字符,而且,它们在计算机中的表示(内码)也都保持相同。,(单选)有关我国汉字编码的叙述中,错误的是A.GB2312国标字符集所包含的汉字许多情况下已不够使用B.GBK字符集既包括简体汉字,也包括繁体汉字C.GB18030编码标准中所包含的汉字数目超过2万字D.不论采用上述哪一种汉字编码标准,汉字在计算机中均采用双字节表示,参考答案:D在GB2312和GBK中,所有汉字在计算机中都使用2个字节表示和存储,但GB18030汉字数量很大,多数汉字使用2字节编码(且与GB2312、GBK保持相同),还有少数汉字使用4字节编码。,文本文件的类型,文本类型简单文本丰富格式文本超文本,文本的概念从由数字、字符和汉字等构成的纯文本扩大到包含了若干带有格式控制的Word文档、网页制作软件生成的HTML文件等等。,简单文本文件(纯文本)简单文本是由一连串的字符组成的,除了用于表达正文内容的字符(包括汉字)及“回车”、“换行”、“制表”等有限的几个打印(显示)控制字符之外,几乎不包含任何其他格式信息和结构信息。这种文本通常称为纯文本或ASCII文本,文件后缀名是TXT。,2、丰富格式文本文件 文件内容有字符(汉字)的编码、数字图像、数字声音、数字视频信息、标记信息(格式信息、结构信息、链接信息等)。例如,RTF文件、DOC文件、PDF文件、HTML文件。,3、超文本文件 超文本也称为非线性文本,文本的组织结构是网状结构,即包含链接信息的丰富格式文本。阅读时除顺序阅读方式之外,还可以通过跳转、导航、回溯等操作,实现对文本内容更为方便的访问。例如,Windows中的“帮助”文件或者使用浏览器从Web服务器上下载的网页(html或htm文件)。,超链是有向的,起点位置称为链源,目的地(目标)称为链宿。链源可以是节点中的一个标题、句子、关键词、字、一幅图像、一个图标等。链宿可以是节点,也可以是系统中的一个文件(包括文件的标签)或者程序。网页中的超文本文件还分静态文档、动态文档、主动文档。,例:(单选)关于文本的叙述中,错误的是。A.不同文字处理软件制作的丰富格式文本通常互不兼容B.纯文本的文件扩展名为“txt”C.“doc”文件中不只包含西文字符和汉字,并且含有许多字符属性和格式标记D.超文本既可以是丰富格式文本,也可以是纯文本,参考答案:D超文本虽然强调的是按信息块将文本组织成为网状结构,并没有特别强调文本的外观和格式,但是,它使用的“链源”和“链宿”等均需要在文本中采用特定标记语言进行标记,从这个角度而言,超文本一般都是丰富格式文本,而非纯文本。,例:(填空)有一本英文小说,它在计算机中用纯文本形式表示,文件扩展名为“txt”,大小为35KB,该小说所包含字符(字母、数字、标点符号等)的总数大约是 个,参考答案:35840分析:在计算机中用纯文本形式表示的英文小说,其中包含的仅仅是采用ASCII码(7位或8位)表示的西文字母、数字和一些标点符号,每个字符使用1个字节进行存储,由于文件扩展名为“txt”,表示该文件没有进行数据压缩。因此,这本小说所包含字符(字母、数字、标点符号等)的总数大约是351024=35840个。,文本的输出文本输出过程文本阅读器汉字字形生成过程字形库字符形状的描述,字形码点阵字形:象素阵列。象素多,字清晰,存储容量大 汉字字形点阵中每个点的信息用一位二进制码来表示。对于16 16点阵的汉字字形码,需要用32个字节(16 16 8=32)表示;24 24点阵的汉字字形码,需要用72个字节表示。矢量字形:折线。不占存储空间,字形美观轮廓字形:直线或曲线描述轮廓。占用存储空间小,字形质量高,.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#.#,1616点阵字模,点阵字模示意图,图形与图像及应用,1、色光的三基色色光的三基色是:红(Red)、绿(Green)、蓝(Blue)。三基色以不同的比例相混合,可成为各种色光。当三基色分量都为0(最弱)时混合为黑色光。当三基色分量都为K(最强)时混合为白色光。,2、颜料的三基色颜料的三基色是:青(Cyan)、品红(Magenta)、黄(Yellow)。三基色颜料以不同的比例相混合,可产生各种颜色的颜料,但在印刷或者打印时,对黑色的处理有问题,因此需增加黑色。,3、色彩的表达方法(1)RGB色彩空间(RGB为色光的三基色)。R红色(Red),G绿色(Green),B蓝色(Blue)。典型应用是计算机的彩色显示器。(2)YUV色彩空间。Y亮度信号,U、V色差信号。典型应用是彩色电视系统。(3)HIS色彩空间。H色调(Hue),I亮度(Intensity或Brightness),S色饱和度(Saturation或Chroma)。HIS色彩空间是从人的视觉系统出发描述色彩。,(4)CMYK色彩空间。C青色(Cyan),M品红色(Magenta),Y黄色(Yellow),K黑色(Black)。一幅图像在计算机中显示用RGB色彩空间,编辑处理用RGB或HSI色彩空间,打印时转换成CMY色彩空间(彩喷打印也用CMYK),印刷时转换成CMYK色彩空间。,数字图像的分类图像(Image):从现实世界中通过数字化设备获取的图像;图形(Graphics):由计算机合成的数字图像。,5.2.3 图像的获取与重现1、图像的获取图像的获取是从现实世界中获得数字图像的过程,图像获取的过程实质上是模拟信号的数字化过程,它的处理步骤有:取样、分色、量化。,(1)取样:将画面划分为M N个网格,每个网格称为一个取样点。一幅模拟图像就转换为M N个取样点组成的一个阵列。每个取样点只有一种颜色或亮度,取得所有取样点的颜色或亮度。(2)分色:若是彩色图像,则将每个取样点的颜色分解成三个基色(例如R,G,B),对应有3个亮度值,如果不是彩色图像,则每一个取样点只有一个亮度值。(3)量化:对取样点的每个分量的亮度值进行A/D转换,把模拟量的亮度值用数字量(一般是8位至12位的正整数)来表示。,16色图像,256色图像,24位真彩色图像,不同位深度的图像对比,16色图像,24位真彩色图像,256色图像,图像 取样 量化 数字图像,5.2.3数字图像的表示与压缩编码 从取样图像的获取过程可以知道,一幅取样图像由M(行)N(列)个取样点组成,每个取样点是组成取样图像的基本单位,称为像素(Picture Element,简写为PEL)。彩色图像的像素是矢量,它由多个彩色分量组成,黑白图像的像素只有1个亮度值。,1、数字图像的表示(1)单色图像(2)彩色图像,2、图像的属性信息(1)图像大小,也称图像分辨率(包括垂直分辨率和水平分辨率)。(2)位平面的数目,即矩阵的数目,也就是彩色分量的数目。(3)颜色空间的类型,指彩色图像所使用的颜色描述方法,也叫颜色模型。常用颜色模型:RGB(红、绿、蓝)、CMYK(青、品红、黄、黑)、HSV(色彩、饱和度、亮度)、YUV(亮度、色度)等。(4)像素深度,即像素的所有颜色分量的位数之和,它决定了不同颜色(亮度)的最大数目。,(1)图像分辨率 图像采样的点数,称为图像分辨率 用点的“行数列数”表示 如数码像机常用的图像分辨率为640480、1024786、1128764等。相同尺幅的图像,组成该图的像素数目越多,则说明图像的分辨率越高,看起来越逼真。相反,图像显得越粗糙。图像分辨率越高,图像文件占用的存储空间越大。,数字图像中表示每个像素的颜色使用的二进制位数称为像素深度或图像深度。像素深度值越大,图像能表示颜色数越多,色彩越丰富逼真,占用的存储空间越大。,(4)像素深度(图像深度),例:图像文件的大小估算 一幅640480的图像,位深度是24位(真彩色图像),则文件大小为:24(bit)/8(bit/Byte)640(列)480(行)=921600B(Bytes)约900kB,图像的分辨率和像素位深度决定了图像文件的大小。,3、数字图像的压缩数据压缩类型。无损压缩:压缩以后的数据进行图像还原(也称为解压缩)时,重建的图像与原始图像完全相同。有损压缩:使用压缩后的数据进行图像重建时,重建后的图像与原始图像虽有一定的误差,但不影响人们对图像含义的正确理解。如变换编码、矢量编码等。图像压缩方法很多,一般都采用有损压缩。,(4)压缩比。图像数据压缩比=压缩后的图像数据量压缩前的图像数据量。(6)数字图像压缩编码国际标准。JPEG标准:制定了一个静止图像数据压缩编码的国际标准,称为JPEG标准。JPEG 2000标准:它兼容JPEG。,图像文件格式,(1)位图文件(Bitmap-File,BMP)bmp格式是Windows采用的图像文件存储格式,在Windows环境下运行的所有图像处理软件都支持这种格式 是一种不压缩的格式,因此占有较大的存储空间,但图像质量较高,没有数据损失。,图像文件格式是图像数据在文件中的存放形式,不同的软硬件厂商可能定义不同的文件格式。,(2)GIF格式,GIF(Graphics Interchange Format)是CompuServe公司开发的图像文件存储格式 压缩效率、占用的存储空间很小 支持透明图像属性和动画图像属性 但表示的颜色数量有限,适合存储颜色较少的卡通图像、徽标等手绘图像。适合互联网上传输,(3)JPEG格式 JPEG(Joint Photographic Experts Group)负责制定静态的数字图像数据压缩编码标准 专家组开发的算法称为JPEG算法 相应的文件存储格式为jpg格式 可以选择压缩质量 适合存储色彩丰富的照片(4)TIFF用于扫描仪和桌面出版系统,图像文件 静态图像文件BMP文件、GIF文件、JPEG文件、TIF文件 动态图像文件AVI文件、MPEG文件,矢量图像与位图图像,矢量图像(图形)用计算机指令(数学方法)描述一幅图。矢量图像文件所占空间较小,旋转、放大、缩小、倾斜等变换操作容易,且不变形、不失真 位图图像 用记录每一个离散点的颜色的方法(就是前面介绍的采样、量化和编码)来描述图像,这种图像叫位图图像用于描述复杂图像,占用空间较大。,例:(判断)GIF格式图像在因特网上广泛使用的原因是因为它是一种真彩色图像。,参考答案:错分析:GIF图像确实是目前因特网上广泛使用的一种图像文件,它之所以适合在网络上使用,原因是因为它的颜色数目较少(不超过256色),每个像素仅需8个二进位表示,所以数据量特别小,适合网络传输。再加上GIF格式图像能支持透明背景、可在屏幕上渐进显示、具有动画效果等优点,因而网页中的插图大多数都使用GIF图像。而所谓的真彩色图像,一般指的是像素深度超过24位、可表示颜色数目在1600万种以上的数字图像,GIF文件格式不能支持这种图像。因此,本题的论断不正确。,例:(单选)下列关于数字图像的叙述中,错误的是。A.图像大小也称为图像的分辨率 B.像素是构成图像的基本单位 C.尺寸大的彩色图片数字化后,其分辨率必定大于尺寸小的图片的分辨率 D.彩色图像具有多个位平面,参考答案:C分析:计算机中的图像通常指的是取样图像,在图像获取的数字化(取样)过程中,每个取样点对应着一个像素,像素是构成图像的基本单位。由于此类图像是使用像素进行表示的,所以也称其为点阵图像或位图图像。图像分辨率指该图像像素阵列的列数和行数,它直接影响着图像在屏幕上显示(或打印机打印)出来的尺寸大小,所以人们也把图像的分辨率称为图像大小。在把彩色图片数字化时(例如使用扫描仪),如果使用的扫描分辨率(扫描分辨率用每英寸多少点即dpi表示)不变,那么尺寸大的彩色图片数字化后,其图像分辨率比尺寸小的图片的分辨率高。但是,扫描仪的扫描分辨率在每次使用时是可以重新设置的,如果扫描大尺寸彩色图片时设置的扫描分辨率低,扫描小尺寸彩色图片时设置的分辨率高,那么输入计算机中的两幅图像的图像分辨率就难说谁高谁低了。这里需要注意的是,扫描分辨率与图像分辨率是两个既有区别又有联系的概念。彩色图像的像素包含多个(一般是3个)分量,每个分量与颜色空间中的一种基色相对应,彩色图像中所有像素的同一个分量构成一个位平面,因此彩色图像的位平面有多个。例如,如果使用RGB颜色空间的话,彩色图像就包含R、G、B三个位平面。综上所述,本题的选项C是错误的。,例:(单选)以下列出的数字图像的文件格式中,能够在网页上发布并可具有动画效果的文件格式是()。A.BMP B.GIF C.JPEG D.TIF,参考答案:BGIF图像文件可以将多张图像的数据保存在同一个文件中,并规定这些图像的显示顺序和显示间隔时间。在显示GIF图像时,软件将按照预先规定的顺序和时间间隔将其中的多幅图像逐一进行显示,从而形成动画效果.,例:(多选)下列关于数字图像技术和计算机图形学的描述,正确的是()。A.黑白图像(又称灰度图像)的每个取样点只有一个亮度值B计算机图形学主要研究使用计算机描述景物并生成其图像的原理、方法和技术C利用扫描仪输入计算机的机械零件图属于计算机图形D数字图像中,GIF文件格式采用了无损压缩,参考答案:ABD,例:(填空)一架数码相机,它使用的Flash存储器容量为1GB,一次可以连续拍摄65536色的2048 1024的彩色相片1280张,则可以推算出该相机的图像压缩倍数是 倍。,参考答案:5压缩前的总容量=20481024161280bit=5GB,所以该相机的压缩倍数是5倍。,例:(单选)图形也称为计算机合成图像,它是人们发明摄影技术和电影电视技术之后最重要的一种生成图像的方法。下面关于计算机图形的叙述中,错误的是()。A.计算机只能生成假想或抽象景物的图像,不能生成实际景物的具有真实感的图像 B计算机不仅能生成静止图像,而且还能生成各种运动、变化的动态图像 C显示卡(图形加速卡)在生成图像的过程中起着重要作用,许多处理都是由显示卡完成的 D.计算机合成图像在产品设计、绘图、广告制作等领域有着广泛的应用,参考答案:A,数字声音及应用,1、声音的产生与信号的特征(1)声音(2)多媒体技术处理的声音信号(3)决定声音信号特征的三个参数:频率(w。)决定音调的高低;幅度(An)决定声音的强弱(音量);相位(n)决定声音的音色。,2、数字声音概述数字声音是模拟声音信号的二进制编码数据。数字声音特点是:数字声音是一种连续媒体,传输与播放有实时性要求,数据量大,对存储和传输的要求很高。数字声音有两种类型:(1)波形声音,如数字语音(取样于人说话的声音)、全频带数字声音(取样于自然界各种声音)。(2)计算机合成声音,如合成音乐(MIDI)、合成语音。,3、模拟声音信号的数字化过程声音信号的数字化是将模拟声音信号转换成数字编码形式,以便于计算机进行处理的过程。声音信号数字化的过程包括:取样、量化、编码。,模拟信号与数字信号,时间和幅度上都是连续的信号称为模拟信号。,幅度是离散的信号称数字信号。,声音处理技术,音频数字化 模拟信号 数字信号,转换,音频信号处理过程流程,采样、量化、编码,音频信号频率,采样频率,采 样,量化,保存为声音文件,开 始,结 束,采样频率,单位时间内采样的次数根据奈奎斯特理论(Nyqust theory):如果采样频率不低于信号最高频率的两倍,就能把以数字表达的声音还原成原来的声音。对于话音信号,最高频率为3400Hz,采样频率为8000Hz,能以数字声音还原原来的声音。对于一般音频信号,最高频率为20kHz,采样频率为40kHz以上时,就能无失真地还原出原来的声音。采样频率越高,得到的数据占用的存储空间越大。,采样和量化,例:假设输入电压的范围是0.00.7V,而它的取值仅限定在0,0.l,0.2,0.7V共8个值。如果采样得到的幅度值是0.123V,则近似取值为0.1V,如果采样得到的幅度值是0.271V,它的取值就近似为0.3V 对幅值进行限定和近似的过程称为量化。(Measuring,Sampling),声音的采样和量化(线性量化),幅度的划分是等间隔的,是线性量化。,采样精度,用以表示量化级别的二进制数据的位数,称为采样精度,也叫样本位数,用每个声音样本的位数(bit或b)表示。位数越少,声音质量越低,需要存储空间越少 采样频率和采样精度是数字声音质量的两项重要指标。,4、波形声音的获取设备(1)麦克风:将声波转换为电信号(模拟信号)。(2)声卡(Sound card):在线(On-line)获取声音,并进行数字化(将模拟信号转换为数字信号)。,5、声音的播放波形声音的播放主要经过四个步骤:(1)解码:解码是编码的逆向过程,是将压缩编码所得的数字信号恢复为压缩前的数据的过程。(2)数模转换:数模转换是将数字声音信号还原为模拟信号的过程。(3)插值处理:把时间上离散的取样值转换成在时间上连续的模拟声音信号。(4)播放:将模拟声音信号经过处理和放大送到扬声器播放。,例:(单选)声卡是获取数字声音的重要设备,在下列有关声卡的叙述中,错误的是()。A.声卡既负责声音的数字化(输入),也负责声音的重建(输出)B.声卡既处理波形声音,也负责MIDI音乐的合成 C.声卡中的数字信号处理器(DSP)在完成数字声音编码、解码及编辑操作中起着重要的作用 D.因为声卡非常复杂,所以都把它们做成独立的PCI插卡形式,参考答案:D,例:(单选)在数字波形声音的获取过程中,正确的处理步骤依次是()。A.模数转换、取样、编码 B取样、编码、模数转换 C取样、模数转换、编码 D.取样、数模转换、编码,参考答案:C,1、波形声音的主要参数(1)波形声音的主要参数有:取样频率、量化位数、声道数目、使用的压缩编码方法。(2)数码率(bit rate):指的是每秒钟的数据量,也称比特率、码率。(3)数字声音未压缩前,其计算公式为:波形声音的码率=取样频率量化位数声道数,压缩编码以后的码率=压缩前的码率压缩倍数。(4)持续时间为t(S)的一段波形声音的数据量,其计算公式为:数据量=码率持续时间t,数据率,数据率指还原1秒钟的声音所需传输的数据位数,也是数字化1秒钟的声音的所需传输的数据位数。未经压缩的数字声音的数据率为:,数据率(b/s)=采样频率(Hz)*样本精度(bit)*声道数数据量(b)=数据率(b/s)*时间(s),例 计算声音文件的数据量,如果采样频率为8kHz,样本精度为8位,则产生的数据率为:,8(bit)*8 kHz*2(声道数)*60(秒)=7680 k bit=960KB,8(bit)*8 kHz=64.0 kb/s,如果使用双声道,则要对两个通道上的声音同时采样和量化,数据量是单声道数字化的两倍,即:,8(bit)*8 kHz*2(声道数)=128 kb/s,1分钟的双声道声音文件的数据量为:,例:(单选)假设语音信号数字化时的取样频率为8kHz,量化精度为8位,数据压缩倍数为4倍,那么1分钟数字语音的数据量是()。A.960 KB B.480 KB C.120 KB D.60 KB,参考答案:C分析:我们说话时所生成的语音是一种单声道信号,数字化之后在没有进行数据压缩时,它的码率为8k81=64 kbps。数据压缩4倍之后,它的码率为16 kbps。因此,1分钟数字语音的数据量为16 kbps608=120 KB。,例:(多选)声卡的功能之一是将波形声音进行数字化,数字波形声音的质量与下列()参数有关。A.量化位数 B取样频率 C声卡接口 D.合成器类型,参考答案:AB,波形声音压缩编码标准。MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准,它分为三个层次:层1(Layer 1):编码简单,用于数字盒式录音磁带;层2(Layer 2):算法复杂度中等,用于数字音频广播(DAB)和VCD等;层3(Layer3):编码复杂,用于互联网上的高质量声音的传输,如MP3音乐压缩10倍。,MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器,层1、层2和层3的结构也相同,但它能支持5.1声道和7.1声道的环绕立体声。杜比数字AC-3(Dolby Digital AC-3):美国杜比公司开发的多声道全频带声音编码系统,它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成,6个声道的信息在制作和还原过程中全部数字化,信息损失很少,细节丰富,具有真正的立体声效果,在数字电视、DVD和家庭影院中广泛使用。,3、数字语音的压缩编码方法语音信号特点是带宽窄(3003400Hz),是一种特殊的波形声音。语音信号压缩编码方法有:模型编码(语声编码)、混合编码、波形编码。,音频文件 WAV文件 MIDI文件 mp3文件 wma文件,计算机合成音乐技术计算机合成音乐技术借助“电子合成器”产生具有某种乐器音色的声音。例如,电子琴中的合成器可以演奏出钢琴音色的声音。电子合成器的作用是将数字表示的音符转换为模拟声音波形,再送到喇叭发声。计算机合成音乐表示的国际标准MIDIMIDI(Musical Instrument Digital Interface,乐器数字接口)是计算机中描述乐谱的一种标准描述语言,规定了乐谱的数字表示方法(包括音符、定时、乐器等)和演奏控制器、音源、计算机等相互连接时的通信规程,是计算机合成音乐的交换标准,也是商业音乐作品发行的标准。,例:(单选)计算机中用于描述乐谱并由声卡合成出乐曲的一种专用语言,称为()。A.MP3 B.JPEG2000 C.MIIDI D.XML,5.4 数字视频及应用5.4.1数字视频基础1、基本概念(1)视频(Video):指的是内容随时间变化的一个图像序列,也称为活动图像(Motion Picture)。常见的视频有电视和计算机动画。,5.4.2数字视频的获取与播放1、视频信号的数字化视频信号的数字化是以一帧帧画面为单位进行,对YUV三路彩色图像信号分别取样、量化和编码。由于采用YUV彩色空间,人眼对颜色信号的敏感度远不如对亮度信号灵敏,所以色度信号的取样频率可以比亮度信号的取样频率低,以减少数字视频的数据量。,3、视频卡与视频获取设备(1)视频采集卡:简称视频卡,PC机中用于视频信号数字化的插卡。它的功能是将模拟视频信号(及伴音信号)数字化并存储在硬盘中。数字化后的视频图像,经彩色空间转换(从YUV转换为RGB),与计算机图形显示卡产生的图像叠加,显示在屏幕上。获取数字视频的同时使用数字信号处理器(DSP)进行音频和视频数据的压缩编码。,2)数字摄像头:在线获取数字视频的设备。它通过光学镜头采集图像,然后直接将图像转换成数字信号并输入到PC机,不需视频采集卡进行模数转换。最高分辨率:64080,一般为352288,速度为30 帧/s以下,镜头视角为4560度,光传感器大多采用CCD,部分采用CMOS,后者分辨率不能很高,但功耗低、速度快,接口为USB接口、IEEE1394(火线)接口。,3)数字摄像机:一种离线的数字视频获取设备。它的原理与数码相机类似,功能更多,采用M-JPEG或MPEG-2压缩编码,常见记录介质是磁带、硬盘,主要接口有USB、IEEE1394。,例:(判断)在PC机上安装数字摄像头的目的,是通过镜头连续地拍摄景物的图像并转换成数字视频信号输入到计算机中。(),分析:数字摄像头是一种在线获取数字视频的设备,它通过光学镜头采集图像,然后直接将图像转换成数字视频并输入到PC机中。数字摄像头的接口一般采用USB接口,有些采用高速的IEEE1394(火线)接口。它的优点是体积小、功耗低、价格便宜、使用方便。配置了数字摄像头之后,在相关软件的支持下用户就可以开展可视电话、视频会议等应用。因此,本题的叙述是正确的。,视频压缩编码的标准及其应用(1)MPEG-1:一种运动图像及其伴音的编码标准。码率:1.2Mb/s1.5Mb/s;图像质量:200多线,相当于一般家用录像机;应用:数码相机和数字摄像机、VCD。(2)MPEG-2:针对数字电视(DTV)的应用要求。码率:1.5 Mb/s60 Mh/s甚至更高;特点:通用性,向下兼容MPEG-1;应用:数字卫星电视、高清晰度电视(HDTV)广播、数字视盘DVD。,3)MPEG-4:支持各种网络条件下(包括移动通信)的交互式多媒体应用,侧重于对多媒体信息内容的访问,支持计算机合成视频和音频,功能强,应用前景广。(4)H.261:数字视频编码标准,由国际电联(ITU)前身CCITT制定,适用于在ISDN网上以p64kbps(p=1,30)的速率开展视频会议和可视电话业务。,例:(单选)多媒体计算机系统中要表示、传输和处理大量的声音、图像甚至影视视频信息,其数据量之大是非常惊人的,因此必须研究高效的()技术。流媒体 数据压缩编码 数据压缩解码 图像融合A和 B和 C和 D和,参考答案:B,数字视频的应用1、MPEG-1与VCD 2、MPEG-2与DVD,例:(单选)容量为4.7GB的DVD光盘片可以持续播放2小时的影视节目,由此可推算出使用MPEG-2对视频及其伴音进行压缩编码后,每秒钟音频和视频数据合在一起的码率大约是()。A.5.2Mbps B.650 kbps C.10.4Mbps D.2.6 Mbps,参考答案:A分析:光盘上的数据是一位一位地从光盘上串行读出的,由于4.7 GB(注:按商家标注习惯,这里的4.7 GB计作4700 MB)的音视频数据可连续读出播放2小时(7200s),因此它的码率是:码率=(4.710008)/7200,流媒体的定义所谓流媒体是指采用流式传输的方式在Internet播放的媒体格式。流媒体又叫流式媒体,它是指商家用一个视频传送服务器把节目当成数据包发出,传送到网络上。用户通过解压设备对这些数据进行解压后,节目就会像发送前那样显示出来。流媒体实际指的是一种新的媒体传送方式,而非一种新的媒体。,例:(多选)Windows操作系统附带的“媒体播放器”软件具有声音和视频的播放功能。该软件可以播放的数字视频文件类型是()。A.avi B.mp2 C.mpg D.mp3,参考答案:ABC,声音文件的存储格式,文件格式是数据在存储器中的存放形式。相同的数据,可以有不同的存放形式,所以也就有多种文件格式。WAV是Windows采用的波形声音文件存储格式,主要用于自然声的保存与回放。MP3是MPEG第三层压缩文件格式,提供8kb/s到128kb/s的数据率和高达96:1的压缩比,数据文件小,音质好。RM、RA是Real Networks公司制定的声音文件格式,有较高的压缩比,可以采用流媒体的方式在网上实时播放。,RGB相加混色模型,理论上,任何一种颜色都可用红(Red)、绿(Green)、蓝(Blue)三种基本颜色按不同的比例混合得到,称为相加混色。在计算机中,将红、绿、蓝三种颜色分别按光强度(深浅)的不同分为256个级别,0级实际上是黑色,255级是纯色(红、绿或蓝),分别用8位二进制数表示,每个像素占24位。,视频处理技术,数字视频的压缩编码 MPEG(动态图像专家组):视频、音频和数据的压缩标准MPEG-1:layer-3主要应用于我们非常熟悉的MP3MPEG-2MPEG-4H.261/263:针对可视电话和视频会议,

    注意事项

    本文(第5章 数字媒体及应用.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开