欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    第1课-计算机体系结构与嵌入式CPU要点课件.ppt

    • 资源ID:3834415       资源大小:2.56MB        全文页数:62页
    • 资源格式: PPT        下载积分:16金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要16金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第1课-计算机体系结构与嵌入式CPU要点课件.ppt

    1,计算机体系结构与嵌入式CPU设计,浙江大学超大规模集成电路设计研究所孟建熠,系统芯片设计导论之,系统芯片设计导论,2,课程内容,计算机体系结构基础知识指令集技术流水线与指令级并行设计技术存储系统与Cache技术系统芯片与嵌入式CPU嵌入式CPU设计方法与流程CSKY嵌入式CPU介绍,系统芯片设计导论,3,计算机体系结构基础知识,系统芯片设计导论,4,计算机体系结构具体内容,它是一门设计计算机的学科,包括计算机的指令系统设计,结构设计,实现技术,以及与系统软件操作系统和编译器相关的技术;它主要研究软件、硬件功能分配和对软件、硬件界面的确定,即确定哪些功能由软件完成,哪些功能由硬件实现。,系统芯片设计导论,5,经典计算机模型,图灵模型 计算机是由一个有限状态读写头和一个存储器构成。有限状态读写头从一个初始状态开始,对存储器上的(输入)数据进行读或写操作,经过有限步操作之后停机,此时存储器上的(输出)数据就是计算结果。这样的计算机模型叫做图灵机。冯诺依曼结构约翰冯诺伊曼在为第一台存储程序计算机EDVAC研发计划做顾问时,写了一个草案报告描述了这种带有中央处理器、内存、I/O、总线的存储程序计算机。所以存储程序计算机还有另外一个学名,叫做冯诺伊曼体系架构(Von Neumann Architecture)。它的要点是:数字计算机的数制采用二进制;计算机应该按照程序顺序执行。,系统芯片设计导论,6,体系结构Flynn分类法,SISD指令部件只对一条指令处理,只控制一个操作部件操作。如一般的串行单处理机。SIMD由单一指令部件同时控制多个重复设置的处理单元,执行同一指令下不同数据的操作。如阵列处理机。MISD多个指令部件对同一数据的各个处理阶段进行操作。这种机器很少见。MIMD多个独立或相对独立的处理机分别执行各自的程序、作业或进程。例如多处理机。,系统芯片设计导论,7,计算机的发展历史及分类(1),传统的计算机分类:大型机、小型机、巨型机(成熟超级计算机)1980年代产生了新的机型:个人(PC)机、工作站、服务器1990年代产生了嵌入式系统:高性能家电、机顶盒、电子游戏机、手机、网络路由器、交换机等,系统芯片设计导论,8,计算机的发展历史及分类(2),后PC时代(移动互联网),系统芯片设计导论,9,计算机体系结构的研究方法,用定量方法进行计算机设计;用定量方法作为工具分析程序实际运行结果、各类实验和仿真;用定量方法寻找计算机体系结构的新思路、新技术,保证计算机性能继续按现在速率提高。,系统芯片设计导论,10,大概率事件原则,计算机设计中一个最重要、最普遍的原则和罕见事件相比,更应该注意经常出现的事件。改变常见事件的处理速度更加有助于提高机器的性能。,系统芯片设计导论,11,Amdahl定律,计算机执行某个任务的总时间中可被改进部分的时间所占的百分比,即(可改进部分占用的时间)/(改进前整个任务的执行时间),记为Fe,它总小于1。改进部分采用改进措施后比没有采用改进措施前性能提高倍数,即(改进前改进部分的执行时间)/(改进后改进部分的执行时间),记为Se,它总大于1。改进后整个任务的执行时间为:Tn T0(1-Fe+Fe/Se)其中T0为改进前的整个任务的执行时间改进后整个系统的加速比为Sn To/Tn=1/(1-Fe+Fe/Se),系统芯片设计导论,12,计算机与集成电路(1),体系结构不断创新,系统芯片设计导论,13,计算机与集成电路(2),摩尔定律发展,技术进步集成电路技术的进步,包括存储器(包括内外存)和各类外设的进步。特点:稳定发展,即按Moore定律发展,即微处理器性能(按芯片上晶体管数定义)每18个月翻一番,即每年提高58%。,系统芯片设计导论,14,计算机体系结构设计任务,指令集设计这是传统计算机体系结构的任务,即程序员面对的(看得见的)指令系统的设计计算机组织设计存储器设计,CPU设计,I/O总线结构设计等高层内容,同一个指令集可以对应不同组织设计硬件设计芯片的逻辑设计、封装、冷却。相同的指令集和组织可以对应不同的硬件实现形成一个产品系列。,系统芯片设计导论,15,指令集技术,系统芯片设计导论,16,指令集的概念,CPU能执行的指令的集合二进制形式,通常用汇编代码表示机器指令的元素:操作码源操作数目标操作数下一条指令在机器码中每条指令都有唯一的比特形式为了编程方便,操作码可以写成助记符形式如ADD,SUB,LOAD,系统芯片设计导论,17,指令类型,数据处理add/sub数据存取load/store数据移动mov程序流控制branch,系统芯片设计导论,18,寻址方式,操作数引用的形式立即寻址:ADD AX,5直接寻址:ADD AX,24间接寻址:ADD R,(A)寄存器寻址:ADD AX,BX寄存器间接寻址:MOV AX,BX偏移寻址:MOV BX,80SI堆栈寻址:ADD将栈顶两元素相加,系统芯片设计导论,19,指令格式,指令比特字段的布局包括:操作码操作数(隐式或显式)位分配:操作码数目和寻址能力之间的平衡操作数的数目寄存器/存储器寄存器组地址范围地址粒度,系统芯片设计导论,20,指令系统的分类-CISC,CISC发展历史计算机发展早期,为了方便软件编程和提高程序的运行速度,硬件工程师采用的办法是不断增加可实现复杂功能的指令和多种灵活的编址方式。CISC的缺点为了指令兼容的需求,新的指令系统必须包含原系统的指令,指令规模迅速膨胀,芯片设计复杂度大幅度提升。执行概率较低的指令会浪费存储空间,执行概率高但长度长的指令会增加取指的延时,降低性能;20%的指令被使用,80%的指令处于闲置状态;,系统芯片设计导论,21,指令系统的分类-RISC,RISC发展历史寻找一种代码长度规范且高度优化的指令系统,降低单条指令的专用化程度。RSIC优点简化了硬件设计提高处理器运行频率RISC缺点增加了软件设计与优化的复杂度,系统芯片设计导论,22,CSIC vs RISC,系统芯片设计导论,23,指令集设计中需要考虑的若干问题,结合功能的指令列表多少条指令指令的功能与操作数选择单条指令的复杂性数据类型选择8位/16位/32位指令格式操作码的长度地址数,系统芯片设计导论,24,流水线与指令级并行设计技术,系统芯片设计导论,25,CPU性能指标,CPU time=IC CPI CCCPU time 执行一般代码所需的中央处理站(CPU)时间IC代码的指令条数(Instruction Count),与指令集设计编译器的优化有关CPI平均执行每条指令的时钟周期数(Cycle Per Instruction),与指令集设计、体系结构等技术有关CC时钟周期(Clock Cycle)与计算机组成,IC工艺等技术有关,系统芯片设计导论,26,CPU的极限性能,理想情况下,每条只能在一个CPU时钟周期内完成,即CPI=1。早期CPU设计中,所有的指令都能在单周期内完成,但速度非常慢,尽管CPI能接近与理论值,但总体吞吐率不高;无法提高总体吞吐率的原因:频率提升要求时钟周期不断缩短,复杂工作无法在规定的时钟周期内完成;,系统芯片设计导论,27,提高CPU性能的方法流水线,系统芯片设计导论,28,指令流水线的基本原理,系统芯片设计导论,29,流水线的竞争,实际流水线不可能像上述理想流水线那样完美存在三种流水线竞争结构竞争:由硬件资源不足造成流水线停顿数据竞争:由前后指令之间存在数据相关性造成流水线停顿控制竞争:由转移指令造成流水线停顿实际流水线的CPI=理想流水线的CPI+结构竞争造成的停顿周期+数据竞争造成的停顿周期+控制竞争造成的停顿周期要提高CPU的性能就是要消除或减少三种竞争造成的停顿周期,系统芯片设计导论,30,流水线竞争解决的总体思路,结构竞争通过增加硬件资源来解决数据竞争和控制竞争通过挖掘代码指令之间的并行性,即通过开发和发现指令之间存在的可并行(重叠)执行的可能性,然后对指令执行顺序进行调度,即用不相关的指令来填补本来应该停顿周期的方法,达到消除或减少停顿周期,提高指令执行速度。ILP设计技术分两大类:基于硬件的ILP技术,又称动态开发ILP技术基于软件的ILP技术,又称静态开发ILP技术,系统芯片设计导论,31,用于解决数据竞争的ILP设计技术,静态调度动态调度采用重命名的动态调度技术编译分析数据相关性软件流水线路经调度,系统芯片设计导论,32,用于解决控制相关性的ILP技术,静态转移预测技术动态转移预测技术静脉投机技术动态投机技术循环体展开技术延时转移技术,系统芯片设计导论,33,存储系统与Cache技术,系统芯片设计导论,34,CPU与存储器的速度鸿沟,系统芯片设计导论,35,“Memory Wall”问题概括,说明单纯地改善CPU的设计,一味追求提高CPU的速度,并不能提高计算机整机的性能,因为高速CPU的性能被低速的存储器访问所抵销。为了提高计算机整机性能,必须消除两者性能差,或者仅可能缩小两者性能差。,系统芯片设计导论,36,存储器架构,系统芯片设计导论,37,解决办法,在高速CPU与低速Memory之间引入一个小容量的高速缓冲存储器(Cache),CPU,Cache,Main Memory,速度严重不匹配,速度匹配,速度不匹配,系统芯片设计导论,38,组相连Cache的基本原理,系统芯片设计导论,39,为什么Cache能提高CPU性能,局部性原理程序总是倾向于重用那些刚刚用过的数据和指令,这是计算机程序非常重要的性质。局部性原理的另一种表述:程序90%的执行时间是花在10%的代码上。局部性原理告诉我们:可以根据程序最近访问的数据和指令来预测程序将要调用的数据和指令,且这一预测正确度是比较高的。所以小容量的Cache能满足程序存取数据和指令的需求,系统芯片设计导论,40,系统芯片与嵌入式CPU,系统芯片设计导论,41,从嵌入式系统到系统芯片SoC,系统单芯片解决方案,将板级多芯片方案集成到单芯片内,系统芯片设计导论,42,SoC设计方法的直观概括,把各个功能单元抽象设计成各个IP单元根据应用的需求将IP进行合理的集成完成相关功能验证设计软件调度硬件资源工作,系统芯片设计导论,43,典型SoC架构,基本概念IP总线桥存储器,系统芯片设计导论,44,如何设计IP的通信接口,命令解码单元,IP内核,IP数据通路,系统总线接口,片外接口,嵌入式CPU,其他IP,映射寄存器单元,地址仲裁器,系统芯片设计导论,45,嵌入式CPU与SoC协同工作,ld r1,(r3),r3=0 x10011000,uart data register:remapping address0 x10011000,系统芯片设计导论,46,SoC中IP通信的基本原理,将所有的需要与软件互动的接口按照地址的方式映射到CPU的内存空间范围内。软件就像操作内存一样访问资源,查询外设状态,控制IP工作。,系统芯片设计导论,47,SoC的软硬件协同设计,系统芯片设计导论,48,嵌入式CPU设计关键技术,系统芯片设计导论,49,嵌入式CPU设计的主要挑战,平衡成本、功耗与性能之间的矛盾最优解:成本、功耗最低,性能最佳通常情况下:成本低则性能较低、功耗也较低功耗低则成本不高、性能也较低性能高功耗高、成本高,系统芯片设计导论,50,嵌入式CPU指令集,16位/32位指令集,32位数据通路Load/Store架构功能较弱的基本指令集+面向应用的扩展简洁的指令编码,系统芯片设计导论,51,嵌入式CPU体系结构,RISC架构单周期指令8、16、32位数据通路精简的流水线架构冯诺依曼结构/哈佛结构3操作数格式,嵌入式CPU,极低功耗、极低成本,超高性能高功耗和高成本,嵌入式CPU体系结构发展趋势,通用CPU,单片机,系统芯片设计导论,52,嵌入式CPU设计流程,确立市场定位与技术指标指令集设计ISA模型与原型设计、验证定制微体系结构与规范VLSI设计与验证流片验证典型SoC应用验证大规模产业化阶段产品验证,系统芯片设计导论,53,VLSI设计与验证的方法,全定制所有模块都采用电路级设计,通常采用自底而上的设计方法;优点:性能好,功耗低;缺点:工艺跃迁差,设计复杂度高;半定制部分模块采用电路级设计,其余模块采用硬件描述语言+工具综合;优点:能打破CPU设计中的性能瓶颈;缺点:工艺跃迁相对较差;全综合完全采用硬件描述语言,通过工具综合成目标电路;优点:工艺跃迁相当灵活;缺点:性能相对较差;,系统芯片设计导论,54,嵌入式CPU设计的所需的关键技术,计算机体系结构了解嵌入式CPU针对的嵌入式应用领域的特征,平衡性能、功耗与成本之间的Trade-off,设计出适合应用的最佳方案;必须与应用特征紧密结合;VLSI设计技术数字集成电路设计前端、后端技术;超大规模集成电路的验证技术;,系统芯片设计导论,55,嵌入式CPU的体系结构实例,经典5级流水线MIPS嵌入式CPU,系统芯片设计导论,56,ARM Cortex A8处理器,13级流水线,双发射主频1GHz2.0DMIPS/MHzNEON多媒体流水线2级片上Cache分支预测技术内存管理Java加速,系统芯片设计导论,57,ARM Cortex M0,3级流水线0.9DMIPS/MHz85uW/MHz12K56条指令最简洁的设计,系统芯片设计导论,58,CSKY嵌入式CPU介绍,系统芯片设计导论,59,CSKY嵌入式CPU发展历史,浙江大学VLSI研究所与杭州中天微系统共同合作开发的32位高性能嵌入式CPU系统;杭州中天微系统有限公司成立于2002年,致力于CSKY CPU的研发与产业化相关工作;目前有部分VLSI研究所博士、硕士研究生在杭州中天微系统有限公司参与CPU的设计工作;CSKY CPU目前已经发展为3个系列:CK500CK600CK800,系统芯片设计导论,60,C-SKY嵌入式CPU产品分布,系统芯片设计导论,61,CSKY产品分布国际主流嵌入式CPU产品对比,62,Q&A,

    注意事项

    本文(第1课-计算机体系结构与嵌入式CPU要点课件.ppt)为本站会员(小飞机)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开