《安腾高性能处理机体系结构.ppt》由会员分享,可在线阅读,更多相关《安腾高性能处理机体系结构.ppt(30页珍藏版)》请在三一办公上搜索。
1、第九章 安腾高性能处理机体系结构,本章学习要求:,了解高性能处理机体系结构的发展过程;理解安腾体系结构的基本设计思想。,第九章安腾高性能处理机体系结构,高性能处理机体系结构的演变安腾体系结构的基本设计思想安腾指令系统结构指令级并行机制双核安腾处理机的组成,9.1高性能处理机体系结构的演变,一、IA体系结构的历史演变二、英特尔64位处理机的两种体系结构,一、IA体系结构的历史演变IA32体系结构:IA32家族中的第一款32位微处理机流水技术IA32体系结构仍是基于CISC架构的处理机。Pentium体系结构:CISC外壳加RISC内核的结构,二、英特尔64位处理机的两种体系结构1、64T(英特尔
2、64):基于显式并行指令计算EPIC(Explicitly Parallel Instruction Computing)技术的IA64体系结构,不与IA32指令系统的兼容性。2、安腾体系结构:与IA32指令系统的兼容性。,9.2安腾体系结构的基本设计思想,安腾体系结构脱离了IA32 CISC体系结构的束缚,但并没有完全照搬RISC处理机的设计思想。EPIC既不是RISC,也不是CISC,而是一种吸收了CISC和RISC两者长处的全新的体系结构。主要体现在以下几个方面:显式并行指令计算(EPIC)技术超长指令字(VLIW)技术分支推断技术推测技术软件流水技术寄存器堆栈技术,1、显式并行指令计算
3、(EPIC)技术安腾的指令中设计了属性字段,用于指明哪些指令可以并行执行。这些属性信息并不是在指令执行过程中由处理机判定后获得的,而是由编译程序在编译时通过对源代码的分析获取指令级的并行性信息,并填写到执行代码中。EPIC技术则充分利用现代编译程序强大的对程序执行过程的调度能力,从而确定哪些指令可以并行执行,然后把并行指令放在一起并重新排序,提取并调度其指令级的并行,并将这种并行性通过属性字段“显式”地告知指令执行部件。,2、超长指令字(VLIW)技术超长指令字(VLIW)技术是提高计算机系统并行性的有效手段。VLIW系统中指令字长可多达几百位,编译器经过优化,能将多条能够并行执行的指令合并成
4、一个具有多个操作码的超长指令字,控制多个独立的功能部件工作。EPIC是基于超长指令字的设计。通过将多条指令放入一个超长指令字,能有效提高处理机内各个执行部件的利用率。,3、分支推断技术技术能将传统的“ifthenelse”分支结构转变为无分支的顺序/并行代码,以避免由于错误预测分支而付出代价。采用了推断技术后,原有的转移指令被转换成条件执行指令。原有的转移指令的所有的分支都被并行执行,无论哪条分支将被命中,都不会出现流水线断流现象,故消除了因分支预测失误而重新装载流水线导致的低效率现象。,4、推测技术推测技术,包括控制推测和数据推测,以减少存储器访问响应时间的影响。控制推测技术和数据推测技术允
5、许提前执行从内存单元至通用寄存器的取数指令。当程序中有分支时,控制推测技术将位于分支指令之后的取数指令提前若干周期执行,以此消除访存延时,提高指令执行的并行度。推测技术避免了cache命中失败而导致访存延迟的损失,消除了因处理机空闲而导致的并行性降低的缺憾。,5、软件流水技术安腾体系结构提供了很强的硬件支持,使循环执行过程中一次循环的代码执行与下一次循环代码的执行在时间上部分重叠,也即下一个循环步可以在上一个循环步结束前开始执行。安腾体系结构引入了新机制来支持软件流水,包括自动寄存器重命名、推断执行和特殊的循环终止指令。因此,安腾处理机能够通过旋转寄存器机制为每个循环步提供自己的寄存器,并且不
6、需要把循环扩展开来。安腾体系结构中硬件对编译器管理软件流水线的支持使得编译器能够生成精简的代码,以高度并行的方式实现循环操作。,6、寄存器堆栈技术安腾处理机利用128个通用寄存器中的96个堆栈寄存器实现寄存器堆栈,并在处理机内部设置一个寄存器堆栈引擎RSE来管理寄存器堆栈。当96个堆栈寄存器不够用时,寄存器堆栈引擎能够自动将寄存器堆栈与内存储器对接,将寄存器堆栈溢出的数据转移到内存储器中保存,或在寄存器堆栈弹出数据时执行反向操作。,9.3 安腾指令系统结构,一、执行单元与指令类型 为提高并行处理能力,安腾处理机内部设置了多个执行单元。这些执行单元被分为四类:I单元M单元B单元F单元,二、安腾寄
7、存器结构与RISC体系结构类似,安腾体系结构大量使用寄存器操作;见下一页图只有取数load和存数store指令才能够访问内存,所有其他指令都在寄存器上操作。在以安腾为基础的处理机内,用户可直接使用的寄存器数量甚至大大超过了主流RISC处理机。一方面可以加快数据存取的速度,减少访存延迟,另一方面可以更好地支持并行操作。,安腾的主要寄存器,9.4指令级并行机制,一、推断执行技术1、分支对系统性能的影响分支是在两个指令序列中根据判定条件选择其中一个序列执行。为了判定最终选择哪一个指令序列执行,必须等待一些条件判断指令的执行结果。指令执行一旦遇到分支转移,在执行判定操作之前,多个功能部件由于无法确定程
8、序的执行方向而空闲等待,使系统性能明显下降。分支预测并不能充分利用处理机流水线的功能部件,2、安腾的推断技术原理推断技术处理分支的方法是利用多个功能部件并行执行各个分支,然后根据判定结果选取某一分支的运行结果,因而可消除大部分的转移,使得整个系统的运行速度得到提高。采用显式并行指令计算技术的安腾处理机将处理机的多个功能部件的并行处理能力与编译器的强大功能相结合,允许在编译时让编译器对程序进行优化,消除转移,提高效率。安腾处理机的指令系统允许在每条指令中都指定一个推断寄存器。,3、安腾处理机设计思想首先,安腾指令系统中的每条指令都能够支持推断执行,所以第二条指令和第三条指令中的条件判断并不需要使
9、用专门的判断指令。虽然后面两条指令是条件执行的,但整体条件判断结构不再需要分支指令。其次,指令中的推断操作的安排是由编译器在编译过程中完成的,不需要处理机在执行指令的非常短的时间内动态安排各条指令的条件执行。最后,每条指令中虽然可以指定推断寄存器,但取指令、指令译码和执行操作并不需要等到推断寄存器的取值确定后再进行。,传统流水线与安腾处理机比较,9.5双核安腾处理机的组成,一、双核安腾处理机的基本特性1、并行处理技术2、显式并行指令计算技术3、超线程技术4、三级大容量高速缓冲存储器5、硬件辅助虚拟化技术6、高速缓存安全技术,虚拟化技术,所谓虚拟化,是指用单个处理机模拟多个处理机并行工作,而每个
10、处理机都可以被看作一个独立的工作环境,从而在一个平台上同时运行多个操作系统,并且每一个操作系统中都有多个程序运行。应用程序在相互独立的空间内运行而互不影响,从而显著提高计算机的工作效率。,超线程技术,在双核安腾处理机中,英特尔首次把在奔腾4处理机中采用的超线程(Hyper Threading)技术引进到安腾处理器家族中,每个处理机支持四个线程,使其能够处理的应用线程数是早期单核产品的四倍。,超线程技术在一颗处理机芯片内设计多个逻辑上的处理机内核,这些逻辑上的内核共享处理机内的整数运算单元、浮点运算单元和二级cache等资源,但却被模拟成多个物理内核芯片。从软件的角度看,系统中好像存在多个独立的
11、处理机内核,因而可以让单个处理机在线程级实现并行计算,支持多线程的操作系统和应用软件。,二、双核安腾处理机的组织结构1、指令执行单元2、处理机流水线3、cache组织4、双核仲裁,双核安腾处理机流水线,显示了安腾处理机的八级内核流水线结构。流水线每个时钟周期可以执行最多6条指令。前两个流水级构成前端,执行取指令操作IPG,指令指针生成,并将指令送入指令旋转级(ROT)的去耦缓冲器。扩展流水级(EXP)实现指令分派,REN级实现寄存器重命名。寄存器读操作级(REG)完成提交操作码操作,在这一级访问寄存器文件并在处理完推断控制后通过旁路网络提交数据。最后三级实现宽并行执行EXE、异常管理(DET)和写回WRB操作。其中异常检测级实现分支解析、存储器异常管理和推测等功能。,双核仲裁器的方框图,双核安腾处理机配置了两个独立的处理机内核,但两个内核之间必须相互协同工作。两个内核通过一个仲裁器连接到系统接口。仲裁器向每个内核提供低延迟的传输路径,以便对系统事件做出响应。,小结:,高性能处理机体系结构的发展过程安腾体系结构的设计思想体系结构的特点安腾指令系统结构,课后练习:,教材P318:1、2、6,The end!,
链接地址:https://www.31ppt.com/p-5700165.html