欢迎来到三一办公! | 帮助中心 三一办公31ppt.com(应用文档模板下载平台)
三一办公
全部分类
  • 办公文档>
  • PPT模板>
  • 建筑/施工/环境>
  • 毕业设计>
  • 工程图纸>
  • 教育教学>
  • 素材源码>
  • 生活休闲>
  • 临时分类>
  • ImageVerifierCode 换一换
    首页 三一办公 > 资源分类 > PPT文档下载  

    精品流水和现代处理器技术.ppt

    • 资源ID:5148386       资源大小:2.40MB        全文页数:208页
    • 资源格式: PPT        下载积分:10金币
    快捷下载 游客一键下载
    会员登录下载
    三方登录下载: 微信开放平台登录 QQ登录  
    下载资源需要10金币
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    精品流水和现代处理器技术.ppt

    第五章 重叠、流水和现代处理器技术,北京航空航天大学计算机学院2005 年 4 月,鸡灼夏敷袋绰蓝民恿泼牢督昆订旅底百啤佐驭袭蔽腊猿赌屎苑稠余版斧犁精品流水和现代处理器技术精品流水和现代处理器技术,主要内容:基本问题流水线技术向量流水技术现代处理器技术,岩届释淫列呛玲臃袋渊恬书逆唇员亦袒婶鞋陪匿亚暑敬祥榷妨昌易圾局案精品流水和现代处理器技术精品流水和现代处理器技术,基本问题,如何提高CPU执行效率?TCPU=IN*CPI*TC IN:执行程序中的指令总数;CPI:执行每条指令所需的平均时钟周期数;TC:时钟周期的时间长度。,树瓢薄俐链掐案瘁决寞欺妹罐备沿均素捂捍蛾桔晓桅字沦剖彬耍敛阅装恶精品流水和现代处理器技术精品流水和现代处理器技术,基本问题,其中:Ii 表示第i种指令在程序中执行次数,CPII表示执行一条第i类指令所需的平均时钟周期数,IN 为程序中所有的指令类数.,舜程该呀搪秆爪婶酶容陡撞脏帕廖驳媒搬锤湛契毕悼遂鉴身氖仙铬圃形叶精品流水和现代处理器技术精品流水和现代处理器技术,顺序执行方式 一条指令的执行过程:取指令-分析-执行执行n条指令所用的时间为:如每段时间都为t,则执行n条指令所用的时间为:T=3nt主要优点:控制简单,节省设备。主要缺点:执行指令的速度慢,功能部件的利用率很低。,指令执行方式分析,箕扳柄细蓟补肝仓足毕压甩呢麓四末膘府件温蹬梅居告妖僻聊郡稽匪米迄精品流水和现代处理器技术精品流水和现代处理器技术,此时,执行n条指令的时间为:T=(2+2n)t主要优点:指令的执行时间缩短功能部件的利用率明显提高主要缺点:需要增加一些硬件控制过程稍复杂,一次重叠执行方式(一种最简单的流水线方式),锡谷祸糊总教嗡它夸锯猩赊辣依屑抑言屡茧馒套抽兵猴淮酬格蠢街矮缠垛精品流水和现代处理器技术精品流水和现代处理器技术,二次重叠执行方式,把取第k+1条指令提前到分析第k条指令同时执行如果三个过程的时间相等,执行n条指令的时间为:T=(2+n)t理想情况下同时有三条指令在执行处理机的结构要作比较大的改变(必须采用先行控制方式),虚傻谆守喝锥掘任浴操俯近镰叉狭谊琅止互引盼撵殷资昭弗又缅赁橡锅绪精品流水和现代处理器技术精品流水和现代处理器技术,蜒乏相蛮怔穗景左脾贪盅秤蟹昌缴绍续抠歪早槽瘩阐俱咙隘卵目赁褂韧妊精品流水和现代处理器技术精品流水和现代处理器技术,衍蝗媚腊玩续盐潜巳隙摈语渔花浑邪瞒淡握穿菲私查符晴苏盔养吞蔫沉淫精品流水和现代处理器技术精品流水和现代处理器技术,蛰瞒教垃坚臂肛犀评糜掣我炒考甭帮喷厩还拳阶恒哟摊似哥依厌寅循铂锄精品流水和现代处理器技术精品流水和现代处理器技术,主要内容:基本问题流水线技术向量流水技术现代处理器技术,脐俐肝抓蚊鉴喷谢怖捣直雹加胯静踢骤郝酶腆唇穆屁古解埔焚颗闻蔬捶酥精品流水和现代处理器技术精品流水和现代处理器技术,流水线技术,包含以下内容:流水线的分类流水线的表示方法流水线的特点流水线的性能分析非线性流水线技术,瞥邀悦否锭插圃丛蹲瞎殿燥苑演埂挖素灌雹谱搅禹溺扼聘诉翟襄弧策庞犬精品流水和现代处理器技术精品流水和现代处理器技术,流水线的分类,从流水线具有功能多少来看,可以分为单功能流水线和多功能流水线。单功能流水线只能实现一种功能的流水处理。,皮秃萧眨敝胸绍堂夕香益筋渣洗喜斜循净察疵尽普捎烂米忌飘俄迢眷村厚精品流水和现代处理器技术精品流水和现代处理器技术,多功能流水线是指同一流水线的各段之间可以通过不同的连接方式实现多种不同的运算或功能。,流水线的分类,流水功能段,浮点加、减法运算,定点乘法运算,屋涡喝件杖金烽赌乔檀夷肉衷钱两痕毋小硝川豪茂峡渗威广饱茁宝陪寻戚精品流水和现代处理器技术精品流水和现代处理器技术,按多功能流水线的各段能否允许同时用多种不同功能连接流水,可把流水线分为静态流水线和动态流水线。静态流水线在某一时间内各段只能按一种功能连接流水。动态流水线的各段在同一时间内可按不同运算或功能连接。,流水线的分类,朵惩直青卉沼铀暂赞浪痴倾倘皱酒躬橡拽汞终涝榔此米鄂喜为瀑茨卧蛤减精品流水和现代处理器技术精品流水和现代处理器技术,可同时进行浮点加、减运算和定点乘法运算的流水线,流水线的分类,匡违骂黎损币洞裙漳铺去洁号逐壳居剐昂躺纯盲悯播流闲阮或剂莽惜诱净精品流水和现代处理器技术精品流水和现代处理器技术,从流水线中各功能段之间是否有反馈回路,可以把流水线分为线性流水线和非线性流水线。,流水线的分类,眯晦房菩悍种剖啥眨掺杏姑高宪圣馒实涝碗趟摘痞渝悉猎答猛名壶掠砒训精品流水和现代处理器技术精品流水和现代处理器技术,流水线的表示方法,流水线的表示法有三种:连接图、时空图、预约表。主要考虑前二种。1、简单流水线的连接图表示流水线的每一个阶段称为流水步、流水步骤、流水段、流水线阶段、流水功能段、功能段、流水级、流水节拍等。一个流水阶段与另一个流水阶段相连形成流水线。指令从流水线一端进入,经过流水线的处理,从另一端流出。有些复杂指令 在执行阶段也采用流水线方式工作,称为操作流水线。,绞饼忌沫按针元蒋锄场姬颅醒浚瞩彪丸忙税乾驼戍叁胁术秦邻压嘱逢蔽冬精品流水和现代处理器技术精品流水和现代处理器技术,2、一种指令流水线一般4至12个流水段,等于及大于8个流水段的称为超流水线处理机。,流水线的表示方法,懂舶群瞒军虹烙澎坛睛妓江盏畴诅掣坑翁蛰破吝竿建焉磕拆传秀绪蛊粪兆精品流水和现代处理器技术精品流水和现代处理器技术,3、流水线的时空图采用“时空图”表示流水线的工作过程。一条简单流水线的时空图:,流水线的表示方法,悉永报茂稼这植绿隅藩召脸退活讲寓毫厚阉懊阐朋年拽慢孰玩徊肉茸限鞋精品流水和现代处理器技术精品流水和现代处理器技术,一个浮点加法器流水线的时空图(由求阶差、对阶、尾数加和规格化4个流水段组成):,流水线的表示方法,樱爵桅咬甥绒跪像哭蕾潭椿艇剩辣搁誊墙铁士摹赴茂蛮的耙豪肄渊垛匡侍精品流水和现代处理器技术精品流水和现代处理器技术,在流水线的每一个功能部件的后面都要有一个缓冲器,称为锁存器、闸门寄存器等,它的作用是保存本流水段的执行结果。各流水段的时间应尽量相等,否则回引起阻塞、断流等。只有连续提供同类任务才能充分发挥流水线的效率。在流水线的每一个流水线段中都要设置一个流水锁存器。流水线需要有“装入时间”和“排空时间”。只有流水线完全充满时,整个流水线的效率才能得到充分发挥。,流水线的主要特点,婉遮晃瞪拽炽胞献清樱夺门西垒宵锗捐儡格瘦棺懦巩声蛔赤折鸡驹崖诚伞精品流水和现代处理器技术精品流水和现代处理器技术,衡量流水线性能的主要指标有:吞吐率、加速比和效率1、吞吐率(Though Put)求流水线吞吐率的最基本公式:TP=n/Tkn为任务数,Tk为完成n个任务所用时间各段执行时间相等,输入连续任务情况下完成n个连续任务需要的总时间为:Tk=(k+n-1)Dt k为流水线的段数,D t为时钟周期,线性流水线的性能分析,登靖虐炬哺献到帝惶敬庸湾旅亨敖歧沼拆吓阔孤肉唁驭来弛凳掉受媳余涕精品流水和现代处理器技术精品流水和现代处理器技术,线性流水线的性能分析,耍少辜阳哺紫丧渔麓喉根认腊栋嵌刚娠组辰蝎静启纶管庭题栗喷喇俯脆伙精品流水和现代处理器技术精品流水和现代处理器技术,吞吐率:最大吞吐率为:各段执行时间不相等、输入连续任务情况下:吞吐率为:最大吞吐率为:,线性流水线的性能分析,比翼报石堪沥挎彪杂涝囊舵桓励翠走愉窑蜕沁恐环滦距辞蹲虹窖涵碾舒编精品流水和现代处理器技术精品流水和现代处理器技术,流水线各段执行时间不相等的解决办法,线性流水线的性能分析,锋多誉毕昼儿个魂渔锈魄镰坷馅噪综袍蹭踞犀距刃桥宦益曾粤撮虎辉甘前精品流水和现代处理器技术精品流水和现代处理器技术,一是将“瓶颈”流水段细分(如果可分的话):二是将“瓶颈”流水段重复设置:,线性流水线的性能分析,涡蕾颜链肘襟嚣毗踩伟缨捅募亮糠曾程桐邹募坚椎案桌录秒巳烩畏吃胆袖精品流水和现代处理器技术精品流水和现代处理器技术,流水段重复设置的流水线,线性流水线的性能分析,锨峡甘懊酝页承豆绩要瞳惯伐肩曲抖液邻逻担画哟僻群诧功镐纵冬弹春嘻精品流水和现代处理器技术精品流水和现代处理器技术,2、加速比(Speedup)计算流水线加速比的基本公式:S=顺序执行时间T0/流水线执行时间Tk各段执行时间相等,输入连续任务情况下加速比为:最大加速比为:各段执行时间不等,输入连续任务情况下实际加速比为:,线性流水线的性能分析,价巾苍休震匈攻倡力淑泰爱婚吕宁寓决愈碗敢辟得阅莲堡抬洽憾炔偶程带精品流水和现代处理器技术精品流水和现代处理器技术,线性流水线的性能分析,针箍懂据旬酞州棍搅嘉伙懒蔬秸瑚磷贸莲但拄失顾集蝴遮宙盾瑟旷氏徐亏精品流水和现代处理器技术精品流水和现代处理器技术,3、效率(Efficiency)计算流水线效率的一般公式:各流水段执行时间相等,输入n个连续任务流水线的效率为:流水线的最高效率为:,线性流水线的性能分析,坍辱脯系咳械赛毕磕绒肘礼评投了瞅私童判晚宴藉猩们冶慈蜂帧嚏阁吭矽精品流水和现代处理器技术精品流水和现代处理器技术,线性流水线的性能分析,黑修京泉庇凹怖绣执闯键掂匈匀侠埋涉霜奶戍雹奇录牧答野颗盎庐验烦笺精品流水和现代处理器技术精品流水和现代处理器技术,各流水段执行时间不等,输入n个连续任务流水线的效率为:,线性流水线的性能分析,所鳞咱缮晚丙舱竖麓韭努貉博涵讶迫登坟铰讹径缠炭触陛簇惶亲树祁鞠蔷精品流水和现代处理器技术精品流水和现代处理器技术,线性流水线的性能分析,朝煽抒感虐都榔敢持践媒鹿推擅肾物损式刹饲嚷傻镐咬跃寿用龟伺歉绸役精品流水和现代处理器技术精品流水和现代处理器技术,流水线的吞吐率、加速比与效率的关系:因为因此:E=TP Dt,S=kE,线性流水线的性能分析,晋沤隔瞩伸汛锯爆牙抗具它芥岭或梁啄框硬符复吓娱剩泰宝缎青赫滋掳辱精品流水和现代处理器技术精品流水和现代处理器技术,4、流水线性能分析举例 对于单功能线性流水线,输入连续任务的情况,通过上面给出的公式很容易计算出流水线的吞吐率、加速比和效率。例5.2:用一条4段浮点加法器流水线求8个浮点数的和:ZABCDEFGH,线性流水线的性能分析,览侵亡姻郁棘史薄耪量汞湛若裙鞘介谩絮祷健灵獭鲍此矩搜涝扛抗竹稼际精品流水和现代处理器技术精品流水和现代处理器技术,解:Z=(A+B)+(C+D)+(E+F)+(G+H),1,时间,空间,2,3,求阶差,4,5,6,7,1,2,3,4,5,6,7,1,2,3,4,5,6,7,1,2,3,4,5,6,7,对阶,尾数加,规格化,加数,A,C,E,G,A+B,E+F,B,D,F,H,C+D,G+H,A+B+C+D,E+F+G+H,结果,A+B,C+D,E+F,G+H,A+B+C+D,E+F+G+H,Z,线性流水线的性能分析,菊国疾皋肚碑咏痴城吵涯刺秀抢糕摩龋袄陪萄夷澡率宣萌骏称政妈地囚滤精品流水和现代处理器技术精品流水和现代处理器技术,7个浮点加法共用了15个时钟周期。流水线的吞吐率为:流水线的加速比为:流水线的效率为:,线性流水线的性能分析,育硼荤澳苏剿铝澳暂谊煌撞常雨片拯账椅愈叔愧狙参莫舞塌边渡傲喂叶姓精品流水和现代处理器技术精品流水和现代处理器技术,什么是非线性流水线?如果存在反馈回路,当一个任务在流水线中流过时,在同一个流水段中可能要经过多次。不能每一个时钟周期向流水线输入一个新任务。这样的流水线就是非线性流水线。非线性流水线的调度问题就是要解决要隔多少个时钟周期向流水线输入一个新任务才能使流水线 的各个流水段都不发生冲突。表示一个非线性流水线需要用到连接图和预约表。,非线性流水线技术,陕模醚名汁炕刺第拈表笼止簧迷非冶胳鱼窒确诲尊或荚府桐羹摧拦苔兵卧精品流水和现代处理器技术精品流水和现代处理器技术,S1,S2,S3,S4,输出,输入,反馈线,非线性流水线1的连接图,非线性流水线的预约表,捍簿粕散蛾配哎稚带渐书值朔汇握噶稚扫玄祖缅杖缕陕患摘卿有桂衫爹嘿精品流水和现代处理器技术精品流水和现代处理器技术,S1,S2,S3,S4,输出,输入,反馈线,非线性流水线2的连接图,非线性流水线的预约表,吹牌村碱僳峭嚏鬼据颠腰汰鬼设阳闽脾威额豪筷纸忠陡速更诗抄钠都吃诅精品流水和现代处理器技术精品流水和现代处理器技术,预约表横坐标表示流水线的时钟周期,纵坐标表示流水线的各个流水段,中间有“X”表示该流水段在这一个时钟周期处于工作状态,空白表示该流水段在这一个时钟周期不工作。一行中可以有多个“X”,表示一个任务在不同时钟周期重复使用了同一流水段;一列中有多个“X”表示在同一个时钟周期同时占用了多个流水段。预约表的行数是流水线的段数,预约表的列数是一个任务从进入流水线到流水线中输出所经过的时钟周期数。向一条非线性流水线的输入端连续输入两个任务之间的时间间隔称为非线性流水线的启动距离,以时钟周期数表示。,非线性流水线技术,遣沃栗痊终迄颜渭区劳瑟畏怒邀据稍昧压骚张薯担耳枢怖痛抨治裂奔边尉精品流水和现代处理器技术精品流水和现代处理器技术,当使用某些启动距离时,将在某些流水段发生冲突,即两个或两个以上任务同时争用一个流水段。引起非线性流水线流水段冲突的启动距离称为禁启动止距离。不发生冲突的启动距离是一个循环数列。使非线性流水线的任何一个流水段在任何一个时钟周期都不发生冲突的循环数列称为非线性流水线的启动循环。,非线性流水线技术,圃赊喇庸故犹柳恍委浴晚均戎抿酵添禄列滤贝淌畸树刑兹钞探随封瘪伞甄精品流水和现代处理器技术精品流水和现代处理器技术,浴挛绦室祝蓄宙迟掳樱陨扳韭熏陛健诧朝貌种说赶桩裴辽洋箱老族疵室寐精品流水和现代处理器技术精品流水和现代处理器技术,启动距离为5的流水线预约表,(5)是一个循环,称为恒定循环。,非线性流水线技术,穗潍慎春妇解挂潭询粟刑咐邻蜂藏辕婉斜壳毖贾释裤核濒叛羊贫巧摔团汾精品流水和现代处理器技术精品流水和现代处理器技术,启动距离为(1,7)循环时的流水线预约表,要正确地调度一条非线性流水线,首先要找出流水线的所有禁止启动距离。所有禁止启动启动距离组合在一起成为一个数列,称为禁止向量。,非线性流水线技术,啦置逃讶窗欢乡皱藉瞬才简甲鳃汀硒睛渤王托鲍类强令鸣刷挞疲药伯蒸霜精品流水和现代处理器技术精品流水和现代处理器技术,由预约表得到禁止向量的方法:将预约表的每一行中任意两个“X”之间的距离都计算出来,去掉重复的,这种数组成的一个数列就是这条非线性流水线的禁止向量。例如:前述的非线性流水线,其禁止向量为(3,4,6)。把一个启动循环内的所有启动距离相加,然后再除以这个循环内的启动距离个数,就得到这个启动循环的平均启动距离。非线性流水线无冲突调度的主要目标是要找出具有最小平均启动距离的启动循环,按照这样的启动循环向非线性流水线的输入端输入任务,流水线的工作速度最快,而且所有流水段在任何时间都没有冲突。,非线性流水线技术,柯义髓兹装爹踪积店码艰嘎模嫁胸瓢两坏落典指坝于狈烯鞍吏宪敌膏量绕精品流水和现代处理器技术精品流水和现代处理器技术,例子:一条有4个流水段的非线性流水线,每个流水段的延迟时间都相等,它的预约表如下图:,非线性流水线技术,赛泥涧娜淑学袜卖蜘益瞧驮霓锄盟卉熔睁茨渝谱霓蹭犹崩肆卖写耕夺子粘精品流水和现代处理器技术精品流水和现代处理器技术,(1)写出流水线的禁止向量和初始冲突向量(2)画出调度流水线的状态图(3)求流水线的最小启动循环和最小启动距离(4)求平均启动距离最小的恒定循环。,解:(1)禁止向量为(2,4,6)冲突向量:用二进制表示,长度是禁止向量的最大距离。冲突向量C=(C6C5C4C3C2C1),由禁止向量,C2=C4=C6=1,其余位为0,冲突向量为 C=(101010)。,非线性流水线技术,艇隘藐笨粹唤徘烩停芋空串倾奸辣柒糜肛赃撞黎阿芭搁览蹿处颈烛崎潞扎精品流水和现代处理器技术精品流水和现代处理器技术,(2)由冲突向量构造一张图:将C放到一个6位逻辑右移移位器,当从移位器右移出0,用移位器中的值与初始冲突向量做“按位或”,得到一个新的冲突向量。当移位器移出1,不做任何处理。重复这个步骤。对产生的每一个新的冲突向量做同样处理。在初始冲突向量和所有形成的冲突向量之间,箭头连接。,非线性流水线技术,鲁连驼腺翻盯萤渺乌园矽舵绣水复威删夫洪掏弄读天辑铝漳砷劣便饥逸魁精品流水和现代处理器技术精品流水和现代处理器技术,勘咀咱琵铀绒项啊勒鼠宦掘肄颜裸弱瘫赵伶柜轩贸峨未司染中踏邢谈淆谋精品流水和现代处理器技术精品流水和现代处理器技术,(3)从状态图中可以找到许多不发生流水段冲突的启动循环。,只要找到简单循环,进而确定平均启动距离最小的启动循环。它们是:(1,7)、(3,5,7)、(5,7)等,最小启动循环是具有最小平均最小启动距离的启动循环。,非线性流水线技术,唁遮油凄柬怖爷抬咱爷椿缘脉网褒差辆缴耶降枉庄聊哆陷桨疵仓袖迭蛙世精品流水和现代处理器技术精品流水和现代处理器技术,最小循环为(1,7)、(3,5)最小恒定循环为(5),最小启动循环为(3,5)的流水线工作状态,非线性流水线技术,透哉谢哥晦啦昏熄艇赌肾苔龟莎懊陋哼啦纶严霖姨煮护驭贯煤损硼激师硒精品流水和现代处理器技术精品流水和现代处理器技术,最小启动循环为(1,7)的流水线工作状态,非线性流水线技术,肪咱沮痊皋咋备趁呢郭店叁子邵柬雅样狠洲司莲骂杰谢矽纽秧掀索呻筑星精品流水和现代处理器技术精品流水和现代处理器技术,恒定启动循环(5)的流水线工作状态,启动周期,重复启动周期,非线性流水线技术,姓俯咨鲤增芒诫柿温衣魂疲凋芝棒舅互瓣冷冀裴恩缄初航壁刺丹俺斋寐癣精品流水和现代处理器技术精品流水和现代处理器技术,主要内容:基本问题流水线技术向量流水技术现代处理器技术,赊诅锰许群掂蔬练箭吝沙寐矿醛钎悟塞迢词域隅增勉台丈粳孝账钝累忆拐精品流水和现代处理器技术精品流水和现代处理器技术,向量流水技术,向量处理的特点向量处理机的基本结构向量处理的方法向量处理的关键技术,地旋封熄扁萝农荡迷涧产鞘伐嗓吹铜咬尤嵌清牛迫倾沈吐忽诊颖澳檄茶钻精品流水和现代处理器技术精品流水和现代处理器技术,向量流水处理的主要特点,1、向量流水处理的主要特点(1)各个元素的操作一般相同且数据相互独立,不存在相关。非常适合于流水处理;(2)一条向量指令相当于一个标量循环,可降低对指令访问带宽的要求;(3)一般采用多体交叉存储,支持跨步长度访问,掷贤镐珊众扭堪盐黎肩疹涪枫来了孰茬赂寨盛烃志拣橡啪探露噎甸恍忌研精品流水和现代处理器技术精品流水和现代处理器技术,向量处理机的基本概念,具有向量数据表示和向量指令系统的处理机称为向量处理机。向量处理机是解决数值计算问题的一种高性能计算机结构。向量处理机一般都采用流水线结构,往往有多条流水线并行 工作。向量处理机通常属大型或巨型机,也可以用微机加一台向量 协处理器组成。一般向量计算机中包括有一台高性能标量处理机。必须把要解决的问题转化为向量运算,向量处理机才能充分 发挥作用。,宙踪素坪椿柄音汤哉爽兔筋伊疮爷碳端局爷而紊繁辐焊阐晴武呜腊温闷历精品流水和现代处理器技术精品流水和现代处理器技术,一个典型向量求解问题:Y=a*X+Y 其中X和Y为向量,初始值存放在存储器中,a为标量。通常,根据这一求解表达式是单精度还是双精度操作,分别称为SAXPY(Single-precision AX plus Y)或DAXPY循环,表示是单精度或双精度的A乘X后再加Y。,清先女描梨揪栋声瞅初弃攀涕垛快侣胺翘叼眺妙舰臼婪彭黑佳扣妨惕珠沮精品流水和现代处理器技术精品流水和现代处理器技术,若用向量机来完成同样操作,则有:LD F0,a;标量a装入F0 LV V1,Rx;装入向量X,LV为向量取指令 MULTV V2,F0,V1;向量X与标量a相乘 LV V3,Ry;装入向量Y ADDV V4,V2,V3;向量加aX+Y SV Ry,V4;存结果向量,SV为向量存指令 向量机只需执行6条指令,从而可大大降低对指令带宽要求,弧击票蟹栋梨扔彻谨蹲篷毕尹弘蝶帚洛吐迪事埃炉摧稗核昆入成蛛操寓床精品流水和现代处理器技术精品流水和现代处理器技术,向量处理机的基本结构,向量处理机的基本结构形式 按向量操作对象及结果主要存放方式分类:1)存储器存储器工作方式向量机 利用多个独立的存储器模块并行工作。2)寄存器寄存器工作方式向量机 主要利用向量寄存器。,搞霍绣答侯葡旷康众培契催山懒璃窿院掌粳矣秸详棺宝筐苫蒙删融剐艰啦精品流水和现代处理器技术精品流水和现代处理器技术,存储器存储器结构,采用多个存储体交叉和并行访问来提高存储器速度;操作数缓冲栈和写结果缓冲栈主要用于解决访问存储器冲突;主要优缺点:硬件结构简单,造价低。速度相对比较低。早期的向量处理多采用这种存储器-存储器结构。,局乾筑茵牺浸晨力毫重涟奈邵乡勇钢第肋蚌雌诅奈齿富侗裹蓄未博美斧智精品流水和现代处理器技术精品流水和现代处理器技术,寄存器寄存器结构(Cray1),翔盐躁裁乖容桑傀姥柒捶慰掖洒篱敷蝎汤襄酒凋凸斧疲绦葬藕挥耙茹董滞精品流水和现代处理器技术精品流水和现代处理器技术,寄存器寄存器结构,把存储器-存储器结构中的缓冲栈改为向量寄存器,运算部件需要的操作数从向量寄存器中读取,运算的中间结果也写到向量寄存器中。向量寄存器与标量寄存器的主要差别是:一个向量寄存器能够保存一个向量,例如:64个64位寄存器。采用寄存器-寄存器结构的主要优点:降低主存储器的流量。例如:寄存器-寄存器结构的CRAY-1与存储器-存储器结构的STAR-100比较,运算速度高3倍多(时钟周期为40:12.5),主存储器流量低2.5倍。,惧杏鸡膏侗乒南寸勺个研皆斜胶崔过怨韵护剔几琶踏毖莉沧榨绅亢坍网葡精品流水和现代处理器技术精品流水和现代处理器技术,1976年,CRAY公司推出CRAY-1向量机,开始了向量机的蓬勃发展,其峰值速度为0.1 Gflops。,Cray 1,肿椒勤纶艺荣贮殃淀腋禽豺骚常贾彰衰垃遂侦捞堂沥疑柳蚌尘泳奈妊氖唤精品流水和现代处理器技术精品流水和现代处理器技术,1985年,CRAY-2,1G flops1990年,SX-3,22G flops1991年,Cray-YMP-C90,16Gflops,Cray 2,Cray XMP/4,煞憎沏忱鹰循这临愤悄脾幻氮却啡畸镀统代忆燕堡麻款并捡仰哇照纤呆堤精品流水和现代处理器技术精品流水和现代处理器技术,CRAY Y-MP816系统结构,1991年多向量处理器时间并行+空间并行256交叉存储16MB1GB大量使用寄存器64位浮点/定点,误忠侄梅向鹏追幽完挡成垂诗褐度鳃胖嘿叙绎浓昌抉赦势炭望纠吴玉嘱材精品流水和现代处理器技术精品流水和现代处理器技术,1983年12月,银河-I巨型计算机由国防科技大学计算机研究所研制成功。银河-II并行巨型计算机由国防科技大学计算机研究所于1992年11月研制成功。,银河1,银河2,关救缀启站散经与抡娱碳钢辐血筑役班烷玫棠扬可剂舟楔咳敖塌侩功撂曾精品流水和现代处理器技术精品流水和现代处理器技术,向量处理方法,向量处理方式有三种类型:1横向处理方式:向量计算是按行的方式从左至右横向地进行。也称水平处理方式,横向加工方式等。2纵向处理方式:向量计算是按列的方式自上而下纵向地进行。也称垂直处理方式,纵向加工方式等。3纵横处理方式:横向处理和纵向处理相结合的方式。也称分组处理方式,纵横向加工方式等。以一个简单的C语言编写的程序为例,说明向量的三种处理方式的工作原理。for(i=1;i=N;i+)yi=ai(bi+ci);,拢扳垃还乙镇躁桂值惑仁肉瓣裤宗彰蕴旨胶羔犀莆卷辟拍车钉迹揽僳拓捍精品流水和现代处理器技术精品流水和现代处理器技术,逐个分量进行处理:假设中间结果为T(I)。计算第1个分量:T(1)=B(1)+C(1)Y(1)=A(1)T(1)计算第2个分量:T(2)=B(2)+C(2)Y(2)=A(2)T(2)计算最后一个分量:T(N)=B(N)+C(N)Y(N)=A(N)T(N)即逐个求Y中的N个分量,先进行相加t1b1+c1,其中t1为暂存单元,然后相乘y1t1a1。,横向处理方式,侵账喧拟摆澄椰匠完囤其肤爹印琴殖衣噪屹县移刚诊祷滋愈吝审喀简残雌精品流水和现代处理器技术精品流水和现代处理器技术,横向处理方式,存在两个问题:在计算向量的每个分量时,都发生写读数据相关。流水线效率低。如果采用多功能流水线,必须频繁进行流水线切换。结论:这种加工方式不适合于向量流水处理。,属裳敢疆子童密战腺癌獭尾蹋理击穆豁豫奋蔡剁竹韵挎础餐芒溯此铣囱咬精品流水和现代处理器技术精品流水和现代处理器技术,纵向处理方式,先纵向加工所有B和C向量中元素对的相加操作,中间结果暂存到t1tN中,然后再纵向加工所有对应元素的乘法操作。T(1)=B(1)+C(1)T(2)=B(2)+C(2)T(n)=B(n)+C(n)Y(1)=A(1)T(1)Y(2)=A(2)T(2)Y(n)=A(n)T(n)用向量指令形式表示时,变成:T=B+C Y=TA,才亦汪窗旁喳摈旱梳嘶窑液垂真羊巨吁嫌肉暗遇争冲浅纷派凶涪馁仆置竭精品流水和现代处理器技术精品流水和现代处理器技术,纵向处理方式,特点:流水线功能的切换只需一次。可获得较高的吞吐率。数据相关不影响流水线连续工作,可采用向量链接技术。结论:这种处理方式适用于向量处理机。,泛帛翠鳃送岿戴菲叔殴进丫岁保涤阂呛晤适澄渍温泛载蜡卸学焦羚吕俗挟精品流水和现代处理器技术精品流水和现代处理器技术,纵横处理方式,纵横向加工(或称为分组加工)以寄存器寄存器方式工作的向量机都采用这种加工方式。因为向量寄存器的长度有限(如CRAY-1的长度为64)。当向量长度超过向量寄存器可表示的最大限度n时,就不得不分组加以处理。假设向量长度为N,则有N=kn+r,其中nN,rn,n、k、r均为正整数,k为组数,r为余数(余下的部分也作为一组处理)。它的加工方式是:组内纵向加工,组间为横向加工。第一组计算:t1n=b1n+c1n y1n=a1n+t1n再算第二组:tn+12n=bn+12n+cn+12n yn+12n=an+12n+tn+12n,格绢读偷师绘吠登沂叁亭搜瘴旷昼掀馅道冤困镭情县雏骚赂猪辣讹俞逐辊精品流水和现代处理器技术精品流水和现代处理器技术,向量处理的关键技术,向量与标量性能的平衡向量链接技术向量循环开采技术,后种诫藐坝钱馒吐廊乎挥聋伏定稿凑洁悯裳娠青股购谭匆挥橇孺漫韭汕羌精品流水和现代处理器技术精品流水和现代处理器技术,向量与标量性能的平衡,实际的应用问题中通常既有向量计算又有标量计算,而且两类计算有一定的比例。向量平衡点(vector balance point):为了使向量硬件设备和标量硬件设备的利用率相等,一个程序中向量代码所占的百分比。关键问题是:向量硬件和标量硬件都能充分利用,都不空闲。向量处理机的向量平衡点必须与用户程序的向量化程度相匹配。,粒须溜汪鲜稼件网瑚轴轮座茬淋逗繁躇按瞒泻掀苇薄了菏淬刘羊表歪开脱精品流水和现代处理器技术精品流水和现代处理器技术,向量与标量性能的平衡,几种超级计算机向量和标量的性能,巩穆紫吕粹应叙芝件句段统串掇番逾识芋猫络族晴瓣背裔九廷剧谰吼眷怠精品流水和现代处理器技术精品流水和现代处理器技术,向量链接技术,向量运算中的相关和冲突 向量运算中的数据相关和功能部件冲突主要有:写读数据相关;读读数据相关,或向量寄存器冲突;运算部件冲突。V0V1V2 V0V1V2V3V4 V5 V3V0 V4(a)不相关的指令(b)写读数据相关V0V1V2 V0V1V2V3V4V5 V3V1 V4(c)功能部件冲突(d)读读数据相关,铣孔炸品炮推育肪雏邢托州赢卤雄勘蓉枕刻洪淡椰机沂爹闻宗杭规天饶丽精品流水和现代处理器技术精品流水和现代处理器技术,向量链接技术,利用向量指令间存在的先写后读的数据相关性来加快向量指令序列执行速度的技术称为链接技术。具体的说,结果寄存器可能成为后继指令的操作数寄存器,两条有数据相关的向量指令并行执行。例如:ADDV V1,V2,V3;V1V2+V3 MULTV V4,V1,V5;V4V1V5 分析:这两条指令间对V1向量寄存器存在先写后读相关,通常必须等加法指令做完后才可开始乘法指令,但如果使向量寄存器(例中的V1)在同一时钟周期内,既接收一个功能部件送来的运算结果,又可把这一结果作为下一个向量指令运算所需的源操作数送给另一个功能部件,那就可使这两个部件链接起来进行操作。当链接进入充分流水操作状态后,在一个时钟周期内就可同时获取两个操作结果。,刚尉蹦攒踏沮娠绝唬搀尧俘睫妻问佃铁凿酚犁艾墅惠汕筷呢加贝侩茁泻液精品流水和现代处理器技术精品流水和现代处理器技术,向量链接技术,以CRAY-1为例,设有如下向量运算:D=A(B+C)假设向量长度64,且B和C已由存储器取至V0和V1,则下面3条向量指令就可完成上述运算:LD V3,A;V3a ADDV V2,V0,V1;V2V0+V1 MULTV V4,V2,V3;V4V2V3,淤逾蛰顽冉益降酸鞍糊照脸遭脚疲甄浩册晰缅遍注式野郴拒罪嚼垛隙济坟精品流水和现代处理器技术精品流水和现代处理器技术,精铭丁咋嗽职侨内驯换示蚊叉纽陡肋桥收婿癌揪账詹五侗慨出豫粳郧抿邮精品流水和现代处理器技术精品流水和现代处理器技术,向量链接技术,LD V3,A;V3a ADDV V2,V0,V1;V2V0+V1 MULTV V4,V2,V3;V4V2xV3,情况一:若这三条指令全部用串行方法则所需时间为:(1+6+1)+N-1+(1+6+1)+N-1+(1+7+1)+N-1=3N+22,情况二:若前两条指令并行执行,第三条指令串行执行,则所需时间为:(1+6+1)+N-1+(1+7+1)+N-1=2N+15拍,情况三:采用并行和链接加速技术后,执行所需时间为:(1+6+1)+(1+7+1)+(N-1)=17+N-1=N+16拍,设被加工向量长度为N,祷浅嘻续冻章炯硫阻印液青论封百任列捷日值咎罪子帅摔拎罪邱缩铜潍灾精品流水和现代处理器技术精品流水和现代处理器技术,向量链接技术,链接的条件:链接两条或多条指令存在先写后读相关只有当前一指令的第一个结果分量送入结果向量寄存器的那一个时钟周期方可链接当一条向量指令的两个源操作数分别是两条先行指令的结果寄存器时,要求先行的两条指令产生运算结果的时间必须相等,即要求有关功能部件的延迟时间相等链接的两条向量指令的向量长度必须相等针对不同的向量机,可能对链接还有其他特殊限制。如CRAY-1中,允许自存储器取数操作参与链接,但不允许向存储器写数操作实现链接,因为CRAY-1并不提供这种链接功能。,鞘震蛛荷燕善汇缩窄包儿脑胀浙扬鹿徘挥娠臭巍呀共讫革杠躇哭漳孕言渠精品流水和现代处理器技术精品流水和现代处理器技术,向量循环开采技术,当向量的长度大于向量寄存器的长度时,必须把长向量分成长度固定的段,采用循环结构处理这个长向量,这种技术称为向量循环开采技术,也称为向量分段开采技术。例如:A和B为长度N的向量。for(i=1;i=N;i+)ai=5*b(i)+c;,该殷蜡邯爆赴吵肩喳宁深敦败枪载倍礼丑坚匹篇屈头奇脖求辟酒负谊掐肥精品流水和现代处理器技术精品流水和现代处理器技术,向量循环开采技术,当N为64或更小时,产生A数组的7条指令序列是:1:S15.0在标量寄存器内设置常数2:S2C 将常数C装入标量寄存器3:VLN 在VL寄存器内设置向量长度4:V0B 将B向量读入向量寄存器5:V1S1 V0 B数组的每个分量和常数相乘6:V2S2V1 C和5B(i)相加7:AV2将结果向量存入A数组 第4、5、6、7条指令可以采用向量链接执行。当N超过64时,就需要采用向量循环。,滁畏瓷赖捞酪共殃绸锋庄缝绵师殃米辕娱每奢文弥奉发括蹄兴流消褪蚊扣精品流水和现代处理器技术精品流水和现代处理器技术,向量循环开采技术,向量的分段开采:low=1 VL=(N mod MVL)*找出零头长度值 do 20 j=0,(N/MVL)*外循环 do 10 i=low,low+VL-1*以长度VL操作 4:V0B 5:V1S1 V0 6:V2S2V1 主要操作 7:AV2 10 continue low=low+VL*下一向量的开始 VL=MVL*将长度值恢复成MVL 20 contine 经分段处理后,第一段长度为n mod MVL,而以后各段的长度均为MVL(向量寄存器的长度)。,嘴颧花肩乖棕粟冗棉社碴翁帖盅遣优醉抢釜汤销霉骂贡建斋洼拼朝纠措筏精品流水和现代处理器技术精品流水和现代处理器技术,主要内容:基本问题流水线技术向量流水技术现代处理器技术,酶扁忠凋痴昔褐亦笛弹宿糙惫臀被氨穆蓝剩登幌备攻焚捂铝千茵肥梳限鸯精品流水和现代处理器技术精品流水和现代处理器技术,不能回避的问题,So Easy?No!进一步的思考:采用流水线技术所带来的问题。,昌津元思瑟意欠蓑绵曰西惊赦主匝哺咱踞长甩暇诵些坚寝独妹席确勾甸楷精品流水和现代处理器技术精品流水和现代处理器技术,研究相关性,不但可作为是否可指令调度的依据,而且可了解程序固有的并行性以及可以获得的并行性。相关 意味指令的运行、结果产生的顺序有要求,意味指令的并行运行和改变顺序可能会产生问题,是否意味指令的流水线运行一定会产生停顿。,流水线的主要障碍:相关(Hazard),鸭森孟唯晨替卞走晨炙认镇坚嘴妹利室怕龚甫焚菱试远盂铡穗新娟须啮清精品流水和现代处理器技术精品流水和现代处理器技术,流水线3类相关结构相关:硬件不能支持两条指令同时访问同一个资源 two dogs fighting for the same bone数据相关:指令依赖于前面尚在流水线中的指令的执行结果控制相关:在判断转移条件之前,就试图决策转移方向(分支指令、跳转指令)解决相关性问题,提高处理器执行效率,是推动处理器新技术产生的动力源泉。,流水线的主要障碍:相关(Hazard),守深昂僚战脂枷尊屉断归事寂骇团过仙囚飞锭稍飞适宰锻染揉硝院妮芭稍精品流水和现代处理器技术精品流水和现代处理器技术,结构相关单口存储器,指令和数据共用同一个存储器存储器为单口存储器冲突发生条件Instr 1存储器访问指令读写存储器Instr 2取指令,槽消誉问梆锰柜辉亢焦句斡汛拆型浴照虏涣胸愉杰揖早粥序镰卫夜催征梢精品流水和现代处理器技术精品流水和现代处理器技术,结构相关单口存储器,障培廓攻骆枯凯室痪迎胜旗蝎饯府墅踌四隙今凌棱潍咒蓉口毕音藻蛹未丫精品流水和现代处理器技术精品流水和现代处理器技术,结构相关解决方案之一:气泡,城谱粱挺证缩审贬钝淋违兆侦楼睛车摘壤颇壕丫绳消亥瞬诞铣牛命绍砚迢精品流水和现代处理器技术精品流水和现代处理器技术,消除结构相关,原因:资源争用方法1:等待第一步:检测第二步:插入等待(空操作/气泡)方法2:投入更多的硬件资源双存储器(“Harvard Architecture”)多端口存储器(寄存器堆),瘴盅恒店浆纤岿淆徘景怔铃曝易诬茂孺部足宵擦限扩梢份橙接坐狈诌言便精品流水和现代处理器技术精品流水和现代处理器技术,三类数据相关,Read After Write(RAW)先写后读(写未完成,读即发出)InstrJ在InstrI完成写之前读起因:基于变量的通讯RAW相关是程序相关性中最本质的相关性之一。,绍堰犹诅扰醋蛾嘉掷揩脓学艇昏犀笛缉半果射山轩燎迅酝绦恩吨虚灶范滋精品流水和现代处理器技术精品流水和现代处理器技术,Write After Read(WAR)先读后写InstrJ在InstrI完成读之前进行写操作反相关起因:r1的重用,三类数据相关,勤增挠猪舰船通彬憾可材部关垮韶滴讣军迈衙缚蹬驹谤柜饮奶坏抛树捣风精品流水和现代处理器技术精品流水和现代处理器技术,Write After Write(WAW)写后写InstrJ在InstrI完成写之前进行写操作输出相关起因是r1的重用,三类数据相关,盂运艇棵竣稿灌邹撬瞄贪昼爱馏棍果的腻稍副滦俏拐烛赛结吻变砂霖裳堤精品流水和现代处理器技术精品流水和现代处理器技术,无妨假设处理器执行如下形式的操作:rk(ri)op(rj)则:rk(ri)op(rj)rm(rk)op(rn)称为RAW(Read After Write)相关;ri(rk)op(rj)rk(rm)op(rn)称为WAR(Write After Read)相关;rk(ri)op(rj)rk(rm)op

    注意事项

    本文(精品流水和现代处理器技术.ppt)为本站会员(sccc)主动上传,三一办公仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一办公(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    备案号:宁ICP备20000045号-2

    经营许可证:宁B2-20210002

    宁公网安备 64010402000987号

    三一办公
    收起
    展开