77范文网 - 专业文章范例文档资料分享平台

计算机系统结构(课后习题答案)(7)

来源:网络收集 时间:2019-01-10 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

计算机系统结构课后习题答案

按图

5.35(a)组织的流水线时,TP=3/13△t;η=3/11。 实现A*B*C*D的时空图如图0504所示: 图0505

剖析:为了减少运算过程

中的操作数相关,A*B*C*D应改为((A*B)*(C*D))进行运算。

4.一个4段的双输入端规格化浮点加法流水线,每段经过时间10ns,输出可直接返回输入或将结果暂存于相应缓冲器中,问最少需经多少时间能求(10)∑(i=1)Ai,并画出时空图。 答: 时空图如下:

第 31 页 共 61 页

计算机系统结构课后习题答案

(10)∑(i=1)Ai需要的最知时间是170ns。

剖析: 为了避免先写后读相关,使流水线性能尽可能高,需将(10)∑(i=1)Ai调整成((((A1+A2)+(A3+A4))+(A9+A10))+((A5+A6)+(A7+A8)))。

5.为提高流水线效率可采用哪两种主要途径来克服速度瓶颈?现有3段流水线,各段经过时间依次为△t、3△t、△t,

(1)分别计算在连续输入3条指令时和30条指令时的吞吐率和效率。

(2)按两种途径之一改进,画出你的流水线结构示意图,同时计算连续输入3条指令和30条指令时的吞吐率。

(3)通过对(1)、(2)两小题的计算比较可得出什么结论?

解答: 为提高流水线效率可采用瓶颈希再细分和瓶颈段并联两种主要途径来克服速度瓶颈。 (1)连续输入3条指令时的吞吐率TP3=3/11△t;效率η3=5/11。 连续输入30条指令时的吞吐率TP30=15/46△t;效率η3=25/46。 (2)改进后的流水线结构示意图大体如图5.35(a)和图5.35(b)。 连续输入3条指令时的吞吐率TP3=3/7△t;效率η3=3/7。 连续输入30条指令时的吞吐率TP30=15/17△t;效率η3=15/17。

(3)只有当连续输入流水线的指令足够多时,流水线的实际吞吐率和效率才会提高。

第 32 页 共 61 页

计算机系统结构课后习题答案

6.有一个双输入端的加-乘双功能静态流水线,由经过时间为△t、2△t、2△t,△t的1、2、3、4四个子过程构成。加按1->2->4连接,乘按1->3->4连接,流水线输出设有数据缓冲器,也可将数据直接返回输入。现要执行A*(B+C*(D+E*F))+G*H的运算,请调整计算顺序画出能获得尽量高的吞吐率的流水时空图,标出流水线入、出端数的变化情况,求出完成全部运算的时间及此期间流水线的效率。如对流水线瓶颈子过程再细分,最少只需多少时间可完成全部运算?若子过程3不能再细分,只能用并联方法改进,问流水线的效率为多少? 解: 根据题意,画出流水线吞吐率尽可能高的时空图如图0507: 图0507

在此期间的流水线效率η=(6*4△t+3*4△t)/4*24△t=3/8

如果将瓶颈子过程2和3均细分成两个子过程,则时空图如图0508所示: 图0508

由图可见,完成全部运算最少需要18△t。

若子过程3不能再细分,只能用并联方法改进,则则时空图如图0509所示: 图0509

第 33 页 共 61 页

计算机系统结构课后习题答案

这种情况下,流水线效率η=(24△t+12△t)/6*18△t=1/3

剖析: 因为是双功能静态流水线,为了能有高的吞吐率,应减少流水线的功能切换次数。因此,应将算法调整成先作一连串的乘,然后再切换成一连串的加。原式展开成

A*B+A*C*D+A*C*E*F+G*H,先进行乘法流水,为了减少因先写后读相关而等待的时间,应尽量安排对计算式子项数最多的乘法先进行操作,即先计算A*C*E*F,再计算A*C*D,... 7.现有长度为8的向量A和B,请分别画出下列4种结构的处理器上求点积A*B的时空图,并求完成全部结果的最少时钟拍数。设处理器中每个部件的输出均可直接送到任何部件的输入或存入缓冲器中去,其间的传送延时不计,指令和源操作数均能连续提供。

(1)处理器有一个乘法部件和一个加法部件,不能同时工作,部件内也只能以顺序方式工作,完成一次加法或乘法均需5拍;

(2)与(1)基本相同,只是乘法部件和加法部件可并行;

(3)处理器有一个乘、加法双功能静态流水线,乘、加法均由5个流水段构成,各段经过时间要1拍;

(4)处理器有乘、加法两条流水线,可同时工作,各由5段构成,每段经过时间为1拍。 解答:

(1)在这种结构的处理器上求点积A*B的时空图如图0510所示: 图0510

第 34 页 共 61 页

计算机系统结构课后习题答案

完成全部运算最少需要75拍。

(2)在这种结构的处理器上求点积A*B的时空图如图0511所示: 图0511

完成全部运算最少需要45拍。

(3)在这种结构的处理器上求点积A*B的时空图如图0512所示: 图0512

第 35 页 共 61 页

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库计算机系统结构(课后习题答案)(7)在线全文阅读。

计算机系统结构(课后习题答案)(7).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/416883.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: