77范文网 - 专业文章范例文档资料分享平台

计算机系统结构课后习题答案(5)

来源:网络收集 时间:2020-03-26 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

(3)Cache中各块随时间的使用状况如下图所示。图中标*号的是候选替换块的块号,H:命中;R:替换;L:失效。

(4)发生块失效又发生块争用的时刻有6、7、9、10、11、12、14、15。 (5)Cache的块命中率Hc=3/15=0.2。

剖析: 由于主存块、Cache块之间存在上述的映象对应关系,主存的第0、1、4、5块只能映象装入或替换物理Cache的第0、1块;主存的第2、3、6、7块只能映象装入或替换物理Cache的第2、3块。

13.采用组相联映象,LRU替换算法的Cache存储器,发现等效访问速度不高,为此建议: (1)增大主存容量;

(2)增大Cache的块数(块的大小不变); (3)增大组相联组的大小(块的大小不变);

(4)增大块的大小(组的大小和Cache总容量不变); (5)提高Cache本身器件的访问速度。

解答: (1)增大主存容量对Cache的访问时间ta基本不影响,从而对Cache的等效访问速度基本不影响。 (2)增大Cache的块数(块的大小不变)一般将使Cache的命中率Hc上升,从而使ta下降,从而提高Cache的等效访问速度。

(3)增大组相联组的大小(块的大小不变)一般将使Cache的命中率Hc上升,从而使ta下降,从而提高Cache的等效访问速度。

(4)增大块的大小(组的大小和Cache总容量不变)一般将使ta下降,从而提高Cache的等效访问速度。 (5)提高Cache本身器件的访问速度一般将缩短ta,从而提高Cache的等效访问速度。

14.你对Cache存储器的速度不满,于是申请到一批有限的经费,为能发挥其最大经济效益,有人建议你再买一些同样速度的Cache片子以扩充其容量;而另有人建议你干脆去买更高速的Cache片子将现有的低速Cache片子全部换掉。你认为哪种建议可取?你如何做决定?为什么? 解答:

Cache本身的速度与容量都会影响Cache存储器的等效访问速度。如果对Cache存储器的等效访问速度不满,需要改进的话,就要作具体分析,看看现在Cache存储器的等效访问速度是否已接近于Cache本身的速度。如果差得较远,说明Cache的命中率低,应从提高Cache命中率着手,包括调整组的大小、块的大小、替换算法以及增大Cache容量等。如果Cache存储器的等效访问速度已经非常接近于Cache本身的速度还不能满足需要,就应该更换更高速的Cache片子。

21

第五章 重叠、流水和向量处理机

1.假设指令的解释分取指、分析与执行3步,每步的时间相应为t取指、t分析、t执行, (1)分别计算下列几种情况下,执行完100条指令所需时间的一般关系式: a.顺序方式;

b.仅“执行k”与“取指k+1”重叠; c.仅“执行k”、“分析k+1”、“取指k+2”重叠;

(2)分别在t取指=t分析=2、t执行=1及t取指=t执行=5、t分析=2两种情况下,计算出上述各结果。 解:

(1)执行完100条指令所需时间: a.100*(t取指+t分析+t执行);

b.t取指+100*t分析+99*max(t取指+t执行)+t执行;

c.t取指+max(t取指+t分析)+98*max(t取指+t分析+t执行)+max(t分析+t执行)+t执行。 (2)在t取指=t分析=2、t执行=1的情况下,执行完100条指令所需时间: a.500 b.401 c.203

在t取指=t执行=5、t分析=2的情况下,执行完100条指令所需时间: a.1200 b.705 c.510

2.流水线有4个功能部件组成,每个功能部件的延迟时间为△t,当输入10个数据后间歇5△t又输入10个数据,如此周期性地工作,求此时流水线的吞吐率,并画出时空图。 解:

TP=10/14△t=5/7△t 时空图:

3.有一个浮点乘流水线如图5.35(a)所示,其乘积可直接返回输入端或暂存于相应缓冲寄存器中,画出实现A*B*C*D的时空图以及输入端的变化,并求出该流水线的吞吐率和效率;当流水线改为图5.35(b)形式实现同一计算时,求该流水线的效率及吞吐率。

图5.35(a)

22

图5.35(b)

解:

按图5.35(a)组织的流水线时,TP=3/13△t;η=3/11。 实现A*B*C*D的时空图如图0504所示: 图0504

23

按图5.35(a)组织的流水线时,TP=3/13△t;η=3/11。 实现A*B*C*D的时空图如图0504所示: 图0505

剖析:

为了减少运算过程中的操作数相关,A*B*C*D应改为((A*B)*(C*D))进行运算。

4.一个4段的双输入端规格化浮点加法流水线,每段经过时间10ns,输出可直接返回输入或将结果暂存于相应缓冲器中,问最少需经多少时间能求(10)∑(i=1)Ai,并画出时空图。 答:

时空图如下:

24

求(10)∑(i=1)Ai需要的最知时间是170ns。

剖析: 为了避免先写后读相关,使流水线性能尽可能高,需将(10)∑(i=1)Ai调整成((((A1+A2)+(A3+A4))+(A9+A10))+((A5+A6)+(A7+A8)))。

5.为提高流水线效率可采用哪两种主要途径来克服速度瓶颈?现有3段流水线,各段经过时间依次为△t、3△t、△t,

(1)分别计算在连续输入3条指令时和30条指令时的吞吐率和效率。

(2)按两种途径之一改进,画出你的流水线结构示意图,同时计算连续输入3条指令和30条指令时的吞吐率。 (3)通过对(1)、(2)两小题的计算比较可得出什么结论? 解答:

为提高流水线效率可采用瓶颈希再细分和瓶颈段并联两种主要途径来克服速度瓶颈。 (1)连续输入3条指令时的吞吐率TP3=3/11△t;效率η3=5/11。 连续输入30条指令时的吞吐率TP30=15/46△t;效率η3=25/46。 (2)改进后的流水线结构示意图大体如图5.35(a)和图5.35(b)。 连续输入3条指令时的吞吐率TP3=3/7△t;效率η3=3/7。

连续输入30条指令时的吞吐率TP30=15/17△t;效率η3=15/17。

(3)只有当连续输入流水线的指令足够多时,流水线的实际吞吐率和效率才会提高。

6.有一个双输入端的加-乘双功能静态流水线,由经过时间为△t、2△t、2△t,△t的1、2、3、4四个子过程构成。加按1->2->4连接,乘按1->3->4连接,流水线输出设有数据缓冲器,也可将数据直接返回输入。现要执行A*(B+C*(D+E*F))+G*H的运算,请调整计算顺序画出能获得尽量高的吞吐率的流水时空图,标出流水线入、出端数的变化情况,求出完成全部运算的时间及此期间流水线的效率。如对流水线瓶颈子过程再细分,最少只需多少时间可完成全部运算?若子过程3不能再细分,只能用并联方法改进,问流水线的效率为多少? 解:

根据题意,画出流水线吞吐率尽可能高的时空图如图0507: 图0507

在此期间的流水线效率η=(6*4△t+3*4△t)/4*24△t=3/8

如果将瓶颈子过程2和3均细分成两个子过程,则时空图如图0508所示: 图0508

25

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说教育文库计算机系统结构课后习题答案(5)在线全文阅读。

计算机系统结构课后习题答案(5).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/jiaoyu/874743.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: