例1.2,p10
采用哪种实现技术来求浮点数平方根FPSQR的操作对系统的性能影响较大。假设FPSQR操作占整个测试程序执行时间的20%。一种实现方法是采用FPSQR硬件,使FPSQR操作的速度加快到10倍。另一种实现方法是使所有浮点数据指令的速度加快,使FP指令的速度加快到2倍,还假设FP指令占整个执行时间的50%。请比较这两种设计方案。 解:分别计算出这两种设计方案所能得到的加速比:
STo1n?T? n(1?Fe)?FeSeFe FPSQR=0.20,Se FPSQR=10 Fe FP=0.50,Se FP=2
Sn1FPSQR??1(1?0.2)?0.20.82?1.2210Sn11
FP??(1?0.5)?0.50.75?1.332
6
例1.3,p11
如果FP操作的比例为25%,FP操作的平均CPI=4.0,其它指令的平均CPI为1.33,FPSQR操作的比例为2%, FPSQR的CPI为20。假设有两种设计方案,分别把FPSQR操作的CPI和所有FP操作的CPI减为2。试利用CPU性能公式比较这两种设计方案哪一个更好(只改变CPI而时钟频率和指令条数保持不变)。 解:
CPI??n(CPIIii?i?1IC) 原系统的
CPIIFP=4.0, FPIC=25% CPII2=1.33, 2IC=1-25%
nCPII原 ??(CPIii?IC) i?1= CPIIFP
FP + CPII22ICIC =4.0×25% + 1.33×75%
7
=2
方案1(使FPSQR操作的CPI为2)系统 CPI=CPI原 - CPIIFPSQRFPSQR原
IC + CPIIFPSQRFPSQR新
IC
=CPI原 -
IFPSQRIC(CPIFPSQR原 - CPIFPSQR新)
=2-2%×(20-2) =1.64
方案2(提高所有FP指令的处理速度, 使FPSQR操作的CPI为2)CPI=CPII原 - CPIFP原FPIC + CPIIFP新FPIC =CPII原 -
FPIC(CPIFP原 - CPIFP新) =2-25% ×(4-2) =1.5
我们也可以根据以下公式计算出方案2系统(同求CPI原) CPI= 75%×1.33+25%×2=1.5
8
显然,提高所有FP指令处理速度的方案要比提高FPSQR处理速度的方案要好。 方案2的加速比 加速比?采用改进措施后的性能
没有采用改进措施前的性能Sn?ToCPU时间原系统 ?TnCPU时间方案2??IC ? 时钟周期 ? CPI原系统
IC ? 时钟周期 ? CPI方案2CPI原系统
CPI方案2=2/1.5 =1.33
例1.4
假设两台机器的指令系统中,执行条件转移指令需2个时钟周期,而其它指令只需1个时钟周期。
CPUA:采用一条比较指令来设置相应的条件码,由紧随其后的一条转移指令对此条件码进行
9
测试,以确定是否进行转移。显然实现一次条件转移要执行比较和测试两条指令。条件转移指令占总执行指令条数的20%。由于每条转移指令都需要一条比较指令,所以比较指令也将占20%。
CPUB采用比较功能和判别是否实现转移功能合在一条指令的方法,这样实现一条件转移就只需一条指令就可以完成。由于CPUB在转移指令中包含了比较功能,因此它的时钟周期就比CPUA要慢25%。
现在要问,采用不同转移指令方案的CPUA和CPUB,那个工作速度会更快些?解:
CPIA=0.2×2+0.8×1=1.2 TCPUA=ICA×1.2×tA = 1.2 ICA×tA
CPUB转移指令占20%÷80%=25% CPIB = 0.25×2+0.75×1=1.25 由于CPUB中没有比较指令,因此 ICB = 0.8×ICA
CPUB时钟周期就比CPUA要慢25% tB = 1.25tA
TCPUB = ICB×CPIB×tB
= 0.8 ICA×1.25×1.25tA
10
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库计算机系统结构(第2版)郑伟明汤志忠课后习题答案以及例题收录(2)在线全文阅读。
相关推荐: