从CPU架构和技术的演变看GPU未来发展(6)

来源：网络收集时间：2019-04-23 下载这篇文档手机版

说明：文章内容仅供预览，部分内容可能不全，需要完整文档或者需要复制内容，请下载word后使用。下载word有问题请添加微信号:或QQ：处理（尽可能给您提供完整文档），感谢您的支持与谅解。

随着ShaderModel指令集的扩充与改进，GPU的处理资源和计算精度与日俱增，于是就有能力渲染出更加精美的图像，并且不至于造成性能的大幅下降。就拿最近几个版本来讲，新指令集并没有带来太多新的特效，但却凭借优秀的算法提升了性能，是否支持DX10.1（ShaderModel 4.1）可能游戏画面上没有差别，但速度就很明显了。

此外，DX11中的关键技术DirectCompute通用计算技术就是通过调用ShaderModel 5.0中的新指令集来提高GPU的运算效率，很多基于DirectCompute技术的图形后处理渲染特效也都要用到SM5.0指令集来提高性能。

从以往的多处理器系统到现在的双核、四核、六核，CPU只能依靠增加核心数量来提升性能。而GPU从一开始就是作为并行渲染的管线式架构，GPU性能的强弱主要就是看谁的管线、流处理器数量更多。

不过双显卡甚至多显卡也成为提升电脑游戏性能的一种途径，通过SLI和CrossFire技术能够轻松让3D性能倍增，于是双核心的显卡成为NVIDIA和AMD双方角逐3D性能王者宝座的杀手锏，近年来的旗舰级显卡几乎都是双核心设计的。

但与CPU单芯片整合多核心的设计不同，显卡一般是单卡多GPU设计，很少有单一GPU多核心设计，因为GPU性能提升的瓶颈主要在于制造工艺，只要工艺跟得上，那么他们就有能力在GPU内部植入尽可能多的流处理器。

★ 双核心设计的Cypress核心：

不管GPU架构改不改，流处理器数量总是要扩充的，准确的说是以级数规模增长，这样才能大幅提升理论性能。在流处理器数量急剧膨胀之后，如何管理好如此庞大的规模、并与其它模块协调工作成为新的难题。

RV870的双核心模块设计

ATI RV870包括流处理器在内的所有核心规格都比RV770翻了一倍，ATI选择了“双核心”设计，几乎是并排放置两颗RV770核心，另外在装配引擎内部设计有两个Rasterizer（光栅器）和Hierarchial-Z（多级Z缓冲模块），以满足双倍核心规格的胃口。

★ 四核心设计的GF100核心：

GF100可以看作是四核心设计

如果说Cypress是双核心设计的话，那么GF100的流处理器部分就是“四核心”设计，因为GF100拥有四个GPC（图形处理器集群）模块，每个GPC内部包含一个独立的Raster Engine（光栅化引擎），而在以往都是整颗GPU共享一个Raster Engine。

我们知道RV870的Rasterizer和Hierarchial-Z双份的，而GF100则是四份的，虽然命名有所不同但功能是相同的。

GF100的每个GPC都可以看作是一个自给自足的GPU

GF100的四个GPC是完全相同的，每个GPC内部囊括了所有主要的图形处理单元。它代表了顶点、几何、光栅、纹理以及像素处理资源的均衡集合。除了ROP功能以外，GPC可以被看作是一个自给自足的GPU，所以说GF100就是一颗四核心的GPU。

★ 为什么GPU也会设计成多核心？

GPU本身就是一颗并行处理器，每一个流处理器都是一个独立的运算单元，ATI和NVIDIA双方第一次将GPU设计成为多核心方案，并不是为了提升其运算能力和流处理器资源，而是为了更好的管理和控制庞大规模的流处理器，更充分的利用它们的处理能力，以便在不同的应用环境下发挥出最强效能。

虽说流处理器数量决定着GPU的浮点运算能力，但GPU除了单纯的数学运算外，还要处理诸多不同类型的任务，将庞大的流处理器划分为多个独立的区块，每个区块都设计专用的控制引擎和特殊功能模块，这将会有效的平衡各个功能模块的资源利用率。

GPU内部拥有很多种类型的缓存，不同的缓存都有各自特殊的用途，往往无法互相兼容，这完全不同与CPU内部L1、L2、L3这样简单的层级关系。

★ Cypress的一级缓存：固定功能、固定容量的专用缓存

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读，免费范文网，提供经典小说综合文库从CPU架构和技术的演变看GPU未来发展(6)在线全文阅读。

从CPU架构和技术的演变看GPU未来发展(6).doc 将本文的Word文档下载到电脑，方便复制、编辑、收藏和打印下载失败或者文档不完整，请联系客服人员解决！

下载这篇word文档

本文链接：https://www.77cn.com.cn/wenku/zonghe/621971.html（转载请注明文章来源）

上一篇：用阿贝折射仪测液体的折射率
下一篇：基于PLC的八段数码管数字时钟设计