● GF116与Barts芯片特性分析 Geforce GTX 550Ti显卡是Fermi架构中首款采用192Bit显存位宽的产品,而上代GTX460 SE缩减的只是流处理器数量,并没有缩减显存位宽。那么192个流处理器配合192Bit显存位宽会给GPU带来哪些直接提升呢?Geforce GTX 550Ti能否在特性测试中展现出显存位宽提升带来的性能飞跃?
GF116核心架构图 根据NVIDIA针对不同的市场对产品做了不同定义,本次发布的GF116被定义为“Sniper”(狙击手),这款产品相对与GF106有哪些提升相信在昨天的显卡频道芯片级首测中大家已经看到了这款产品的相关特性——显存控制器全部打开192Bit,同时使用混合显存实现1024MB容量。
GF116提升频率与位宽 混合显存可以使用最少数量的显存颗粒达到1024MB的显存容量,同时符合192Bit显存位宽。对于一款中端产品来说,1024MB显存容量无疑是一个黄金比例,既能满足GPU的性能需求,又不会浪费产品自身成本。
让我们把目光集中在Barts核心身上,HD6000发布之后我们看到了一颗核心面积更小的芯片融聚了更高的浮点运算能力,我们看到通过改善线程控制能力流处理器和特殊功能运作效率进一步提升,当然这一切的背后,还有AMD利用TSMC改进后的40nm CMP碱洗工艺提升整体频率带来的线性性能提升。

RV870与HD6000前端设计 本次Barts在核心架构上的变化主要有三点:
1、Tessellator数量仍为1组,但是为增强型的Tessllator Gen7。
2、线程控制器由Cypress的一组变为Barts现在的两组。
3、UVD引擎升级至第三代,提供了更多功能及格式的图形核心计算模式。
其中线程控制器分为两组,是HD6800系列Barts核心性能提升的主要因素,两组线程控制器同时工作能够更有效的发挥流处理器的并行计算能力。这一改革让HD6000拥有更丰富的指令缓存和发射端资源,虽然两个UTDP单元还是采用抢占式资源分配模式,但是面对庞大的流处理器阵列时效果会比一个UTDP单元好很多。

Radeon HD 6790系列Barts芯片Tessellator单元 Radeon HD 6790所集成的Tessellator单元数量仍为1组,但是为增强型的Tessllator Gen7,这是第一个改进。而第二个改进正是上文提到的线程控制器由Cypress的一组变为Barts现在的两组,这减轻了UDTP的仲裁负担,改善了三角形吞吐负载不足的情况,所以几何性能在曲面细分系数Factor较低的时候可以做到2倍以上提升。
|