翻天覆地还是遵循守旧 HD6900 GPU解析
AMD计划于本月推出新一代高端GPU---Radeon HD 6900(开发代号Cayman),据称,该系列产品的架构发生了根本性的变化,但仍隶属于“Northern Islands”家族。Northern Islands的第一批制品为Radeon HD 6800(开发代号Barts),与Radeon HD 5870(开发代号Cypress)使用了相同的GPU核心架构,而Cayman将打破这个“僵局”。http://2c.zol-img.com.cn/product/54_500x2000/166/cez79cyleDZWs.jpg
Northern Islands家族(点击查看大图) 为什么AMD这次仅仅在Cayman上采用新架构,而Barts仍保持老架构不变呢?AMD的GPG Chief Technology Officer,Eric Demers先生在上周于台北举办的AMD Technology Forum and Exhibit(AMD TFE)上解答了这个问题。http://2d.zol-img.com.cn/product/54_450x337/167/ceYKEetqpVvvU.jpg
Eric Demers先生 “从风险管理的角度来说,开发新GPU架构伴随着非常大的危险。成本上升,开发周期难以预测,所以AMD考虑将新开发的架构优先应用于高端产品上,在降低风险的同时让消费者能有更明确的阶梯化选择。” “第二点原因,新产品的开发时间表非常紧凑,我们难以做到快速的全线产品升级,毕竟40nm到32nm工艺的进化不只有数字那么简单。” “我们本计划于圣诞节前后拿出我们的杀手锏,以美国市场为例,新产品的推出时间点非常重要,提前几周或错后几周都会令效果大打折扣,从而被竞争对手占据先机。我们正在努力让大家早一些见到HD6900,但是在研发过程中,不确定因素很多,所以目前HD6900的具体发布时间还未最终敲定。”http://2e.zol-img.com.cn/product/54_500x2000/168/ceWwEY0uRQ7Pw.jpg
TSMC工艺的roadmap(点击查看大图) 用户方面,许多玩家都认为AMD最后会在2011年的第一季度祭出HD6900显卡,大家觉得只要是好产品,稍微晚出一些还是可以接受的,毕竟据AMD所言,Cayman会有天翻地覆的变化,会将GPU性能带上新的巅峰。 ●GPU核心发生重大变化的Cayman 据悉,AMD GPU的基础---VLIW(Very Long Instruction Word)处理器的构成方式将在Cayman上有所变更,但这种变更并不是“从零开始”,而是“某种程度的更新和强化”,目的是实现“倍精度演算”。 AMD技术人员介绍说,已经正式发布的Radeon HD 6800并不支持“倍精度”,但是Cayman则可以实现“倍精度浮动小数点演算”,“性能发挥效率”高于前代的Radeon HD 5870,这也是GPU内部构造改变的成果之一,应用这项技术,可以令GPU的效能总体提高20%左右。
http://2f.zol-img.com.cn/product/54_500x2000/169/ceocqxh2T1fKY.jpg
RV770的VLIW处理器示意(点击查看大图)http://2a.zol-img.com.cn/product/54_500x2000/170/cem8nZAW6zjaY.jpg
发行SIMD的VLIW命令(点击查看大图) 实际上,AMD的GPU基础架构从Radeon HD 2900(R600)以来就没有发生过根本变化,其中的演算单位一直是由Thread Processor(也就是VLIW处理器)构成的,每个不同的演算单位都分别执行单独的任务,并可以实行6条命令(5条演算命令,1条控制命令)。本次AMD在Cayman上所做的,就是从传统GPU的“Vec4构造”中进化,实现“5演算单位构造”。 ●从传统GPU结构发展而来的“AMD架构” 原来,GPU一般是由4路SIMD(Single Instruction, Multiple Data)演算单元,也就是Vec4构成,在需要1个命令处理复数数据流的时代,这种结构无疑是最合适的,但是,目前的程序代码里,“并列处理”的需求变得越来越常见,SIMD处理器的执行效率出现了瓶颈,所以GPU研发人员就将SIMD演算单元一分为二,令“并列处理”得以实现。
http://2b.zol-img.com.cn/product/54_500x2000/171/celnS02EaT9pc.jpg
Radeon X1000(R5xx)结构举例(点击查看大图) 现在,AMD GPU的VLIW结构在单元分割的基础上更进一步,SIMD中的每个演算单元都可以执行独立的命令,兼容MAD算式之后,配备了5个演算单元,在1 Clock里最大可进行5种演算的新VLIW结构诞生了。http://2c.zol-img.com.cn/product/54_500x2000/172/ceJVnFRdVxNks.jpg
着色器的变化与对应GPU的区别(点击查看大图)http://2d.zol-img.com.cn/product/54_500x2000/173/ce52QCc2c79Y.jpg
Radeon HD 6800产品介绍(点击查看大图) AMD在过去4世代的产品中(R600以下),都沿用了这个结构,就算更新,也只是更新了VLIW结构以外的部分,但到了Cayman时代,VLIW结构发生了新的,本质性的变化。 ●权衡“改良”与“性能”的关系 AMD的GPU制品相对于NVIDIA有着很大的不同,NVIDIA在推出GeForce 8800(G80)的时候,就将SIMD完全分解,提出了演算周期的概念,并以此为基础对GPU做出更新,逐渐形成了完全的SOA(structure of array)式架构,而AMD的对策就是“VLIW并行处理”。
http://2e.zol-img.com.cn/product/54_500x2000/174/ceRQnLrmXIqcY.jpg
GPU芯片尺寸图http://2f.zol-img.com.cn/product/54_500x2000/175/ceQVz0mR2JM0.jpg
GPU处理器数比较
然而,Cayman“脱离”老架构的决心虽已非常明显,但受制于晶体管数量,性能的飞跃也变得越发困难,这或许就是AMD推崇GPU“多核化”的原因所在。 Cayman到底会如何权衡“改良”与“性能”之间的关系,到它正式发布的那一刻,一切都会变得明朗。 哦哦哦。。
页:
[1]