摧垮上代GPU AMD首款DX11显卡5870抢先上市
● 慢人一步 受制于人 AMD卧薪尝胆每代顶级显卡发布都预示着3D性能将会有质的飞跃,尤其是赶在主流API与显卡同时换代时最为吸引人。上一次发生这个情况是在2006年Windows Vista携DirectX 10 AP的I到来,NVIDIA抢占先机的推出了GeForce 8800 GTX/GTS系列产品,当时凭借先进的统一架构和高效的计算能力,轻松拿下王者桂冠,而AMD则是在时隔半年后的2007年才推出支持DirectX 10的Radeon HD 2900 XT。不得不说,在当时那一代产品上AMD的图形产品线无论在性能还是市占率上均差强人意。
为了弥补在第一代DirectX 10产品上的各种遗憾,AMD在同年10月发布了Radeon HD 3800系列产品,而且值得一提的是其支持当时最先进的DirectX 10.1,不过无奈针对DirectX 10.1 API设计的游戏少之又少,AMD只能望空兴叹可怜英雄无用武之地。但是,由于在新品上的快速更新及架构改良带来的性能提升,AMD逐渐挽回了市占率,同时在2008年推出的Radeon HD 4800系列又让自己与NVIDIA站在了同一起跑线。
● 绝地反击 先发制人 AMD苦尽甘来
2008年AMD转换策略不再争夺性能之王,而是更加注重性价比,无论Radeon HD 3000系列还是Radeon HD 4000系列产品,上市价格均直击冰点,不仅通过价格上的优势成功挽回市占率,还通过架构优化后的Radeon HD 4000系列产品与对手产品在性能方面平分秋色。
绝地反击:AMD在2009年4月初,推出一款基于RV770核心改良而来的新核心——RV790,该款核心优化了Tape out,在核心外围新增了用于提升信噪的Decap Ring(去耦环),这对核心频率的提升起到很大帮助,这也就奠定了Radeon HD 4890默认850MHz的核心频率,同时在风冷条件下轻松突破1GHz核心频率的奇迹。
先发制人:4月初推出的Radeon HD 4890抢占高端性价比之位,AMD在4月末再发力推出了全球首款40nm制程图形核心产品——Radeon HD 4770,基于40nm的图形核心优势不言而喻,功耗低、温度低、密度高、频率高。虽然受制于台积电40nm生产线良率问题导致断货,但是抢先发布40nm产品确实做到了先发制人,令NVIDIA处于被动局面。
苦尽甘来:RV790的出现确立了AMD对已有架构优化到极致,Radeon HD 4770的出现表明AMD对40nm工艺已经掌握。
上述二者的结晶——RV870可以说是千呼万唤中发布的新品,它的特色、特点、规格想必很多用户已经十分了解,不过1600个流处理器、32个光栅处理器、80个纹理单元的组合,这相当于RV790规格全部翻番的设计(显存位宽未翻番,同为256bit)足以让世人瞠目结舌。
Radeon HD 5870主推3大功能:DirectX 11、Eyefinity和Stream
俗话说历史总是在重复的循环出现,在NVIDIA抓住Windows Vsita和DirectX 10 API发布的契机结合自己产品率先推出,AMD半年后推出新品处于极其被动的局面。而3年后的今天,AMD则是抓住了Windows 7和DirectX 11 API的契机,率先推出支持DirectX 11 API的Radeon HD 5800系列产品,这一次NVIDIA又会有何举措?不得不说,NVIDIA目前深受40nm工艺制程良率困扰,导致其下一代产品GT300核心无限期拖延,难道历史真的会重演?
不过无论怎样,世人现在眼光的聚焦点均是Radeon HD 5870,下面让我们了解一下其与时下顶级系列产品的整体硬件规格对比:
AMD高端再次领先入住40nm 规格惊人
Radeon HD 5800系列的出现揭开了AMD在DirectX 11领域的新篇章,而且这次新产品线的发布规则与以往一样,先是发布顶级单图形核心系列产品,随后会推出旗舰顶级双图形处理核心单卡以及主流级产品,最后会发布入门级产品。
当然在这一系列的发布过程中,还会有一些不在计划内的产品,例如以前的Radeon HD 3690、Radeon HD 4830等,这类产品往往是为了增加核心生产良率而临时确定的型号。
不过在未来一段时间内,我们可以预见的AMD DirectX 11产品会有哪些请看下面Roadmap。
AMD DirectX 11产品发布Roadmap
根据上面的Roadmap我们能够了解到,今天发布的Radeon HD 5800系列产品代号为"Cypress"定价为300美元左右,其目前有Radeon HD 5870和Radeon HD 5850两款产品。随后在2009年第四季度,代号为“Hemlock”的双核心单卡产品Radeon HD 5870 x2(型号未定,笔者猜测)将会亮相,其定价会在400-500美元之间;与此同时,主流普及型代号为“Juniper”的产品也会亮相,根据目前已知的消息,其是核心编号为RV830的Radeon HD 5700系列产品。最后在2010年年初,代号为“Redwood”和"Cedar"的入门级产品将会上市,它们的额定价会非常亲民在100美元以下。
● 1600SPs核心亮相 核心面积并不大
流处理器数量大幅激增,相对上一代RV770/RV790的800SPs有了翻倍设计,同时21.5亿的晶体管数量也相对有了2.2倍以上的增加,我们知道基于55nm工艺的RV770核心面积为260mm2,如果想使用55nm工艺制造RV870核心,这几乎是一项可以实现但不切实际的做法,接近600mm2的核心面积成本不菲。Radeon HD 4770的40nm核心——RV740为RV870奠定了量产基础,从而解决了RV870在工艺及成本上的问题。
40nm工艺RV870核心
Radeon HD 5870搭载的RV870核心由台积电(TSMC)采用40nm工艺生产,其拥有1600个流处理器、32个光栅处理器和80个纹理单元。此次AMD的产品线升级,最重要的就是完美支持DirectX 11 API和Shader Model 5.0,而且值得一提的是DirectX 11 API中新加入了Direct Compute Shader,这也是微软在GPU通用计算上的一次大踏步跃进,而且这也证明GPU未来在通用计算领域的重要性。
21.5亿晶体管 核心面积仅为330mm2
前文我们说过RV870如果不采用全新的40nm工艺制造,将会带来高成本、高功耗、高发热量的诸多弊端,而采用40nm工艺后可以说药到病除,问题迎刃而解。
RV870相对RV770在增加了2.2倍以上晶体管数量的前提下,核心面积仅增加了不到27%,即从RV770的260mm2仅增加到330mm2。RV870核心为正方形设计,我们使用电子游标卡尺实际测量边长约为18.92mm,与实际的18.17mm有测量误差。
RV870核心架构
RV770核心架构
对比RV870和RV770核心架构我们发现,RV870并非RV770一样将1600个流处理器设计在同一区域,而是将1600个流处理器分为2组各800。
我们知道统一架构能够更加合理的利用每一个流处理器(Stream Processor),而且每个流处理器均能服务于顶点、像素、几何乃至DirectX 11引入的Direct Compute Shader,这种通用性可以充分利用GPU的并行架构。
在从AMD第一代统一架构图形芯片出世以来,均是采用SIMD设计,与以往不同的是RV870的SMID Cores被分为两部分。这样的设计更有理由图形核心的设计以及产品良率的提高,但这样的弊端就是需要对核心内部的线程控制器及驱动仲裁机制提出了严峻挑战。
首先核心需要一个叫做“Ultra-Threaded Dispatch Processor”(超级线程控制器)来整体分配流处理器处理,然后交由两组的流处理器进行计算,最后交由ROP(光栅处理器)最后进行AA(反锯齿)处理,同时在“Global Data Share”中的纹理贴图直接进入L2 Cache。最终在每组内存控制器的作用下,将ROP和L2 Cache的数据汇总输出。
● 默认4800MHz HD5870默认全球最快显存速度
虽然GDDR5已经在现阶段的应用已经不是稀罕物,但值得大家留意的是目前所有公版显卡产品中,只有AMD推出了相关产品,而且在GDDR4显存颗粒上也是如此,AMD在显存规格上的搭配十分激进。反观NVIDIA目前所有主流产品及高端产品,绝大多数依然以GDDR3颗粒作为标配。
搭载SAMSUNG最快的K4G10325FE-HC04颗粒
众所周知,显存频率及容量是影响显卡性能的第二大因素,搭载GDDR5显存的优势就是其能够实现更高的频率计带宽,同时低电压的表现能够协助产品降低功耗。
在Radeon HD 5870公版产品中,显卡标配了8颗规格为32M*32bit的SAMSUNG K4G10325FE-HC04颗粒,组成256bit/1024MB的组合。也许很多用户认为,早在Radeon HD 2900 XT中使用过的512bit显存位宽,为何在以后产品中没有出现过,根据AMD官方技术人员的解释256bit目前仍未造成显卡性能发挥的瓶颈,尤其是使用了高速GDDR5显存颗粒。
Radeon HD 5870中高速显存介入
标配目前最快SAMSUNG显存颗粒
通过SAMSUNG官方资料截图我们能够了解到,虽然K4G10325FE-HC04并非其产品线中设置最快的产品,但其是SAMSUNG目前已生产产品中最快的产品。
Radeon HD 5870显存默认频率高达4800MHz,是目前最快显存频率产品,而且值得一提的是该款颗粒理论极限频率高达5000MHz,所以显存频率仍有很大挖掘空间。 浅析RV870全“新”设计架构流程
RV870架构本身设计上相对RV770/RV790并无质的架构变化,不过随着DirectX 11的引入,一些功能、性能指标的升级,还是带来了核心处理能力、功能的提升,下面就是围绕核心内部架构各功能模块简介:
万亿级双架构
两倍于上一代核心处理能力:①超过2万亿次浮点运算;②超过20 Gigapixels /秒。
主要改进功能和设计:①指令集;②流处理单元;③单指令多数据布局;④图形引擎;⑤纹理单元;⑥渲染后端;⑦显示控制器。
核心内线程处理简介
核心内纹理单元及缓存简介
核心内流计算简介
Thread Processors、Texuture Units and Cches和Stream Computing等相关介绍,更适合对产品、架构有了解的网友阅读,本段仅作抛砖引玉,不再对此进行详细阐述。 全面了解产品 量化HD5870设计数据
Radeon HD 5870全方面的超标量设计,让其尽显尊贵身份,下面我们通过各种测量方式让大家对Radeon HD 5870有一个量化概念,例如核心尺寸、PCB尺寸等。
RV870核心尺寸
RV870相对RV770在增加了2.2倍以上晶体管数量达到21.5亿的前提下,核心面积仅增加了不到27%,即从RV770的260mm2仅增加到330mm2。RV870核心为正方形设计,我们使用电子游标卡尺实际测量边长约为18.92mm,与实际的18.17mm有测量误差。
C001公版PCB长度
Radeon HD 5870的公版C001 PCB长度为26.7cm,这个尺寸是目前AMD娱乐级显卡中最长的产品,即使上一代旗舰单卡Radeon HD 4870 x2也甘拜下风。
Radeon HD 5870整体长度
而在安装好散热器后,显卡整体长度达到了28cm,这个长度对于一般机箱来说确实是考验空间大小设计。不过反过来思考,使用Radeon HD 5870的用户多为发烧友级别,他们不是裸奔平台就是使用高端机箱,所以空间问题问题不大。
Radeon HD 5870(下)和Radeon HD 4890(上)PCB长度对比
在Radeon HD 5870面前,Radeon HD 4890的B790公版PCB显得十分渺小。
供电设计对比
在供电设计上,虽然用料使用方案十分接近,但是由于Radeon HD 5870相对于Radeon HD 4890更加节能, 所以供电相数反降拒增。值得一提的是考虑到显卡尺寸过长的设计,外接供电接口改为了垂直PCB设计。 细数HD5870七宗“最” 探秘高端市场
● 消除消费障碍 HD5870值得买
看完本文,想必很多用户已经对Radeon HD 5870这款产品已经有了全面了解,该款产品凭借当前最庞大的规模设计,轻松摘得最强单核显卡桂冠。不过,虽然其拥有强劲的性能、傲人的规格,但是目前对于很多消费者来说应该是抱着一种观望的态度。
第一个原因自然是3299元的官方指导价。根据AMD官方文档以及国外的新闻我们可以了解到Radeon HD 5870定价399元美金,根据当前汇率约为2700元人名币,600元的差价自然很多用户不会买账。不过笔者认为,3299元的定价也许就是虚晃一枪,因为AMD从近两代产品定价来看, 无论旗舰高端还是主流级产品,上市定价均已亲民低价位出现,所以Radeon HD 5870的最终铺货价理论上还有很大空间。其次,这种定价策略也许真由于对手NVIDIA没有课对位产品,所以任由AMD自由发挥,一但NVIDIA推出DirectX 11相关产品,Radeon HD 5870零售价便会直击低价。
第二个原因是Radeon HD 5850目前来看性价比较高。Radeon HD 5850目前中国大陆定价2299元,想比Radeon HD 5870便宜千元,二者规格十分接近,也许很多用户在等Radeon HD 5850的上市。
第三个原因现阶段购买Radeon HD 5800系列无用武之地。现阶段,正如2006年NVIDIA率先发布会DirectX 10显卡GeForce 8800系列一样,虽然产品性能、功能均大幅超前上代产品,但是无奈没有应用最新API的游戏出现,用户即使购买也没有用武之地。不过这点笔者认为,广大用户大可放心,为了避免这种状况的出现,AMD和微软已经提前与游戏厂商达成共识,在今年第四季度Windows 7发布后就会相继涌现10余款DirectX 11游戏,其中不乏《星际2》、《尘埃2》等游戏大作。
● 细数HD5870七宗“最”
第一“最”:其实目前最强的单图形核心显卡;
第二“最”:拥有最多流处理器的单核心显卡,达1600个;
第三“最”:标配目前最快的GDDR5显存颗粒,默认4800MHz;
第四“最”:28cm,拥有目前最长PCB身材;
第五“最”:在目前所有顶级系列产品中,其待机功耗最低,仅为27瓦;
第六“最”:在目前所有公版产品中,其视频接口最全;
第七“最”:RV870是目前所有产品中每瓦、每mm2,单位性能最强的核心。
● AMD现阶段胜出 未来市场依然扑朔迷离
不得不说,此次AMD率先推出支持DirectX 11 API的Radeon HD 5800系列成功抢的先机,为未来旗下DirectX 11产品抢占市占率打下坚实基础。可以说AMD如果能够掌控好当前局势,未来市场一片大好。
反观NVIDIA,由于40nm良率以及设计上原因导致其下一代代号为“Fermi”(网上俗称GT300)的产品继续跳票。既然抢先发布DirectX 11显卡已经成为泡影,那么NVIDIA将会在性能上做到绝对第一。有消息称,NVIDIA将会最晚在年底推出第二代CUDA架构的“Fermi”产品,这款产品在继承上一代GT200核心的优势、优点外,还会提供更强的性能,让人拭目以待。
如果NVIDIA的"Fermi"一经上市就能重夺性能桂冠,我想AMD也不会惊慌失措,因为在AMD的产品路线图中我们可以看到,基于双GPU的单卡“Hemlock”也会在第四季度推出,而且AMD在双核心单卡的Sideport技术杀手锏,这让现阶段明朗的市场情况在未来变得扑朔迷离。
真正的决战,让我们等待2009年年底……
页:
[1]