论坛   IT娱乐新视界   GF8800GS附体?GTX550Ti特性测试补充
返回列表
查看: 1367|回复: 8
收起左侧

GF8800GS附体?GTX550Ti特性测试补充

[复制链接]

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

发表于 2011-3-17 11:07:35 | 显示全部楼层 |阅读模式
● 中端192Bit位宽产品唤起思考  NVIDIA在昨天正式向全球发布了Geforce GTX 550Ti显卡,这是一款面向千元级市场的明星产品,同时这也是GF106芯片完整版——GF116芯片的第一次露面。也正是通过这款产品发布,我们第一次知道NVIDIA面向中端市场的GF116芯片完整版拥有192Bit位宽,那么历史上距离我们最近的192Bit位宽产品表现如何呢?



Geforce 9600GSO所使用的G92-150芯片
  2008年元旦过后,市场上出现了一种新型号的NVIDIA阵营显卡Geforce 8800 GS,作为高性能的金字招牌Geforce 8800系列中的最新成员,Geforce 8800 GS通过合理的屏蔽单元达到了非常平衡的性能功耗比和性能价格比,成为当时市场上的热点产品。这就是距离我们最近的一款192Bit位宽产品,它也是一款非常长寿的产品。

499元的9600GSO显卡成为经典历史
  在2009年NVIDIA将8800GS更名为9600GSO,并且采用了G92-150核心。这款核心为降低整体生产成本而屏蔽部分功能使用。G92-150的112个标量着色器、纹理拾取单元均和全功能的G92-270相同,但内存控制器位宽为192bit,对应的ROPs数目也缩减到12个,同时支持的本地内存容量则是384MB和768MB。
  96个流处理器的8800GS和9600GSO已经成为上一代的经典产品,这不仅和他们合理的规模缩减有关,让这两款显卡在市场上生命力顽强的主要原因是显卡厂商可以有效控制成本做出性价比极高的产品。

昨日发布的Geforce GTX 550Ti显卡
  所以192Bit显存位宽、96个流处理器、12个ROP的G80和G92核心可以被厂商将成本控制在400元人民币左右,无论是影驰、昂达、捷波的499元还是耕升、双敏等厂商的399元9600GSO显卡都给用户带来了巨大实惠。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:08:51 | 显示全部楼层
● GTX 550Ti性能与功耗平衡

  Geforce GTX 550Ti显卡是Fermi架构中首款采用192Bit显存位宽的产品,而上代GTX460 SE缩减的只是流处理器数量,并没有缩减显存位宽。那么192个流处理器配合192Bit显存位宽会给GPU带来哪些直接提升呢?Geforce GTX 550Ti能否在特性测试中展现出显存位宽提升带来的性能飞跃?



GF116核心架构图
  根据NVIDIA针对不同的市场对产品做了不同定义,本次发布的GF116被定义为“Sniper”(狙击手),这款产品相对与GF106有哪些提升相信在昨天的显卡频道芯片级首测中大家已经看到了这款产品的相关特性——显存控制器全部打开192Bit,同时使用混合显存实现1024MB容量。

GF116提升频率与位宽
  混合显存可以使用最少数量的显存颗粒达到1024MB的显存容量,同时符合192Bit显存位宽。对于一款中端产品来说,1024MB显存容量无疑是一个黄金比例,既能满足GPU的性能需求,又不会浪费产品自身成本。

混合显存颗粒
  根据NVIDIA给出的官方示意图得到,GeForce GTX 550 Ti的1024MB显存容量是由4颗32M*32bit规格显存搭配2颗64M*32bit显存混合搭建。

Geforce GTX 550Ti显卡供电部分
  公版GeForce GTX 550 Ti产品功耗标称116瓦,外接1个6pin供电,产品供电模组采用3+1项设计。之所以没有使用更高端奢华的供电元件正是因为整卡功耗完全可控。半封闭电感和八爪鱼Mosfet搭配URL香港万裕电容足以应对整卡满载工作。这在很大程度上降低了显卡的生产成本,也为其他有研发实力的厂商开发超频版非公版显卡带来了足够空间。
  本次我们将对最新发布的Geforce GTX 550Ti显卡做特性补充分析,重点补充图形子项性能和图形之外的并行计算性能,大量测试项目在GTS450相关测试中已经做了较为详细的分析,大家可以点击文章进行了解。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:10:20 | 显示全部楼层
● 性能测试的硬件、软件平台状况
  ● 测试系统硬件环境
  性能测试使用的硬件平台由Intel Core i7-870 3.52GHz、技嘉P55-UD4 GIGABYTE GA-P55-UD4主板2GB*2双通道DDR3-1600内存构成。细节及软件 环境设定见下表:

测 试 平 台 硬 件
中央处理器Intel Core i7-870 OC3.5GHz
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 )
散热器Thermalright Ultra-120 eXtreme
( 单个120mm*25mm风扇 / 1600RPM)
内存模组Apacer 猎豹二代双通道套装/PC3-12800
(SPD:1757 9-9-9-24-1T)
主板技嘉P55-UD4 GIGABYTE GA-P55-UD4
(Intel P55 + ICH10R Chipset)
显示卡
NVIDIA 产 品
GeForce GTX 480
(GF100 / 1536MB / 核心:700MHz / Shader:1401MHz / 显存:3696MHz)
GeForce GTX 550Ti
(GF116 / 1GB / 核心:900 MHz / Shader:1800 Mhz / 显存:4104 Mhz)
GeForce GTS 450
(GF106 / 1024MB / 核心:875MHz / Shader:1750Mhz / 显存:4000 Mhz)
AMD 产 品
Radeon HD 5870
(RV870 / 1024MB / 核心:850MHz / Shader:850MHz / 显存:4800MHz)
Radeon HD 5830
(RV870 / 1024MB / 核心:800MHz / Shader: 800MHz / 显存:4000MHz)
Radeon HD 5770
(RV840 / 1024MB / 核心:850MHz / Shader: 850MHz / 显存:4600MHz)
硬盘Hitachi 1T
1TB / 7200RPM / 16M缓存  / 50GB NTFS系统分区)
电源供应器AcBel R8 ATX-700CA-AB8FB
(ATX12V 2.0 / 700W)
显示器DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)


技嘉P55-UD4 GIGABYTE GA-P55-UD4

Apacer 猎豹二代双通道套装/PC3-12800

AcBel R8 ATX-700CA-AB8FB

Thermalright Ultra-120 eXtreme
  我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。

  ● 测试系统的软件环境
操 作 系 统 及 驱 动
操作系统
Microsoft Windows 7 Ultimate RTM
(中文版 / 版本号7600)
主板芯片组
驱动
Intel Chipset Device Software for Win7
(WHQL / 版本号 9.1.1.1125)
显卡驱动
AMD Catalyst for Win7
(WHQL / 版本号 10.7)
NVIDIA Forceware for Win7
(Beta / 版本号 259.22)
桌面环境2560*1600_32bit 60Hz
测 试 平 台 软 件
DirectX 11
理论测试项目
Microsoft DX11 SDK
DirectX 11 SDK Nbody Gravity
Microsoft / 版本号 Demo
HDRToneMapping CS11
Microsoft / 版本号 Demo
OIT 11
Microsoft / 版本号 Demo
GPU通用
计算测试
基准性能测试GPCBenchMarkOCL
HPC Tech / 版本号1.1
理论测试程序
CUDA-Z
NVIDIA / 版本号 0.5.95
实际应用类测试
Folding@home分布式计算
GPU3客户端 任务10632
辅助测试软件
Fraps
beepa / 版本号 3.2.3

  各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:26:53 | 显示全部楼层
● DX10理论性能测试:3Dmark Vantage特性测试  3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。
       我们本次测试使用了3DmarkVantage的6个子项测试,这些子项可以很好地体现GPU的图形处理特性,也可以发现不同GPU架构对于不同渲染场景的适应性。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:27:21 | 显示全部楼层
● DirectX 11 SDK Nbody Gravity  DirectX 11 SDK Nbody Gravity项目源于Nbody仿真,它在数值上近似地表示一个多体系统的演化过程,该系统中的一个体(Body)都持续地与所有其他的体相互作用。一个相似的例子是天体物理学仿真,在该仿真中,每个体代表一个星系或者一个独立运行的星系,各个体之间通过万有引力相互吸引,如图所示。
  在很多其他计算机科学问题中也会用到N-body仿真,例如蛋白质折叠就用到Nbody仿真计算静电荷范德华力。其他使用N-body仿真的例子还有湍流流场仿真与全局光照计算等计算机图形学中的问题。

  ● HDRToneMapping CS11
  HDRToneMapping CS11测试项目同样是针对Computer Shader能力进行测试,该项目展示了如何设置和运行计算着色器(Computer Shader),这是最令人兴奋的Direct3D 11的新功能之一。虽然该测试只是检验了这项技术在HDR(High-Dynamic Range)高动态光照渲染中的加速能力,但是这个概念应该很容易扩展到其他后处理算法,以及更一般的计算。
  这项测试我们选择了DirectX 11所推荐的Computer Shader渲染模式,在测试中NVIDIA显卡出现了负载不饱和状态,所以整体得分不理想。联系到NVIDIA在Fermi架构中对并行计算的支持和多级多分配多线程能力,这个得分还是比较让人失望的,我们只能希望NVIDIA通过新驱动开发继续优化带有缓存的Fermi架构。
  ● OIT11次序无关透明
  OIT11示例演示了在Direct3D 11独立透明度的技术。换句话说,基元(Primitives),可以得出在任何秩序,透明度将正确处理。该技术提供的作品,因为它们是由缓冲透明的像素。这些像素,然后按深度,并在后端到前端与tranparency秩序呈现。本示例使用计算着色器生成一个前缀之和排序前最后的渲染的像素片段。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:31:17 | 显示全部楼层
● GPCBenchMark整体与子项得分
  首款国人开发的支持GPU的OpenCL通用计算测试程序OpenCL General Purpose Computing Benchmark (简称GPCBenchMarkOCL)是由国内几名高性能计算从业人员和爱好者合作编写的,目的是为了评估在不同的OpenCL平台上一些基本算法和应用的性能。



GPCBenchMarkOCL软件界面
  与目前流行的一些OpenCL、DirectCompute通用计算测试程序的不同在于,目前这些测试程序测试项目过于单一,基本上就是某一两种算法的性能测试,甚至干脆就是理论峰值计算性能的测试。而GPCBenchMarkOCL软件可以进行带有针对性的多个项目的具体测试,对运算和吞吐各有侧重。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:31:49 | 显示全部楼层
● 底层计算能力测试之CUDA-Z整数
  CUDA-Z就像我们常用的CPU-Z或者GPU-Z,但是具体参数就变成了针对CUDA应用方面的信息,支持CUDA信息查询,还可以测试电脑CUDA的速度。
  需要注意的是这里的测试数据都是理论值,实际运算时,会有很多不同情况出现。比如运算程序中循环和分支过多,都会严重影响GPU的运算能力。衰减程度视架构设计和运算器周边资源配备而定。



CUDA-Z性能测试界面
  我们知道GPU是从Shader Model 2.0时代开始从整数运算转向浮点运算的,而此后浮点运算能力快速提升,整数性能却被忽略。实际上在通用计算中,整数运算能力也显得尤为重要,所以我们做了这项测试向大家展示GPU的整数性能。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:32:45 | 显示全部楼层
● 底层计算能力测试之CUDA-Z浮点
  CUDA-Z就像我们常用的CPU-Z或者GPU-Z,但是具体参数就变成了针对CUDA应用方面的信息,支持CUDA信息查询,还可以测试电脑CUDA的速度。
  需要注意的是这里的测试数据都是理论值,实际运算时,会有很多不同情况出现。比如运算程序中循环和分支过多,都会严重影响GPU的运算能力。衰减程度视架构设计和运算器周边资源配备而定。



CUDA-Z性能测试界面
  2003年开始普及的DirectX 9.0图形应用程序接口,让Shader单元具备了更强的可编程性。2002年底微软发布的DirectX9.0中,PS单元的渲染精度已达到浮点精度,传统的硬件T&L单元也被取消。全新的Vertex Shader(顶点着色引擎)编程将比以前复杂得多。
  DirectX 9.0最重要的一点改进是增加对浮点数据的处理功能,以前GPU只能对整数进行处理,改进后提高渲染精度,使最终处理的色彩格式达到电影级别。Shader Model 2.0时代突破了以前限制PC图形图象质量在数学上的精度障碍,它的每条渲染流水线都升级为128位浮点颜色,让游戏程序设计师们更容易更轻松的创造出更漂亮的效果,让程序员编程更容易。而从通用性方面理解,支持浮点运算让GPU已经具备了通用计算的基础,这一点是至关重要的。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2011-3-17 11:33:22 | 显示全部楼层
Folding@home运算与测试总结

  Folding@home是一个研究蛋白质折叠,误折,聚合及由此引起的相关疾病的分布式计算项目。我们使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引我们近期对由折叠引起的疾病的一系列研究,找到相关疾病的发病原因和治疗方法。
  Folding@home能了解蛋白质折叠、误折以及相关的疾病。目前进行中的研究有:癌症、阿兹海默症(老年失智症)、亨廷顿病、成骨不全症、帕金森氏症、核糖体与抗生素。



GTX 550 Ti显卡运行Folding@Home项目
  该项目在中国拥有约2000多名参与者,其中最强大的China Folding@Home Power(Folding@Home中国力量,团队编号3213)团队已经拥有2585人,最近活跃用户200人以上,目前贡献计算量排名世界第20位,团队整体运算能力约为160到200TFLOPS。
  
测试总结:
  NVIDIA在2010年3月发布了首款Fermi架构的GPU产品GF100核心,其后通过不断改进和优化,用合理的晶体管消耗开发出GF104核心,并在9月发布了192个流处理器的GF106核心,至此GTX400产品线已经完全铺开。
  昨天发布的GF116核心旗下Geforce GTX550 Ti显卡再次被NVIDAI冠以Ti头衔,说明了NVIDAI对这款产品的重视程度。虽然在本次测试中GF116核心还是体现出TMU和ROP单元的相对资源缺乏(3DMark Vantage贴图填充率和色彩填充率性能低下),同时在GPU Perlin加噪项目中的落后说明了NVIDIA驱动开发仍然存在少许障碍,不过在并行计算相关项目中Geforce GTX550 Ti还是体现出了非常理想的性能。
  作为千元级市场上的新星,Geforce GTX550 Ti表现出了明显强于上代显卡的性能,同时更加可控的制造成本将会丰富非公版GTX550 Ti产品市场。继承了Fermi架构的众多特色并且使用了合理的晶体管规模提供出色的性能功耗比,这就是我们对GTX550 Ti的总体印象。
当一扇幸福之门关闭时,另一扇就会打开。
您需要登录后才可以回帖 登录 | 立即注册

收藏:1 | 帖子:5190

有图有真相