吸血大魔王 发表于 2011-4-6 13:44:57

测3D游戏过时 GTX590通用计算专项测试

       通用计算应用是目前图形构架重点的发展方向及产品应用推广方向。自从微软将越来越多的数学方法引入图形处理过程中,并逐步将ALU的使用权从单纯图形应用中解放出来,GPU的运算能力就一直在方方面面影响着我们的生活。利用GPU卓越的数学处理能力,GPU一直活跃在诸多民用及HPC领域的应用场合中。
http://2e.zol-img.com.cn/product/62_500x2000/344/ceSzOkv7ttW2.jpg
无论NVIDIA还是AMD都很重视通用计算  与一般的CPU不同,GPU由于存在板卡和接口的物理限制,其平台最大可扩展的能力取决于PCI-Experss通道的占用数。不论民用还是专业领域,每块主板所能够负载的最大PCI-Experss通道数是有限的,因此GPU通用计算应用中也就出现了运算密度的问题。如何能够在占用尽可能少的PCI-Experss通道的前提下在单块板卡上集成更多的运算能力,成了制约GPU通用计算发展的瓶颈之一。
http://2a.zol-img.com.cn/product/62_500x2000/346/ceNS59GM7CB8Y.jpg
目前最强的8 PCI-Experss系统  GTX590的出现,在某种程度上缓解了这种瓶颈所带来的影响。作为一款单卡双芯显卡,GTX590通过NF200-P-SLI-A3芯片将两颗完整规格的GF110连接在了一起,通过NF200-P-SLI-A3提供的32条PCI-Experss通道进行通讯,这等于在一块显卡上提供了1024个CUDA core。
http://2a.zol-img.com.cn/product/61_500x2000/696/cevwwbPA0vKg.jpg
技嘉GTX590  由于数学运算讲求效率,所以理论吞吐能力并不是我们考量运算密度的标准。以Fermi构架的运算效率,这将是目前最为恐怖的单卡运算密度。在接下来的测试中,我们将使用斯坦福大学发布的分布式通用计算程序Folding@home来展示该卡的实际运算密度。

吸血大魔王 发表于 2011-4-6 13:45:40

● Folding@home简介及平台设置方法   Folding@home是一个研究蛋白质折叠,误折,聚合及由此引起的相关疾病的分布式计算项目。我们使用联网式的计算方式和大量的分布式计算能力来模拟蛋白质折叠的过程,并指引我们近期对由折叠引起的疾病的一系列研究,找到相关疾病的发病原因和治疗方法。
  Folding@home能了解蛋白质折叠、误折以及相关的疾病。目前进行中的研究有:癌症、阿兹海默症(老年失智症)、亨廷顿病、成骨不全症、帕金森氏症、I型及II型糖尿病、流感及其他病毒感染引起的致命性疾病等。


http://2e.zol-img.com.cn/product/62_500x2000/362/ceSde7lw9nUw.png
GTX 550 Ti显卡运行Folding@Home项目  该项目在中国拥有约2000多名参与者,其中最强大的China Folding@Home Power(Folding@Home中国力量,团队编号3213)团队已经拥有2585人,最近活跃用户200人以上,目前贡献计算量排名世界第17位,团队整体运算能力约为200TFLOPS以上。
http://2a.zol-img.com.cn/product/62_500x2000/340/cezYtdN4vVQFQ.png
GTX480运行Folding@Home测试  由于目前的Folding@home客户端并未支持CUDA4.0,因此多GPU直接通讯以及节点内的统一化依旧无法在目前的Folding@home程序中得到应用,每一颗GPU必须单独对应一个任务才能正常的进行计算。因此,我们需要对程序进行一些简单的指向性操作才能充分发挥出GTX590的全部运算能力。
http://2d.zol-img.com.cn/product/62_500x2000/337/ceeJaRpJ8cnEk.png
复制客户端程序  首先要做的便是将Folding@home复制一份到其他硬盘分区,一般情况下我们推荐使用绿色版免安装客户端,这种客户端可以直接进行复制而不用担心work文件夹,也就是任务数据存放地的问题。
http://2e.zol-img.com.cn/product/62_500x2000/338/cewQmaSSiba46.png
重新设置快捷方式参数  完成复制之后,我们将文件夹里的Folding@home执行程序发送到桌面快捷方式,然后分别将2个快捷方式指向不同的GPU,再将2颗GPU分别对应到不同的扩展桌面上,这样可以保证每一个客户端精确对应一个GPU核心,使得任务可以得到正确的运算。
http://2f.zol-img.com.cn/product/62_500x2000/339/ce261PA6KoWi6.png
将GPU对应到扩展显示器  设置完成之后,分别双击两个快捷方式,设置好不同的machine ID之后就可以开始运行了。

吸血大魔王 发表于 2011-4-6 13:46:42


测试系统的硬件环境  性能测试使用的硬件平台由Intel Core i7-975 Extreme Edition、ASUS P6T Deluxe主板和2GB*3三通道DDR3-1600内存构成。细节及软件
环境设定见下表:

测 试 平 台 硬 件
中央处理器Intel Core i7-975 Extreme Edition
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存

散热器Thermalright Ultra-120 eXtreme
(单个120mm*25mm风扇 / 1600RPM)
内存模组Apacer PC3-12800 猎豹套装 2GB*3
(SPD:1600 8-8-8-24-2T)
主板ASUS P6T Deluxe
(Intel X58 + ICH10R Chipset)
显示卡
NVIDIA 产 品
GeForce GTX 590
(GF110/ 3GB / 核心:607 MHz / Shader:1215 Mhz / 显存:3400 Mhz)
GeForce GTX 480
(GF100/ 1.5GB / 核心:718 MHz / Shader:1436 Mhz / 显存:3800 Mhz)
GeForce GTX 560Ti
(GF114 / 1GB / 核心:823 MHz / Shader: 1646 Mhz / 显存:4000 Mhz)
GeForce GTX 460
(GF104 / 1GB / 核心:675 MHz / Shader:1350 Mhz / 显存:3600 Mhz)
硬盘Seagate 1T
(1TB / 7200RPM / 32M缓存/ 100GB NTFS系统分区)
电源供应器AcBel R8 ATX-700CA-AB8FB
(ATX12V 2.0 / 700W)
显示器DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)

http://2f.zol-img.com.cn/product/62_500x2000/351/ceqUpqGx9uJeU.jpg
Apacer猎豹6GB DDR3-1600套装 http://2e.zol-img.com.cn/product/62_500x2000/350/ce3i2UgQW8iks.jpg
AcBel R8 ATX-700CA-AB8FB
http://2d.zol-img.com.cn/product/62_500x2000/349/ceYIImFWcmwEo.jpg
Thermalright Ultra-120 eXtreme
  我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。   ●
测试系统的软件环境  为保证系统平台具有最佳的稳定性,此次硬件评测中所使用的操作系统均为Microsoft Windows 7 正版授权产品。使用Windows 7正版软件能够获得最好的兼容性以及系统升级更新服务。
http://2a.zol-img.com.cn/product/62/352/ceUntexHUnNOI.png  用户在体验或购买安装Windows 7的操作系统时请认准所装系统是否已经获得正版授权许可!未经授权的非正版软件将无法获得包括更新等功能在内的Windows 7服务。


操 作 系 统 及 驱 动
操作系统
Microsoft Windows 7 Ultimate RTM
(中文版 / 版本号7600)
主板芯片组
驱动Intel Chipset
Device Software for Win7
(WHQL / 版本号 9.1.1.1125)
显卡驱动
NVIDIA Forceware
(Beta / 版本号 270.51)
桌面环境2560*1600_32bit 60Hz

  测试采用的Folding@home软件采取PPD衡量性能,PPD代表显卡运行该任务24小时所能够取得的总积分,数值越高越好。

吸血大魔王 发表于 2011-4-6 13:47:31

● 测试成绩及总结  我们使用完全统一的任务包6801来完成全部的测试,这样可以最大限度的避免其他类似测试中任务细节不统一所带来的运算过程干扰。

http://2d.zol-img.com.cn/product/62_500x2000/361/cerc4952FVLHo.png
GTX590运行6801任务包  任务包6801为第二阶段单全长β淀粉样蛋白在水中突变的模拟,β淀粉样蛋白是阿兹海默综合症病人大脑中常见的一种具有病理标记特性的蛋白质,通过该任务的模拟,人们可以在内存中重建一个完整的全长度β淀粉样蛋白,并以此为基础来观察β淀粉样蛋白单体在各种环境下的突变及特性,为阿兹海默综合症的研究提供极大的帮助。


http://2c.zol-img.com.cn/product/62/402/ceeS6IIdCCzkk.png  通过测试我们可以发现,在全默认设置下,GTX590的单卡PPD可以达到GTX480的172.8%,GTX560 Ti的237.8%以及GTX460的282%。由于Folding@home现在并不支持CUDA4.0,无法使用多个GPU同时运行单个任务,因此并不需要在运行任务的过程中使用SLI设置。GTX590由于使用了NF200-P-SLI-A3桥接芯片,对于系统来说仅占用一个统一的PCI-Express 2.0 X16通道。理论上主板能够提供多少个PCI-Express 2.0 X16,我们就可以运行双倍的Folding@home客户端并取得成绩。对于通用计算应用场合来说,GTX590的这种运算密度的提升是非常直观而且可观的。

  ● 测试后记:
  关于Folding@home的问题先前我们已经讨论过很多次了,在这里我们认为有必要重申一下关于它的立场。
  Folding@home是一个长期型非赢利性工艺事业,它所进行的研究大多关乎一些烈性疾病中非常基础的部分,比如成因、发展过程以及罹患条件等等。我们个人无法在当下马上通过计算解决某些身边的现实问题,但Folding@home项目最核心的理念在于公益,其运算结果每3个月汇总公开一次,所有论文均实时公开并且每6个月总结一次,所有这些都可以在斯坦福官方网站的研究结果公布页面查到,一切计算所得的相关结果都可以毫无保留的为全世界任何一个科技和医疗工作者所使用。这种公开所能够带来的其他方面的进步是无可估量的。
  Folding@home项目的初衷以及核心意义,在于利用个人电脑中的闲置运算资源。虽然今天的CPU大多带有丰富强大的频率管理功能,但其运行在最低的闲置功耗频率下所产生的运算能力也远大于一般日常应用的需求。利用这部分闲置资源来完成公益事业,不仅是对被浪费能源的在回收再利用,也是对人类改善自身生存状态的一种推动。
  今天在这里所进行的测试,仅仅是为了说明GTX590在运算密度上所作出的改进。我们并不鼓励将这种公益的事业上升到狂热的高度,为了Folding@home项目专门跑去采购几十块GTX590并不是一个十分理智的决定的。但同时我们也希望你能够明白,你在这一分钟的计算,可能会在未来的某个时刻拯救无数人甚至包括你自身的生命。其中的意义和滋味,希望各位读者自己体会。
页: [1]
查看完整版本: 测3D游戏过时 GTX590通用计算专项测试