论坛   IT娱乐新视界   Fermi第二代 千元霸主GTX460全面测试
返回列表
12下一页
查看: 2180|回复: 35
收起左侧

Fermi第二代 千元霸主GTX460全面测试

[复制链接]

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

发表于 2010-7-12 19:53:32 | 显示全部楼层 |阅读模式

前言:DirectX 11已经成为了绝大多数用户装新机、升级显卡的第一关键指标,而在现阶段AMD的DirectX 11产品推进速度及布局上十分迅速,早在NVIDIA发布第一款DirectX 11产品GeForce GTX 480前就布局完毕。反观NVIDIA,在3月末推出第一代DirectX 11产品GeForce GTX 400系列的3款产品后,就再也没有动作,那么……




        众所周知,目前NVIDIA现有DirectX 11产品和AMD想对位的产品对战上,单GPU性能、GPU功能上NVIDIA的Fermi架构GF100优势明显,但是在单GPU成本、功耗及发热量上却是AMD的RV870优势明显。而且值得一提的是,由于NVIDIA目前仅有顶级系列产品但其本身用户群体小众,加之GF100产品在供货量上的诸多因素后,造成现阶段AMD在DirectX 11产品上占据了9成以上的全球市场份额。
        NVIDIA目前急需一款定位中端、价格亲民、性能强劲的产品,GF104由此诞生了。第一代Fermi架构GF100核心的优势是性能和功能,但是弊端也非常明显,主要体现在32亿庞大晶体管群、高成本及功耗上。那么今天NVIDIA发布的GF104能够在保证Fermi架构功能和性能前提下,解决GF100的诟病吗?

        目前,NVIDIA基于GF104核心设计了两款产品,但是二者的性能均为GeForce GTX 460,并没有像其他产品一样根据型号的各位和十位数字变换来区别。二者的的主要区别是显存规格上的变化,较高版本拥有256bit/1024MB规格,而较低版本为192bit/768MB规格,更多产品参数如下:

市 售 顶 级 显 卡 规 格 比 较 表
显卡型号GeForce GTX 480GeForce GTX 470GeForce GTX 465GeForce GTX 460GeForce GTX 460Radeon HD 5830Radeon HD 5770
市场定价3888 元2888 元2188 元1499 元1299 元1499 元1199 元
GPU代号GF100GF100GF100GF104GF104RV870RV840
GPU工艺40 nm40 nm40 nm40 nm40 nm40 nm40 nm
GPU晶体管32 亿32 亿32 亿19.5 亿19.5 亿21.5 亿10.4 亿
着色器数量4804483523363361120800
着色器组织1D *4801D *4481D *3521D *3361D *336(1D+4D)*224(1D+4D)*160
ROPs数量48403232241616
纹理单元数量60564056565640
核心频率700 MHz607 MHz607 MHz675 MHz675 MHz800 MHz850 MHz
着色器频率1401 MHz1215 MHz1215 MHz1350 MHz1350 MHz800 MHz850 MHz
理论计算能力2.02 TFLOPs1.63 TFLOPs1.28 TFLOPs1.36 TFLOPs1.36 TFLOPs1.79 TFLOPs1.36 TFLOPs
等效内存频率3696 MHz3398 MHz3206 MHz3600 MHz3600 MHz4000 MHz4800 MHz
内存位宽384 bit320 bit256 bit256 bit192bit256 bit128 bit
内存带宽177.4 GB/s135.9 GB/s102.6 GB/s115.2 GB/s86.4 GB/s128.0 GB/s76.8 GB/s
内存类型GDDR5GDDR5GDDR5GDDR5GDDR5GDDR5GDDR5
内存容量1536 MB1280 MB1024 MB1024 MB768 MB1024 MB1024 MB
DX版本支持11111111111111
HD视频技术PureVideo HDPureVideo HDPureVideo HDPureVideo HDPureVideo HDUVD2UVD2
通用计算接口CUDACUDACUDACUDACUDAStreamStream

        通过上面的价格、规格数据对比我们能够了解到,价格一直坚挺的Radeon HD 5000并没有因GeForce GTX 480/470/465的发布而有任何变化。但是在GeForce GTX 460发布前几天,Radeon HD 5830突降至1499元,与GeForce GTX 460 1GB定价相同,这也从对手的反应表现出GeForce GTX 460的实力和重要性。通过价格设定可以看出,GeForce GTX 460 1GB版的设定对位产品为Radeon HD 5830,GeForce GTX 460 768MB的对位产品是Radeon HD 5770。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:54:18 | 显示全部楼层

专为游戏打造核心 Fermi第二代GF104

        GF100的性能和功能时迄今为止最强的图形计算核心,尤其是在图形核心通用计算功能和实力上有了质的飞跃,基于GF100核心的Tesla 2070不仅加入了真正意义上的可读写L2缓存,还增加了ECC本地内存校验功能。虽然这些功能搭配庞大的规格确实提供了最好的用户体验,但是小众的功能却同时也占据了大量的晶体管,对于大众用来说得不偿失。

        GF104就是在Fermi第一代GF100基础上演变而来,它为原生设计核心并非GF100规格简单屏蔽、缩减而来。它的主要设计目的就是为普通用户提供性价比的高游戏性能产品,当然基于GF104的游戏性能到底强不强还有待我们在下文的全面测试后才能得出,但是NVIDIA这种从用户角度出发设计产品的理念是5值得我们赞赏的。


基于40nm工艺打造的GF104-325-A1核心

         GF104核心继续由台积电(TSMC)采用40nm工艺打造,其由19.5亿晶体管构成,相比GF100的32亿有了约40%的晶体管缩减,这也就是意味着GF104核心的成本、功耗和发热量都会有大踏步的改善。值得一提的是虽然晶体管有大幅缩减,但是在NVIDIA主推的硬件功能上,例如CUDA、PhysX、OptiX等技术依然全面支持。而且值得一提的是,GeForce GTX 460支持CUDA 2.1,而GeForce GTX 400(GF100核心)支持CUDA 2.0,GeForce GTX 200仅支持CUDA 1.3。


基于40nm工艺打造的GF104-300-KA-A1核心

        前文我们介绍过GF104目前设有两款产品型号,分别是1GB显存容量版本和768MB显存容量版本。这也导致二者使用的GF104核心也有些许区别,GeForce GTX 460 1GB版本使用GF104-325-A2核心,GeForce GTX 460 768MB版本使用GF104-300-KA-A1核心。其中为768MB版本使用的核心型号中“KA”又有什么含义呢?别急我们会在后面章节的显存规格介绍中有详细揭秘。

        ● GF104规格全解析 两版本规格相同

        在GF104核心规格上我们将首次使用NVIDIA Inspector这款软件,这是因为GPU-Z虽然发布了最新的0.4.4版本用以支持GeForce GTX 460,但是在核心Shader规格上还是有识别错误,所以我们本次使用NVIDIA Inspector软件,最新版本为1.87。这款软件不仅拥有GPU-Z的规格识别功能,其另一大特色就是支持NVIDIA显卡的超频。


GeForce GTX 460 1GB版本


GeForce GTX 460 768MB版本

        通过NVIDIA Inspector软件识别我们能够了解到,两款GeForce GTX 460拥有相同的336个流处理器和相同的675MHz/1800MHz/2300MHz频率,此外二者还拥有相同的2个GPC数量、7个SM数量和56个纹理单元数量等。


两 款 GeForce GTX 460 具 体 规 格 对 比
Graphics CardGraphics CardGeForce GTX 460
768MB
GeForce GTX 460
1024MB
PricePrice(China)¥1299¥1499
Processing UnitsGraphics Processing Clusters22
Streaming Multiprocessors77
CUDA Cores336336
Texture Units5656
Clock SpeedsROP Units2432
Graphica Clock
(Fixed Function Units)
675 Mhz675 Mhz
Pocessor Clock
(CUDA Cores)
1350 MHz1350 Mhz
Memory Clock
(Clock rate / Data rate)
900 Mhz / 3600 MHz900 Mhz / 3600 MHz
MemoryL2 Cache Size384 KB512 KB
Total Video Memory768 MB GDDR51024 MB GDDR5
Mempry Interface192-bit256-bit
FillrateTotal Memory Bandwidth86.4 GB/s115.2 GB/s
Texture Filltering Rate
(Bilinear)
37.8 Giga Texels/sec37.8 Giga Texels/sec
Fabrication Process40 nm40 nm
Transistor Count1.95 billion1.95 billion
Physical & ThermalConnectors2 * Dual-Link DVI-I
1 * Mini HDMI
2 * Dual-Link DVI-I
1 * Mini HDMI
Form FactorDual SlotDual Slot
Power Connectors2 * 6-pin2 * 6-pin
Recommended Power Supply450 Watts450 Watts
Thermal Design Power
(TDP)
150 Watts160 Watts
Thermal Threshold104°C104°C

        而两个版本的不同主要集中在本地显存相关的参数上,例如1GB版本拥有256bit显存位宽、32个光栅处理器、512KB的L2缓存和115.2GB/s内存带宽;而768MB版本则拥有192bit显存位宽、28个光栅处理器、384KB的L2缓存和86.4GB/s内存带宽。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:55:19 | 显示全部楼层

GF100针对中端用户优化而得GF104

        我们可以发现显卡历代产品均是率先发布采用相同核心的最高端系列产品,然后根据最高端系列核心的架构然后缩减规格设计出原生的中端、低端等核心。例如AMD当前主流的Radeon HD 5000系列产品,其最高端核心RV870、中端核心为RV840,二者的关系就可以看做是RV870的规格减半,理论架构无需改变,这样可以获得最短的开发周期。

        那么NVIDIA的GF100和GF104核心也是经过这样的“处理”而得到的吗?

        答案自然是否定的。虽然GF100和GF104核心均是基于Fermi架构设计,但是NVIDIA工程师不遗余力的挖掘Fermi架构潜能,GF100和GF104的内部微架构各处理单元做了比例调整。这样的设计好处就是不同规格的核心拥有最佳的功能单元比例,从而获得更佳的性能表现。


GF100 vs. GF104核心架构图对比

        从两张架构图对比来看,GF104看似就是GF100的打对折后的作品。不过细心的读者肯定会发现,两颗核心架构图中SM(为Streaming Multiprocessors缩写)的含有CUDA Core数量不同,更多的功能单元模块数量比也有很大差异,这也就意味着GF104核心的并非GF100简单缩减50%而来,同时由于微架构功能单元模块比例的调整,性能方面差距值得我们去详细测试。


两 款 Fermi 架 构 核 心 全 规 格 对 比
Graphics CoreGraphics CoreGF100GF104
Processing UnitsGraphics Processing Clusters42
Streaming Multiprocessors168
CUDA Cores512384
Texture Units6464
ROP Units4832
OtherMemory Interface384-bit256-bit
L1 Cache64 KB
(16 KB + 48 KB)
64 KB
(16 KB + 48 KB)
L2 Cache768 KB512 KB
Warp3216
Memory Controller64bit *664bit *4

        这是GF100核心和GF104核心的硬件规格对比。在此,值得一提的是目前使用GF100核心最高型号的GeForce GTX 480,众所周知并非使用全规格的GF100核心,而是屏蔽一组SM而来。无独有偶GeForce GTX 460亦是如此,它也并没有使用全规格的GF104核心,同样是被屏蔽了一组SM。
        抛开实际发布产品的规格,我们来看下理论上GF100和GF104的满规格参数对比。在GPC和SM的数量上GF104确实仅为GF100的一半,但是通过CUDA Cores和SM数量可以计算出,GF100的每组SM拥有32个CUDA Cores,而GF104的每组SM拥有48个CUDA Cores;而在每组SM的纹理单元数量上,GF100拥有4个,GF104则升级为8个。当然功能单元的比例变化不仅仅如此,我们会在下面的章节做简介。
        在GF100中拥有4个GPC(Graphics Processing Clusters)、16个SM(Streaming Multiprocessors)和6个MC(Memory Controller),而在GF104核心中则是2个GPC(Graphics Processing Clusters)、8个SM(Streaming Multiprocessors)和4个MC(Memory Controller)。

        Fermi架构的GPU工作流程为CPU将命令通过Host Interface总线接口传输到GPU中,然后GigaThread线程控制器会从系统内存提取指定数据,并把它们拷贝到指定的显存中。然后GigaThread引擎创建并调度这些block到各个SM,其次再到warp交给CUDA Core和其他执行单位。在GigaThread引擎重新分配工作时,图形流水线上的各个单元如细分曲面和光栅化之类的单元也会继续工作。


        ● SM功能单元比例大调整
        不过笔者在此要说的是,之所以GF104要另辟蹊径的修正SM微架构功能单元模块比例,而非简单缩减GF100的SM模块,这是因为对于高规格的GF100来说第一代Fermi架构微架构的SM功能单元模块比例是最佳的,能够发挥GF100最优性能的。但是对于GF104来说却不一定,因为GF104是NVIDIA针对大众用户设计、是针对游戏设计,GF100的SM功能模块比例不再适用,经过NVIDIA工程师在仿真机上的无数次修正、调试后得到了我们现在看到的GF104 SM功能模块比例。


GF100 SM架构图


GF104 SM架构图

        GF104的一个SM中现在拥有48个CUDA Core,每个CUDA Core由两个Dispatch Port、Operand Collector、Result Queue以及INT整型数单元与FP浮点数单元构成。其中GF104的ALU和FPU均继承了GF100中CUDA Core的优良特性,例如ALI可以支持64bit精度指令运算,还有比较、布尔和移位等指令计算,值得一提的是Fermi架构的ALU通过改进现已完整支持32bit整数算法。同时FPU支持IEEE 754-2008标准,这一切一切的改变和支持都为Fermi架构在GPU通用计算上打下坚实基础。

        当然,在CUDA Core的优化上可以大幅提升GPU运算能力,但是没有良好的缓存设计及读写机制也无法发挥GPU的能力。在GF104的每个SM中与GF100一样,都包含LD/ST Cache、L1 Cache、Uniform Cache和Texture Cache。其中GF104拥有12KB的L1纹理缓存之外,还拥有真正意义的L1 Cache和L2 Cche可读写缓存。就每组SM而言,每组SM拥有8个纹理单元共享12KB的L1纹理缓存,32个CUDA Core使用16KB L1缓存搭配48KB共享缓存或48KB L1缓存搭配16KB共享缓存两种组合,最后还有768KB超大L2缓存。


GF100 SM vs. GF104 SM
Graphics CoreGraphics CoreGF100GF104
SMCUDA Cores3248
Warp Scheduler22
Dispatch Unit24
SFU48
LD/ST16 个16 个
INT Unit3248
FP UnitFP32:32
FP64:16
FP32:48
FP64:24
Texture Unit48

        介绍完Fermi架构中SM的优化运算机制后,看下GF100和GF104中分别SM拥有功能模块的比例。抛开GF100和GF104的整体规格不看单比SM规格,GF104 SM的功能模块数量相比GF100 SM的功能模块数量只多不少,也就是说GF104单个SM的性能要强于GF100单个SM。

        我们可以看到每个SM中CUDA Core数量和Texture Unit数量均有大幅增加,这都会增加SM的3D计算能力,从而让用户在游戏体验上获得更好的效果。不过相反每个CUDA Core和Texture Unit分得的各类Cache有所减少,这应该是NVIDIA GPU架构工程师在性能、晶体管平衡取舍上得出的比例。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:55:56 | 显示全部楼层

显存规格详解 揭秘核心代号“KA”含义

        在笔者印象中,NVIDIA首次将旗下两款产品同时以相同型号出现,也许会有网友提出质疑GeForce GTX 260不也这样的情况吗?其实不然GeForce GTX 260 192SPs版本是早先发布,GeForce GTX 260 216SPs是后续发布用以代替GeForce GTX 260 192SPs版本的产品,虽然有一阶段同时出现在市场中,但是是以GeForce GTX 260和GeForce GTX 260+区分。

        不过GeForce GTX 460却不然,两款不同显存位宽/容量版本的GeForce GTX 460同时发布并在市场中。消费者购买时如何区别二者呢?首先,两款GeForce GTX 460在销售中均会以各自的显存容量作为型号后缀,即GeForce GTX 460 1024MB(或1GB)和GeForce GTX 460 768MB;其次1024MB版本GeForce GTX 460官方指导价为1499元,而768MB为1399元。


GeForce GTX 460公版标配SAMSUNG K4G10325FE-HC05颗粒

        公版GeForce GTX 460使用了规格位32M*32bit的SAMSUNG K4G10325FE-HC05颗粒,其理论极限频率为4000MHz,而公版显卡频率默认为3600MHz,所以还有很大的超频空间可挖,而且笔者在后续测试中进行了常规超频测试,显存频率提升幅度令人满意。


GeForce GTX 460 1GB版本标配8颗显存

        GeForce GTX 460 1024MB版本标配8颗显存,构成1024MB/256bit的组合。


GeForce GTX 460 768MB标配6颗显存

        而GeForce GTX 460 768MB版本标配6颗显存,右下角两颗位空焊,构成768MB/192bit的组合。

        ● 揭秘768MB版本核心代号“KA”含义

        我们发现虽然GeForce GTX 460 1024MB版本和GeForce GTX 460 768MB版本的核心规格一样,但是二者的核心编号却不同,1024MB版本为GF104-325-A1,768MB版本为GF104-325-KA-A1。也许GF104-345和GF104-300较为容易理解,二者的不同标号是为了标识用于不同显存版本的显卡中,那么768MB核心中“KA”的含义又会是什么呢?


GeForce GTX 460公版P1041 PCB

        公版GeForce GTX 460无论哪个显存容量的版本都将使用P1041 PCB,这种Pin-to-Pin的是设计最大好处是,同系列产品研发周期短、研发成本低。


GeForce GTX 460 768MB会有四个版本?

        我们回首GeForce GTX 200系列最早发布时,GeForce GTX 280和GeForce GTX 260采用相同PCB,而用于GeForce GTX 260的PCB会在左下角空焊两颗显存,构成896MB/448bit显存规格,不过后来NVIDIA开发了更经济实惠的原生12颗显存位的PCB,服务于GeForce GTX 260和GeForce GTX 275。阐述半天,笔者想要说明的是GeForce GTX 260核心标号上并无“KA”这种类似的标识,而且早期版本的公版GeForce GTX 260仅有左下角空焊2颗显存的版本,而且后续非公版产品中,GeForce GTX 260/275标配14颗显存位的PCB,均为左下角空焊2颗显存版本。

        那么GF104-300-KA-A1核心中的“KA”作何含义呢?

        也许通过上图我们就能猜出大致含义了。上图右侧的显存位设计是右下角空焊两颗显存,这也是我们现在所能见到唯一768MB版本。但是在左图中我们看到,未来GeForce GTX 460将会有空焊右上角两颗显存的版本,由此可推断未来还会有空焊左上角2颗和空焊左下角两颗的版本。

        那么目前我们唯一能够看到的768MB版本为空焊右下角两颗显存,核心编号为GF104-300-KA-A1,我们是否可猜测未来空焊右上角的核心标号为GF104-300-KB-A1,空焊左上角的为GF104-300-KC-A1,空焊左下角的为GF104-300-KD-A1。所以KA的含义就是代表空焊显存的位置,KB、KC、KD版本核心也将会在未来出现。

         当然,这也仅是笔者猜测,我们还需要未来的真实产品来验证。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:56:25 | 显示全部楼层

拆解GTX460 纤细身材提供强大性能

        由于GeForce GTX 460两个版本产品都会使用完全相同的P1041 PCB方案,所以笔者在接本环节的产品拆解中仅以GeForce GTX 460 1024MB版本为例。


抵达本站的第一款GeForce GTX 460来自索泰


P1041 PCB设计蓝图

        通过公版P1041 PCB的蓝图我们能够看到GeForce GTX 460的大概设计,首先一颗G104核心坐镇PCB中央,周边围绕1+4+3组合的显存位组合。在前文我们了解到GeForce GTX 460两个版本产品的TDP分别为160瓦和150瓦,所以为了产品更稳定的运行,PCB设有两个外接6pin供电。最后在视频型号接口上,公版默认为DVI *2 + Mini HDMI的组合,但是在蓝图我们能够看到中间的DVI接口可以根据品牌商的需求换成DisplayPort接口,即DVI + DP + Mini HDMI的组合。


GeForce GTX 460特写

        GeForce GTX 460沿用了GeForce GTX 200以来在中高端采用100%导风罩的设计,不过散热器风扇的位置发生了明显变化,由右侧离心式风扇改为中央的轴流式风扇。接口方面延续了GeForce GTX 400系列的双DVI搭配Mini HDMI的组合。

   
P1041公版PCB正反特写

        就PCB的主体设计我们已经在P1041公版PCB蓝图部分做过介绍,笔者就不再赘述。上图为公版PCB正反特写。


显卡供电设计

        显卡采用了3+1相供电设计,每相供电模组均为铁素屏蔽式电感搭配2个电容的组合。同时产品标配2个6pin外接供电,最大提供225瓦的能源输入。


PCB版本标识:P1041


DVI *2 + Mini HDMI组合

        显卡视频信号输出接口采用了DVI *2 + Mini HDMI的组合,这样的组合不仅能够满足普通用户的需求,还能满足高清用户的需求。值得一提的是,由于GeForce GTX 460支持DP显示接口,所以未来产品中还会出现DVI + DP + Mini HDMI的更多种类组合,方便广大用户。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:57:07 | 显示全部楼层

低热低功耗 再也无需大块头散热器

        40nm工艺设计似乎成了DirectX 11产品一个硬性指标,GF104也同样标配40nm工艺设计的GF104核心。不过Fermi架构第一代产品GF100,它的产品高功耗及高发热量让很多消费望而却步。此次GF104是否能力挽狂澜,解决这一诟病呢?在得知数据结果钱,让我们先了解一下GeForce GTX 460公版标配的散热器。


散热器总成正面特写

        GeForce GTX 460公版散热器采用了在中高端司空见惯的100%导风罩设计,不过有别于其他AMD和NVIDIA在中高端产品中设计的散热器,由于采用了轴流式中央风扇设计,所以导风罩和PCB之间没有做密闭设计。


散热器总成反面特写


散热系统全家福

        在散热器总成背面特写中, 我们了解到GeForce GTX 460的散热器设计复杂程度要远低于GeForce GTX 480标配的散热器。仅为核心主散热模块和导风罩的组合,供电模组和显存颗粒无散热器辅助散热。


核心散热模块


吸热底、吸热底及鳍片设计

        核心散热器采用了轴流式风扇搭配开放式散热鳍的组合。而散热鳍的组合为铜质吸热底加铝挤散热模块组合,吸热底吸收的热量由2根热管传送到热管末端的扣fin工艺铝鳍中。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:57:44 | 显示全部楼层

GTX460轻松易超频 性能紧追GTX480

        GF104核心使用了40nm工艺、晶体管数量为19.5亿,相比GF100核心有了很大的改善,那么它的功耗、发热量及超频又会怎样呢?下面我们首先针对超频做一个简单测试。

        我们使用NVIDIA Inspector 1.87版本对产品进行超频,这款软件本站曾进行过详细的介绍,对其有兴趣的读者可以去翻阅相关文章。


NVIDIA Inspector 1.87

        自GF100以来,NVIDIA GeForce GTX 400系列的核心频率与Shader频率就只能异步在1:2的比例下,不能修改。所以在软件中核心频率一项为灰色不能拖拽,不过我们可以通过改变Shader频率来完成核心的超频。

        由于默认显存频率超频上线为4320MHz,不过我们可以通过软件右上角的Unlock Max破除上限,经过笔者长时间的反复测试,最终在默认风冷条件下超频至900MHz/1800MHz/4600MHz。


900MHz/1800MHz/4600MHz频率下1GB版本3DMark Vantage成绩


900MHz/1800MHz/4600MHz频率下768MB版本3DMark Vantage成绩

         经过超频后,GeForce GTX 460两个版本的产品性能都得到了质的飞跃,而且此时GeForce GTX 460 1024MB版本不仅超越了GeForce GTX 470,甚至紧追GeForce GTX 480。

        更详细的超频性能成绩请参阅本文后续测试汇总,下文中超频状态频率均为900MHz/1800MHz/4600MHz。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:58:22 | 显示全部楼层
● 测试系统硬件环境

  性能测试使用的硬件平台由Intel Core i7-975 Extreme Edition、ASUS P6T Deluxe主板和2GB*3三通道DDR3-1600内存构成。细节及软件 环境设定见下表:


测 试 平 台 硬 件
中央处理器Intel Core i7-975 Extreme Edition
(4核 / 超线程 / 133MHz*25 / 8MB共享缓存 )
散热器Thermalright Ultra-120 eXtreme
(单个120mm*25mm风扇 / 1600RPM)
内存模组Apacer PC3-12800 猎豹套装 2GB*2
(SPD:1600 8-8-8-24-2T)
主板ASUS P6T Deluxe
(Intel X58 + ICH10R Chipset)
显示卡
NVIDIA 产 品
GeForce GTX 460 1024MB
(GF104 / 1024MB / 核心:675MHz / Shader:1350Mhz 显存:3600 Mhz)
GeForce GTX 460 768MB
(GF104 / 768MB / 核心:675MHz / Shader:1350Mhz 显存:3600 Mhz)
GeForce GTX 465
(GF100 / 1024MB / 核心:607MHz / Shader:1215Mhz 显存:3208 Mhz)
GeForce GTX 260
(G200 / 896MB / 核心:576MHz / Shader:1242Mhz 显存:1998 Mhz)
AMD 产 品
Radeon HD 5830
(RV870 / 1024MB / 核心:800MHz / Shader: 800MHz / 显存:4000MHz)
Radeon HD 5770
(RV840 / 1024MB / 核心:850MHz / Shader: 850MHz / 显存:4800MHz)
硬盘Hitachi 1T
(1TB / 7200RPM / 16M缓存  / 50GB NTFS系统分区)
电源供应器AcBel R8 ATX-700CA-AB8FB
(ATX12V 2.0 / 700W)
显示器DELL UltraSharp 3008WFP
(30英寸LCD / 2560*1600分辨率)


Apacer猎豹6GB DDR3-1600套装  


AcBel R8 ATX-700CA-AB8FB


Thermalright Ultra-120 eXtreme

  我们的硬件评测使用的内存模组由宇瞻(Apacer)中国区总代理佳明国际提供,电源供应器、CPU散热器由华硕(ASUS)玩家国度官方店、利民(Thermalright)的北京总代理,COOLIFE玩家国度俱乐部提供。


  ● 测试系统的软件环境

操 作 系 统 及 驱 动
操作系统
Microsoft Windows 7 Ultimate RTM
(中文版 / 版本号7600)
主板芯片组
驱动
Intel Chipset Device Software for Win7
(WHQL / 版本号 9.1.1.1125)
显卡驱动
AMD Catalyst for Win7
(WHQL / 版本号 10.6)
NVIDIA Forceware for Win7
(WHQL / 版本号 257.21)
NVIDIA Forceware for GTX460
(Beta / 版本号 258.50)
桌面环境2560*1600_32bit 60Hz
测 试 平 台 软 件
3D合成
测试软件
3Dmark 06
Futuremark / 版本号1.2
3Dmark Vantage
Futuremark / 版本号1.2
3D游戏
测试项目
DirectX 9游戏
Street Fighter IV
Comcap / 版本号1.0
DirectX 10游戏Company of Heroes
Relic / 版本号1.7.1
Crysis
Crytek / 版本号1.2.1
DirectX 11游戏Alien vs. Predator
SEGA / 版本号 1.0
Battlefield:Bad Company 2
EA / 版本号 1.0
Colin McRae DiRT 2
Codemasters / 版本号 1.01
Metro 2033
4A Game / 版本号 1.0
S.T.A.L.K.E.R.:Call of Pripyat
Koch / 版本号 1.0
Tessellation测试
Heaven Benchmark 2.1
UNIGINE / 版本号 2.1
Stone Giant
BitSquid / 版本号 Demo
Sub11-Microsoft SDK
Microsoft / 版本号 Demo
PhysX游戏Batman
Eidos / 版本号 1.1
Mirror's Edge
EA DICE / 版本号1.0
GPU通用计算Media Coder NT CUDA加速版
上海瀚智信息技术有限公司 / 版本号
辅助测试软件Fraps
beepa / 版本号 3.2.3


  各类合成测试软件和直接测速软件都用得分来衡量性能,数值越高越好,以时间计算的几款测试软件则是用时越少越好。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:58:55 | 显示全部楼层
● DX9理论性能测试:3DMark 06

  3Dmark 06作为上一代3DMark系列巅峰之作,所有测试都需要支持SM3.0的DirectX 9硬件,并且支持HDR特性,这款软件的最终得分里CPU性能占有不小的权重,因此它更适宜分析整个系统的3D加速能力。


    在DirectX 9.0c API的理论性能测试3DMark 06中,所有单卡产品在默认频率下性能差距不大。值得一提的是,GeForce GTX 460在超频后,性能有了20%以上的性能提升。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 19:59:58 | 显示全部楼层
● DX10理论性能测试:3Dmark Vantage

  3DmarkVantage是Futuremark最新推出的一款显卡3D性能测试,该款软件仅支持DirectX 10系统及DirectX 10显卡。测试成绩主要由两个显卡测试和两个CPU测试构成,整个测试软件各家偏重整机性能。


    在3DMark Vantage这款DirectX 10 API测试软件中,GeForce GTX 460 1024MB性能总的来说要强于GeForce GTX 465和Radeon HD 5830。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:00:38 | 显示全部楼层
● Street Fighter IV

        由CAPCOM负责开发的格斗游戏《街头霸王4》(Street Fighter 4)早已在电视游戏机上发售,经过漫长的等待,街霸迷们终于盼到了PC版的发布。本作不仅继承了TV Game版的所有特色,还增加更多诸如画面风格等特色。

  >>游戏类型:DirectX9格斗类游戏
  >>测试方式:游戏自带性能测试工具,内容为3D实时运算的战斗回放
  >>画质设定:全部最高


    在DirectX 9.0c游戏《街头霸王4》中,GeForce GTX 465凭借流处理器数量上的优势领先GeForce GTX 460。再对比已经确定成为对手的GeForce GTX 460和Radeon HD 5830,1299元的768MB GeForce GTX 460也能够以微弱优势领先。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:01:22 | 显示全部楼层
● Company of Heroes
  Company of Heroes(英雄连)是一款即时战略类游戏。二战是几年来长盛不衰的3D游戏题材,Company of Heroes就是从101空降师诺曼底登陆后在欧洲战场血战题材入手的最新战略游戏,不过其自带测试并非针对即时战略的实际场景,反而更像第一人称视角游戏。


  >>
游戏类型:DirectX10 即时战略游戏
  >>测试方式:游戏自带性能测试工具,内容为3D实时运算的剧情过场回放
  >>画质设定:全部最高


    在DirectX 10游戏《英雄连之前线》中,两款不同显存容量的GeForce GTX 460性能十分接近,而具备与高配GeForce GTX 460相同显存位宽的GeForce GTX 465性能要高一些,看来这款游戏在相同显存规格前提下流处理器数量要比频率更重要。其次,GeForce GTX 460以10%左右的性能领先Radeon HD 5830。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:02:00 | 显示全部楼层
● Crysis

  跳票多时、万众期待的DirectX 10游戏大作Crysis,把目前PC 3D娱乐的视觉体验发挥到极致的游戏,大量使用DirectX 10的硬件功能,对显卡的负载也提升至空前水平。


  >>
游戏类型:DirectX10 第一人称视角射击游戏
  >>测试方式:游戏自带GPU性能测试工具,为3D实时运算的飞行过场回放
  >>画质设定:全部最高


    在DirectX 10杀手游戏《孤岛危机》中,性能总结如下:Radeon HD 5830>GeForce GTX 460 1024MB>GeForce GTX 465>GeForce GTX 460 768MB>Radeon HD 5770。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:02:39 | 显示全部楼层
● Aliens vs. Predator
  由Rebellion开发、世嘉发行的科幻射击游戏《异形VS铁血战士》(Aliens vs. Predator)现已确定发售日期。根据世嘉的《异形VS铁血战士》官方网页的信息,本作将于2010年2月19日上市,对应PC、PS3和Xbox 360平台。这部根据电影改编的游戏也同样存在着三方势力,一方是人类海军陆战队,一方是异形,还有一方是铁血战士,游戏中玩家可以选择的是海军陆战队或者是铁血战士甚至是异形。本作提供单人模式和多人模式。

  >>游戏类型:DirectX11第一人称射击类游戏
  >>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高

    《异形大战铁血战士》是AMD和SEGA合作开发的游戏,自然在同档次产品上AMD的产品有些许性能优势,GeForce GTX 460落败Radeon HD 5830。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:03:19 | 显示全部楼层
● Battlefield: Bad Company 2

  《战地:叛逆连队2 (Battlefield: Bad Company 2) 》是EA DICE研发的第9款“战地”系列作品。它是2008年上市的同系列的游戏战地:叛逆连队的续作。两在单人游戏剧情上亦有很多交叉点。游戏仍然沿用前作的寒霜引擎,并有所改进。除了完善了代码的优化,本作在破坏效果上也有所加强,可破坏的物件由92%上升到99%。前作里不能破坏的小物件以及建筑物框架,在本作中也可以被破坏。

  >>游戏类型:DirectX11第一人称射击类游戏
  >>测试方式:沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高


    在《战地:叛逆连队2》游戏中,GeForce GTX 460 1024MB和Radeon HD 5830性能十分接近,前者以微弱优势小幅领先。
当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:03:52 | 显示全部楼层
● Colin McRae:DiRT2
       《科林麦克雷:尘埃》本身是一款为纪念去世的英国拉力赛车手科林.麦克雷(Colin McRae)而制作的游戏,因此在游戏过程中不难见到许多麦克雷过往的身影,距前作将近二年多之久的《科林麦克雷:尘埃2》于2009月12月11日正式发售。值得一提的是,这款游戏不仅拥有很高的可玩性,同时还是率先支持DirectX 11 API的游戏,一经上市就得到广大游戏爱好者争相追捧。

  >>游戏类型:DirectX 11竞速类游戏
  >>测试方式:游戏自带GPU性能测试工具,为3D实时运算的赛车过场回放
  >>画质设定:全部最高

    在《科林麦克雷:尘埃2》游戏中,虽然AMD和Codermaster合作开发了这款游戏,但是在实际性能表现上两款GeForce GTX 460整体优于Radeon HD 5830。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:04:34 | 显示全部楼层
● Metro 2033

        本作题材基于俄罗斯最畅销小说Dmitry Glukhovsky。由乌克兰4A游戏工作室开发,采用4A游戏引擎,而且PC版支持nvidia的PhysX物理特效。 2013年,世界被一次灾难性事件毁灭,几乎所有的人类都被消灭,而且地面已经被污染无法生存,极少数幸存者存活在莫斯科的深度地下避难所里,人类文明进入了新的黑暗时代。直至2033年,整整一代人出生并在地下成长,他们长期被困在“地铁站”的城市。

  >>游戏类型:DirectX11 第一人称视角射击游戏
  >>测试方式: 沿同一固定路线跑完3次取平均值,Fraps计速
  >>画质设定:全部最高

    《地铁2033》是一款DirectX 11游戏,也是一款相比《孤岛危机》有过之而无不及的硬件杀手游戏。在整体表现上,GeForce GTX 460 1024MB成绩优于此次参加对比的A卡,而GeForce GTX 460 768MB与Radeon HD 5830互有胜负。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:05:13 | 显示全部楼层
● S.T.A.L.K.E.R.: Call of Prypiat

  作为第二款支持DX11技术的游戏,《S.T.A.L.K.E.R.: Call of Prypiat》(潜行者:普里皮亚季的召唤)已于2009年11月中在德国、奥地利、瑞士三个国家先行上市销售,明年第一季度再登陆北美、英国和其他欧洲国家。该游戏此番发行了两个版本,一是普通的标准版,然后就是限量收藏版了,采用金属包装盒里,里边除了游戏本身还有一张A3地图,以及相关主题的打火机、徽章、头巾等小礼物。

  >>游戏类型:DirectX11 第一人称视角射击游戏
  >>测试方式:软件自带GPU性能测试工具,为3D实时运算的飞行过场回放
  >>画质设定:全部最高

    在《潜行者之普里皮亚召唤》游戏Benchmark测试中,GeForce GTX 460和Radeon HD 5830互有胜负,在开启反锯齿模式下GeForce GTX 460领先Radeon HD 5830。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:05:42 | 显示全部楼层
● Heaven Benchmark 2.1

        《Heaven Benchmark 2.1》是由俄罗斯Unigine游戏公司开发设计的一款Benchmark程序,该程序是由Unigine公司自主研发的游戏引擎设计,其支持DirectX 9、DirectX 10、DirectX 11与OpenGL 3.2 API,通过26个场景的测试最终得出显卡的实际效能。

  >>游戏类型:DirectX 9/10/11及OpenGL Benchmark
  >>测试方式:软件自带GPU性能测试工具,为3D实时运算的飞行过场回放
  >>画质设定:全部最高

    在最新版本的《天堂》2.1版本测试中,Tessellation性能起到决胜的关键。Fermi架构凭借多Tessellator的优势,整体性能优于参测的Radeon HD 5000系列。

当一扇幸福之门关闭时,另一扇就会打开。

3万

回帖

225

好友

9万

经验

超级版主

Vampire

威望
506

摄影爱好者论坛顶梁柱传说只有读到博士后的人才可拥有这枚勋章

 楼主| 发表于 2010-7-12 20:06:23 | 显示全部楼层
● Tesslation测试-Stone Giant

        《Stone Giant》是一个针对DirectX 11 Tessellation效能十分依赖的Demo,本次GeForce GTX 400系列发布,笔者将用其作为检验产品Tessellation性能的工具。本环节笔者仅使用NVIDIA和AMD两家的顶级单GPU产品GeForce GTX 480和Radeon HD 5870进行对比。

    在《石巨人》这款着重测试Tessellation的Demo中,即使GeForce GTX 460 768MB也能够以微弱优势领先Radeon HD 5830,7个Tessellator的实力得以发挥。

当一扇幸福之门关闭时,另一扇就会打开。
您需要登录后才可以回帖 登录 | 立即注册

收藏:1 | 帖子:5190

有图有真相