● ULP? 6600? 小号PS3? Trgea2的图形部分名为Geforce ULP(Ultra Low Power),由一组标准光栅化流水线组成,它包括4组Vertex Shader,4组Piexl Shader以及1组TMU单元,200MHz时具备3.2Gflops的理论浮点运算能力,API方面则提供了Open GL ES2.0的完整支持。涉及到IP Core的保密问题,NVIDIA并没有透露其关键性的ROP单元的规模和结构细节,因此我们不敢妄论Geforce ULP的后端结构,只能通过各种测试和公布的理论数据来衡量其基本性能。

Geforce ULP构架 在Geforce ULP上,我们处处都能看到异构和Ultra Low Power的影子。我们前面曾经提到过,专用单元的性能功耗比会优于通用单元,究其原因在于专用单元会根据自身需要搭配适当的寄存器资源,这部分寄存器资源的需求会小于需要面对多种场合的通用单元。Geforce ULP采用VS和PS分离的单元,其初衷就在于通过专有的针对性单元将Vertex Shader和Pixel Shader指令分开进行吞吐。当面对无需处理分支而且格式始终是规整4D,但有可能包含特殊三角函数的Vertex Shader指令时,具备标量处理器的VS单元可以以最低的功耗来完成最高效率的吞吐,而场合转换到更加复杂的Pixel Shader指令时,PS单元又可以较好的给予适当的应对。 
Geforce ULP渲染流水线细节 另外,NVIDIA通过异构控制的方式将整个Geforce ULP的结构控制到最简,全部的控制工作,如线程调度和发放等由片外的一枚ARM7处理器来完成,这枚ARM7处理器通过统一共享内存与Geforce ULP和系统的其它部件项链,同时还负责着整个Tegra2构架其他部位的控制工作。此外,NVIDIA还将类似pure video的功能以单独的双解码芯片芯片的方式加以实现,并通过剥离部分ROP单元的功能形成独立的PBU(Programmable Blend Unit)来实现可编程的混合加速,如flash应用等。 
Tegra2构架 Geforce ULP无论从哪个角度来讲,都非常接近曾经的经典桌面构架——NV43。采用经典分离式shader构架的NV43曾经是NVIDIA在NV3X大失败之后绝地反击战的主力之一,它通过专门的VS和PS单元分别处理Vertex Shader和Pixel Shader指令,完整支持DirectX 9.0C以及Open GL1.4等API。Geforce ULP的处理核心结构与NV43如出一辙,NVIDIA也不断地在各种场合宣称其具有Geforce 6级别GPU的性能表现,甚至我们完全可以将其看成一款非常经典的产品——32bit版本的Geforce 6200TC(Turbo Cache)。 
32bit的Geforce 6200TC 而从异构和API的角度出发,Geforce ULP身上又有颇多PS3的影子,同样是通过异构处理的方式将大量GPU的执行的工作分担给其他单元,同样是CPU作用巨大,同样支持Open GL ES,这些特点又可以让我们将其视为一个超低功耗的移动版PS3。正是这些特点以及由此带来的相对较好的性能功耗比,造就了CES2011上Tegra2的大放异彩。 
异构结构的Cell处理器 又是异构又是Geforce6的,呼声如此之高的Tegra2到底是以怎样的先进构架作为对手设计的呢?接下来我们要面对的,将是一个在桌面领域消失了很久的老牌强者——Power VR构架。
|