NVIDIA爆发!GTX460非公版全线压境
泡泡网显卡频道11月18日 如果是半年前N饭让我推荐一款显卡,我会比较头疼,GF100是革命性的,全新的架构、超强的曲面细分性能给大家留下的深刻的印象,但为了追求全面领先而浪费了太多的晶体管,基于第一代架构的GTX480/470/465显卡过高的功耗与发热也成为挥之不去的阴霾。而老迈的GT200产品线要么就没有性价比,要么是火星卡。
而现在就简单多了,随着NVIDIA GTX460的发布,一向给力的A卡遭遇到了前所未有的挑战,部分高端A卡那叫一个尴尬。460虽然并非旗舰定位,但是从发布以来国内外媒体的评测结果来看,这卡刚刚的。1299/1499这样一步到位的定价让N饭们兴奋不已,曾经固若金汤的A卡阵营四面楚歌。
需求决定市场,各大厂商的嗅觉那可不是一般的灵敏。GTX460这样的黑马产品对他们而言那都是白花花的银子。村里随便扫荡一圈就能搜罗一筐GTX460。都是NVIDIA出品的嫡系兄弟,相貌远近高低看,却是各不相同。奸商美其名曰:超公版!
奸商靠的住,XX都能上树,到底是超公版还是“抄公版”一般的网友恐怕还真不好分辨。今天POP通过外观、做工、性能、功耗、发热、噪音、价格、售后等全方面来一次横向对比,看看它们的真正价值。
GTX460为何如此给力:GF104实力强大
GTX460是NVIDIA目前位置最出色的一款DX11显卡,其老大哥GTX480/470都要逊色三分,主要原因就是GTX460在性能、功耗、发热、成本等各方面都做得非常均衡,这些都源于NVIDIA对于GF104核心的精心优化设计。
● 从GF100(GTX480)到GF104(GTX460):尽最大努力加强规格
按理说,NVIDIA也应该会把GF100核心的主要规格全部减半,从而制造出一颗拥有256SP 256Bit的主流核心。事实上之前国内外的媒体都是这样猜测的,因为GF100模块化四核心的设计,很容易将其“拆分为”规模大小不一的中低端核心:
如上图所示,GF100为四核心设计,将它变为1/2、1/4就能轻而易举的获得中端和低端GPU,但NVIDIA却没有这样做,最终GF104核心的规模出乎所有人的预料!
乍一看,GF104就是GF100被一刀切成两半的规模,但请大家仔细看看到底有何不同?这里提醒大家一下:完整的GF100核心拥有512个CUDA核心,完整的GF104核心拥有384个CUDA核心,显然GF104核心并非是GF100一半的规格,NVIDIA在微观架构方面做了不小的改动,那NVIDIA为什么要这样做呢?
● GF104核心的改进:CUDA增50%纹理增100%
相信细心的读者已经看出来了,GF104相比GF100,最主要改变就是GPC(图形处理器集群)从4个减至2个,显存控制器从6个64bit(共384bit)减至4个64bit(共256bit),而最最重要的改变就是——每组SM当中的CUDA核心数量从32个增至48个。
按照常理来说,对于SM(流处理器簇)这一级的模块,已经没必要再重新设计或者进行调整了,直接保留GF100的设计,然后根据需要复制出一定的规模,新的核心就诞生了。但是在规格直接减半之后,虽然晶体管数和核心面积都会减半(参照Cypress与Juniper),但性能也会损失近50%,NVIDIA认为这并不是最佳的方案。
那该怎么办呢?我们知道,对GPU性能影响最大的模块就是流处理器(CUDA核心),如果能在GPU内部尽可能多的塞入CUDA核心的话,性能方面就会有很大的提升。但是CUDA核心也会消耗不少的晶体管,如果晶体管数太过庞大的话,GPU制造成本、良品率、功耗、发热也会受到较大影响。
那有没有两全其美的方法呢?大家可以注意看GF100芯片透视图,其中间位置有1/3的面积,这些是GF100一体式的二级缓存。NVIDIA为了提升GPU并行计算的效率,像CPU那样不惜成本的设计了大容量L2。L2对于性能的贡献主要集中在密集型计算任务当中,而对于普通的图形渲染来说,贡献就非常小了。那么如果将这些L2的容量进一步压缩,把节约出来的晶体管都变成CUDA核心的话,那么图形渲染性能将会得到显著提升。
GF104的SM要比GF100“胖”一些,CUDA核心横向扩张
于是,拥有较小L2、较多CUDA核心的GF104就诞生了,新核心每组SM中包含CUDA核心的数量从32个增至48个,增加了50%,流处理器总数达到了384个。NVIDIA在晶体管数一定的情况下,通过优化核心与缓存的配比,制造出了一颗实力超乎预期的核心。
● 每组SM当中的纹理单元数量从4个增至8个
当然,NVIDIA也没有单纯增加CUDA核心的数量,针对GF100核心的不足之处也做了较大的改进——纹理单元数量加倍!
纹理单元数量加倍
GF100核心的每组SM当中拥有32个CUDA核心,还包括了4个纹理单元,这样GF100总共就拥有64个纹理单元(GTX480屏蔽了一组是60个),远少于Cypress的80个纹理单元。较少的纹理单元使得GTX400系列在大量使用了纹理贴图的游戏中表现不佳,最有代表性的游戏就是《孤岛危机》。
GF104核心只有8组SM,如果还是保持GF100的设计不变,那么纹理单元将只有32个,还没有HD5770多(40个)。所以NVIDIA对纹理单元部分也做了改良,每组SM中的数量直接加倍,最终GF104拥有64个纹理单元,与GF100相等!
CUDA核心数量增加了50%,而纹理单元增加了100%,改进意图显而易见。这些改进都使得GTX460的性能大大高于此前的预期。
GTX460迫使AMD提前发布HD6870/6850
强大的GTX460不仅逼得HD5830无路可走,迫使HD5850大降价,这让AMD感到很头疼,AMD也需要一款在中高端拥有强大实力的产品来对抗GTX460。于是AMD也针对高端的Cypress核心进行了一番优化设计,推出了功能和规格有所强化的Barts核心,定位直指GTX460。
● DX11中高端显卡规格表:
这张规格表当中囊括了显卡所有的关键参数,看起来可能比较费劲,这里就为大家重点强调几个部分:
1. GTX460虽然流处理器数量少于GTX465,但默认频率较高,最终浮点运算能力要比GTX465高30%;
2. GTX460的纹理单元数量与GTX470相等,比GTX465多12个;
3. 由于核心SM规模的减少,GTX460的多形体引擎(内含曲面细分单元)数量减少至7组,但依然远高于HD5000全系列,因为A卡只有1个;
4. GTX460的TDP(设计功耗)要低于HD5830,1GB和768MB版本的功耗只有160/150瓦,NVIDIA终于彻底解决了恼人的功耗发热问题;
5. GTX460分为1GB和768MB两个版本,他们的区别不仅仅是显存容量差了256MB,显存位宽也少了64bit,造成显存带宽减少1/4,光栅单元减少1/4,二级缓存容量减少1/4,因为这些都与显存控制器是相关联的。
● 两款GTX460架构图:
值得一提的是,GTX460所用的显示核心并非GF104完整版,它被屏蔽了一组SM,这样就少了48个流处理器、8个纹理单元和1个多形体引擎(内含曲面细分单元)。如下图所示,被屏蔽的这一组SM有可能出现在任意八个位置之一。
另外GTX460 768MB版本还被屏蔽了一组显存控制器,这个显存控制器也可能出现在图中任意四个位置之一。屏蔽显存控制器的直接效果就是显存位宽从256bit减至192bit、显存容量从1GB降至768MB,连带效果就是光栅单元从32减至24个、二级缓存从512KB减至384KB。
前文通过冗长的篇幅详细描述了GF104核心,大家就会理解NVIDIA的良苦用心了:居然对一颗次高端的GPU核心进行了重新设计,虽然沿用了GF100优秀的架构,但在微观架构上进行了诸多改良,其最终目的就是以最小的代价,获得最高的游戏性能,为挑剔的游戏玩家提供最具性价比的选择。也许废话偏多,很可能上面这些很多烧友早知倒背如流了,我也就不赘述了,下面咱直接切入正题——做工赏析。
测试平台及环境介绍
测试平台我们选择了次高端的
i7 875+P55+双通道这样的组合,
内存使用了口碑不错的CORSAIR(海盗船)
DDR3 1600 4GB(2GB×2条)。这个平台我早用腻了,但也没办法,再换估计等intel下一代处理器了,AMD不用不解释。
● 详细配置如下表所示:
PCPOP.COM |
硬 件 系 统 配 置 |
处理器 |
Intel Core i7 875 |
(4核 / 8线程 / 133MHz*22=2.9GHz / 8MB缓存) |
主 板 |
P55 |
(Intel P55+Realtek ALC889 8声道音效芯片) |
内 存 |
CORSAIR(海盗船)DDR3 1600 4GB(2GB×2条) |
(9-9-9-24-1T) |
硬 盘 |
Seagate Barracuda 7200.12 SATA |
(1TB / 7200RPM / 32M缓存 / NTFS系统分区) |
电 源 |
Tagan BZ1100W |
六路+12V联合输出功率960W,单路+12V最大电流20A |
显示器 |
ENVISION |
(24英寸LCD / 1920*1080分辨率) |
软 件 系 统 配 置 |
操作系统 |
Microsoft windows7 |
(中文版 / 64BIT 旗舰版) |
驱动 |
NVIDIA Forceware for windows7 64BIT |
260.89_desktop_win7_winvista_64bit_english |
游戏信息获取 |
Fraps |
版本号3.1.2 |
显卡信息获取 |
GPU-Z |
版本号0.4.4 |
处理器信息获取 |
CPU-Z |
版本号1.53 |
▲ NVIDIA公版GTX460 768M
在GPU-Z信息测试中,软件识别出了这款产品的基本情况,我们可以看到它使用了集成336个流处理器的GF104核心(GPU-Z识别错误),40nm工艺。 在GPU通用计算能力方面GPU-Z也做了功能识别,GF104图形核心支持GPU-Z软件能够识别的所有功能,OpenCL、CUDA、PhysX和DirectCompute 5.0。
四核八线程的Core i7 870,核心频率默认2.9GHz,关闭睿频技术。
NVIDIA公版GTX460 1GB显卡实物拆解
介绍完GF104核心架构和技术特点之后,下面我们就来看看基于GF104核心的首款显卡——GeForce GTX 460,此次同一个型号有两个不同的版本,首先我们看看1GB的版本:
NVIDIA公版卡的造型再次改变,公版散热器不同于以往任何一款产品,黑色的外壳略微有些内凹,中间镶嵌一个7CM的风扇。
散热器并非GTX480/470/465那样的涡轮风扇+侧吹风道式散热结构,因为涡轮风扇功率比较高、噪音比较大,虽然可以将GPU发出的全部热量排出机箱之外,但散热效率较低、噪音较大。
由于GF104核心发热较小,没必要非得使用侧吹风道式结构将所有热量排出机箱外,使用散热效率更高的直吹式结构更有利于控制风扇转速和噪音。取下散热器之后我们可以发现,散热片部分为太阳花式结构,通过两条热管辅助将热量快速传导至散热片边缘,然后大口径风扇将热量带走,其中一半热风可以被排出机箱外,另一半将残留至机箱内。直吹式结构还有个好处就是风扇可以辅助显存、供电和PCB散热。
公版PCB的做工用料中规中矩,核心三相加显存一相,需要两个6Pin PCIE辅助供电接口。据NVIDIA称其实GTX460只要一个6Pin辅助供电就够了,之所以设计两个,是为了超频玩家而准备的,GTX460的超频能力非常强,但超频后功耗也会同比提升。
GF104-325核心拥有336个流处理器,默认核心/CUDA频率是675/1350MHz
GF104核心比较奇特之处就是GPU为长方形,而此前NVIDIA和ATI所有GPU都是正方形的。特殊的设计使得显卡散热器四个定位孔也呈长方形分布,几乎所有的第三方散热器都无法兼容GTX460显卡。好在NVIDIA公版散热器散热能力和噪音表现都非常好,没有必要更换散热器,就连AIC的一些非公版显卡,都直接使用了这个公版散热器。
显存为常见的三星GDDR5颗粒,0.5ns的规格理论频率为4000MHz,GTX460的默认显存频率是3600MHz,一般情况下可以超至4000MHz,但想要冲击更高频率就难了。目前NVIDIA的GDDR5显存控制器还是没有AMD做得好,冲击高频率难度较大。
输出接口部分,GTX460与GTX480\GTX470\GTX465完全相同,都是两个Dual-Link DVI搭配一个Mini HDMI接口。由于PCI挡板空间实在没有位置,所以才勉为其难的设计了一个小HDMI。
现在GTX460已经可以支持通过HDMI输出未经压缩的次世代音轨,在功能上与HD5000系列没有区别。据称公版卡的HDMI接口还是1.3a标准,如果AIC厂商愿意的话可以设计成支持3D立体的1.4标准,但需要支付一定的认证费用,因此成本会有所增加。
NVIDIA公版GTX460 768MB显卡实物拆解
GTX460 768MB与1GB的版本几乎完全相同:PCB设计、散热器、供电、默认频率等等。唯一的不同就是少了两颗显存:
在不拆显卡散热器的情况下,区分GTX460 1GB与768MB的方法就是看显卡背面PCB上的元件,在八颗显存的对应位置,如果有元件空焊的情况,那么就肯定是768MB的版本。取下散热器就能看出端倪:
NVIDIA公版GTX460 1GB(上)对比768MB(下)
很明显,GTX460 768MB版本比1GB版本少了两颗显存,当然两者的差别不仅仅是显存容量少了256MB、显存位宽少了64bit这么简单,其光栅单元数量和二级缓存容量都有所减少,因此性能损失会比较多。
两款不同的GTX460 768MB对比
而且,笔者还发现不同厂商的GTX460 768MB,其显存空焊位并不相同。这两个空焊位并不是厂商想空哪就空哪,而是由核心代号决定的。GTX460 1GB的核心代号是GF104-325,代表4个64bit显存控制器都是完好的,而GTX460 768MB的核心代号是GF104-300,代表显存控制器有屏蔽,具体屏蔽的是哪一个,看后缀:
后缀KA代表屏蔽右下角的一个64bit显存控制器,这两颗显存就必须空着,焊上也没用。KB代表屏蔽右上角的一个64bit显存控制器,同理还会有KC、KD的型号。每个显存控制器在GPU背面所连接显存的针脚是固定的,所以屏蔽之后就必须在相应的位置空焊。
其他方面,GTX460 1GB版本和GTX460 768MB版本没有任何区别。
肉搏开始!卖相及PCB(一)
好的卖相让人看着舒服,而合理的PCB设计和扎实的用料可以让元器件在更加稳定的状态下运行。
声明:显卡横评有部分项目无可避免地涉及到主观因素,比如外观、做工方面的评分,如有偏颇之处,仅代表个人观点。