TShopping

 找回密碼
 註冊
搜索
查看: 968|回復: 3

[分享] Radeon HD 4870 1GB推出,挑戰新版GTX 260

[複製鏈接]
發表於 2009-1-16 00:32:40 | 顯示全部樓層 |閱讀模式
 
Push to Facebook Push to Plurk Push to Twitter 
介紹
Radeon HD 4870原本就在與GeForce GTX 260的對話中占得上風,此後NVIDIA緊急發布了具備216個流處理器的新版GeForce GTX 260 core 216,這樣不但在顯存上繼續保持了優勢,還在核心性能上有了足夠的資本。不過AMD并沒有放棄這塊市場的争奪,新版1GB Radeon HD 4870也已經發布。在我們的測試中,你将會看到1GB版相對于512MB版的巨大領先優勢。



Redeon HD 4800系列在流處理器數量上有了質的飛躍,從R600的320個一下子躍遷到RV770的800個!暫不考慮其他部件的影響,流處理器大幅度的提高,晶體管集成數卻隻從RV670的6.6億上升到了RV770的9.6億。是的,RV770的效率非常高,相比RV670,AMD僅僅将核心尺寸提高了30% 而已,它們同樣都是55nm制造工藝的産物。



RV770繼承了RV670所有的優秀特性,比如支持DirectX 10.1,擁有tessellation單元,支持PCI Express 2.0。此外AMD還增加了一個全新的統一視頻解碼引擎,這種引擎可以接受闆卡本身發出的微操作,這可以幫助顯卡更好的适應當前的應用環境。微操作還控制着頻率、電壓等,這可以保證核心更有效的工作和節能。

物理運算?

你也不能忽視了AMD基于圖形芯片的物理運算特性,AMD已經與Intel在這方面進行合作,讓顯卡加速物理運算成爲可能,Intel目前擁有物理引擎 Havok的版權。不過當事雙方還沒有做出任何正式申明,而當這一切最終成真,那麽我們可能會看到圖形芯片很好的進行物理運算,運算速度可能達到CPU的幾十倍,甚至幾百倍。



所有的規格參數與特性都表明,RV770可以比一般CPU做得更好,特别是在物理運算方面。當然,就目前而言,他們還沒有辦法取代CPU在遊戲中全面負責物理運算,不過圖形處理器的強大性能已經嶄露頭角。我們當前還不得不等待,等待有一天可以看到,在顯卡高性能運算幫助下,遊戲的物理效果究竟可以達到什麽程度。

架構簡述

RV770的架構還是延用了上一代統一渲染架構,當然改進的地方很多。在這個架構中,主要由Command Processor、Setup Engine、Ultra-Threaded Dispatch Processor、Stream Processing Units、Texture Units、Cache & Buffer、Shader Export Render Back-Ends和Memory Control等單元組成。RV770主要改進的地方集中在Stream Processing Units、Texture Units和Render Back-Ends部分。



作爲RV770架構最核心的部分,流處理器單元至關重要。ATI的統一着色單元稱爲Stream Processing Units,而NVIDIA産品中統一着色單元稱爲Streaming Processors,兩家雖然都稱爲流處理器,但結構完全不同。對于ATI而言,流處理器單元和流處理器是不同的,每個Units内部包含5個超标量 ALU ,這5個ALU共用一個指令發射端,卻能同時執行5個通道的數據,這就是SIMD架構,一個時鍾周期可以進行5次MAD運算。

運算部件

在運算部件中,其中大一點的ALU還能夠進行一些特殊運算,比如SIN、COS、LOG、EXP等函數,因此可以說一個Stream Processing Units實際上是包含有5個Stream Processing的,這就是我們常說的4D+1D超标量SIMD架構。而NVIDIA的每個流處理器就是1D标量,屬于純标量MIMD架構。對于 RV770而言,擁有160個Stream Processing Units,也就是說一共有800個Stream Processing。



每16個Stream Processing Units組成一個SIMD矩陣,每個SIMD矩陣内含有80個SP,比起RV670的4個SIMD矩陣320個SP完全是一種從量變到質變的飛躍過程。每個SIMD矩陣對應有一個紋理單元,RV770的紋理單元比上一代作過優化,紋理緩存帶寬是HD 3000系列的兩倍,每平方毫米性能增加70%,在每個紋理單元均内含4個Texture Address Unit、4個Texture Filter Unit,因此10個紋理單元一共有84個TAU和40個TFU,比起RV670的32/16個均有大幅提高,對遊戲的執行效率将會有顯著幫助。

紋理單元與tesselator單元

我們發現,在RV770中每個SIMD矩陣還對應有一個Local Data Share,其大小16KB,在以往的RV670架構圖中并沒有發現類似功能部分。這樣的話,每個SIMD矩陣内,流處理器與流處理器間能共享信息,省下了從外部緩存系統中讀取信息的時間,這種設計大大加快了處理器的運算速度,同時提高了各種算法的效率,這與NVIDIA GeForce GTX200内部的TPC加入緩存的思想相類似。



有一點要提到的就是AMD的Programmable Tessellator可編程鑲嵌單元,在Setup Engine部分可以見到它,AMD稱在RV770中強化了這一部分的性能。簡單的說,Tessellator可單純使用GPU創建不同複雜程度的多邊形模型,降低開發難度、改進程序性能,它能夠在圖形芯片内部自動創造頂點,使模型細化,從而獲得更好畫面效果。Tessellator并不隸屬于 DirectX 10标準的技術,不過DirectX 10.1标準已将它納于麾下,它最重要的是在保證了非常好的視覺效果的前提下節約了性能,讓一個程序的運行速度能夠保證在很好的水平。


System Setup

Intel Core 2 Extreme QX9650

ASUS P5E3 Premium

4GB OCZ Platinum DDR3-1333

GeForce GTX 280
GeForce GTX 260
EVGA GeForce GTX 260 Core 216
BFG GeForce GTX 260 OCX MAXCORE
ForceWare 178.13

ATI Radeon 4870
Catalyst 8.10 RC2

300GB Western Digital Caviar SE

Windows Vista Ultimate 64-bit w/Service Pack 1



Benchmarks

Company of Heroes 1.71
World in Conflict
Elder Scrolls IV: Oblivion 1.2
Call of Duty 4 1.4
Half-Life 2 Episode Two
Lost Planet
Crysis 1.2
Quake Wars
BioShock
Devil May Cry Performance Benchmark #2


详细对比参数

 

臉書網友討論
發表於 2011-11-13 00:47:31 | 顯示全部樓層
不錯,感謝樓主

版主招募中

發表於 2011-11-13 00:35:45 | 顯示全部樓層
我想要~~~~~~~  


您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則



Archiver|手機版|小黑屋|免責聲明|TShopping

GMT+8, 2016-12-6 02:30 , Processed in 0.058305 second(s), 19 queries .

本論壇言論純屬發表者個人意見,與 TShopping綜合論壇 立場無關 如有意見侵犯了您的權益 請寫信聯絡我們。

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表