瀏覽單個文章
Artx1
Registered User
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
3Dlabs發表Wildcat Realism架構

http://www.3dlabs.com/product/techn...ildrealtech.htm
代號P20。
有單晶片架構(1VPU),以及多晶片架構(1VSU+2VPU)
1VPU產品應該會是新的Wildcat-VP產品,
1VSU+2VPU則會是Wildcat旗艦系列。
一個VPU有150M transistors,VSU應該小得多。

VPU架構圖:

由於3Dlabs P10開始均以Scalar為基礎,所以這邊看到的數據是:
16 Vertex
48 fragment,32 texture(!!)<--可能是per pass可取用的數目。
64 pixel rasterization
所以有可能是接近4D VS x4 + 4D x 12pipe的設計。
相比之下,NV40則是5Dx6=30(VS),4Dx32=128(PS)。

不考慮Driver品質的話,
全部都是1D Scalar,有可能效率會比較好。

不過值得注意的是HOST用的是AGP8x,
這個會在後頭討論。

接著是VSU的部份:


VSU有自己的Memory,裡面放了兩個VS,後頭連接兩個VPU。
VPU和VSU之間用兩條4.2GB/s的頻寬連接,這看起來和NVIDIA的HSI很類似,都是AGP controler改過來的(AGP16x)。

VSU有兩個VS,總共32個processor。
雖然這樣看來和VPU裡面本來有的VS的數量一樣,不過在VSU+VPU的架構下,VSU有自己的記憶體頻寬(128bit GDDR3),所以效率或許會更好一點。
而且雖然兩個VPU都有和一個VSU同等的VS規模,但是在雙GPU的架構下,其實你跑Vertex的時候不一定能知道三角形會在哪個Rasterizer底下,所以這兩個VPU的VS跑的可能得是同樣的內容,這樣效率一定很差,於是改成外接一個VSU,效率才會真的等價於8個"可用"的4D VS。

組成:
VPU的介面是AGP8x,配置是256bit 512MB GDDR3,有兩組dual-link DVI。

在這個構成下,相當於一般4D Vector的4VS,12pipe。

VSU用PCI-Express和HOST連接,配置1個VPU的狀態。

這樣的話,相當於由4D Vector構成的8VS,12pipe。
配置記憶體是128+512=640MB GDDR3

VSU用PCI-Express和HOST連結,配置2個VPU的狀態。

在這個構成下,相當於由4D Vector構成的8VS,24pipe。

嗯....外加VPU單獨有256bit 512MB GDDR3,VSU+2VPU的構成底下,
就有128MB + 512MB x2 = 1.2GB的GDDR3了。
嗯嗯....大怪物啊。

====
效能方面,3Dlabs宣稱UGS能跑到"市場現有最快的產品"的兩倍以上效率。
因為發表是在NAB2004上發表的,QuadroFX4000剛發表理應不算,這個"市場目前最快"指的是QuadroFX3000的45.3。
也就是說可以跑到約90上下。
順道一提,QuadroFX4000目前NVIDIA表示可以跑到59,似乎是輸一截;
不過QuadroFX4000用的是300MHz的NV40.... 還有得拼呢。

嘛,離Wildcat Realism推出的日子還遠得很呢。
何況以3Dlabs最近的Driver表現來看,即使硬體上是大怪物,跑出來能不能有怪物效能也值得觀察。
不過,這三顆晶片和底下配置的記憶體來看,至少吃電量應該毫無疑問地會奪冠吧。
     
      
舊 2004-04-20, 01:46 PM #1
回應時引用此文章
Artx1離線中