瀏覽單個文章
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
引用:
Originally posted by Artx1
http://www.bluesnews.com/plans/1/
John Carmack's .plan

基本上, doom3針對幾家主流顯示卡分別作了幾個backend:
總共有ARB/ARB2/NV10/NV20/NV30/R200等六個.(排列循字母)

R300系可執行--
ARB (minimum extensions, nospecular highlights, no vertex programs)
R200 (full featured, almost alwayssingle pass interaction rendering)
ARB2 (floating point fragment shaders, minor quality improvements, always single pass)

NV30則有--
ARB
NV10 (full featured, five rendering passes, no vertex programs)
NV20 (full featured, two or three rendering passes)
NV30 (full featured, single pass, 16bit FP?)
ARB2

NV30在ARB2 mode下頗慢. 雖然NV30提供了比較好的前瞻性(更長的指令量, 品質也是最好的); R300系則在用R200 mode的狀況下比ARB2 mode要快了一些.

NV35在使用[r_renderer NV30]的時候萬夫莫敵. 主因是因為NV35加強了NV30最弱的地方--使用32bit FP時的速度問題. 因為NV3x管線以16bitFP為基礎, NV30只具備了4個16bit FP shader, 所以跑32bit的時候fillrate相當於降低一半; 而R300系則一直都是24bit, 所以沒有快慢問題; NV35則將FP Shader數量整整加了一倍, 於是32bit達到了該達到的速度(fillrate不減), 如果使用16bit FP則處理效能遊刃有餘.(瓶頸會轉到color + z op上, 因為其實是4管線, NV35相當於在4管線中塞入了8管線的處理單元, 並且讓處理資源能夠做動態分配, 所以某些狀況下可以達到8管線的效率.)

如果都使用ARB2 mode的話, 雖然NV35的fillrate稍低(4管線 vs 8管線), 但整體效率高過R300系. 加上Driver等等其他部分的差異, 結果就是壓倒性的勝利.

另外, 催化劑3.4在執行Doom3 mark的時候會出現致命性的當機問題, 而且效能也低於3.2版; 故AnandTech以3.2做benchmark.

然後, AnandTech表示nVIDIA還沒提供真正最佳化過的Driver出來, 因此可以預期NV35的效能還會再提高. (Splinter Cell測試下NV35甚至輸給NV30!!)

----
OpenGL是nVIDIA的地盤啊.


感謝Artx1大大的整理
省去了弟找資料的時間

c3.4實在是不知道ati又在修什麼包…
似乎是已經過了原本預定要發表的時間
難怪在gzeasy有人會開「ATI发布一个新驱动比发布一个新核心还难」的討論串

加油吧!
舊 2003-05-14, 05:34 PM #20
回應時引用此文章
宗毛離線中