主題: R420之我見
瀏覽單個文章
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
關鍵數字:AF效能比較。
R420
http://www.beyond3d.com/reviews/ati.../index.php?p=24
NV40
http://www.beyond3d.com/previews/nv.../index.php?p=28

在DX7時期的遊戲就看不出來,AF對雙方都沒有performance hit;
但在比較複雜一點的程式上(3DMark03 GT2),16x的AF對雙方的效能影響互有高低:
NV40約33%,R420則約17~18%的影響。
AF效能有著確實的差異,這點造成了在實際遊戲測試中,只要一開高倍AF,R420就可以逆轉。

----
反倒是FSAA對雙方的影響都沒那麼大。
NV40
http://www.beyond3d.com/previews/nv.../index.php?p=29
R420
http://www.beyond3d.com/reviews/ati.../index.php?p=25

在理論性測試上,8x OGSS的底下,即使是NV40都照樣出現極大的效能損耗(70%),
但只要使用RGSS,在Pre-DX7底下的理論性測試雙方都是幾無差異。

而在稍微複雜一點的遊戲,如3DMark03 的GT2方面,
R420在4x AA的performance drop約為60%,6x AA為72% drop。
但是NV40的表現則是4x約44%,8x則因為OGSS帶來的影響而狂跌到88%。
也就是說,4x RGAA上,NV40稍微強過R420一些。

上述的理論性測試數據分析大都佐證到了各地的評測上。
高解析度雙方都差不多,開到4x AA為止NV40稍微佔一點優勢;
但是AF開下去之後狀況就開始逆轉了。
所以我們看到了,現在R420狂勝的測試中,沒看到哪個沒開4xAA/8xAF的。
Toms的測試有關掉AF的項目,於是NV40表現就仍然不錯。

----
好,現在來點親NVIDIA的說法:

已知NV2x有著計算上最完整的AF演算法,品質非常地高,但是速度非常慢。
在當初 NV20 發表的時候,NVIDIA曾經為了AF效率的部分為自己辯護了一下。
講了很多,不過重點在於:Shader越長,越有辦法隱蔽掉AF帶來的效能損耗。
基本上,到目前為止這個說法仍然有效,Shader並沒有哪個遊戲用到真的很大的規模。

比方說,今天假設16x AF,GPU需要16 cycle才能處理完。
看起來很長(fillrate變成1/16啦)。
但是如果你的Shader本身就需要16個以上的cycle才能跑完,而且只用到一個texture,
那麼相對地就等於你的16x AF沒有計算上的overhead了,只剩下記憶體頻寬需求,
還有Texture Cache最佳化得好不好。
因為架構上毫無疑問地TMU和Shader是分開的,只是Texture定址部分可能還是合在一起的。

NV40的Tex Add和Shader0還是在一起的,不過Shader1比較強,所以Tex Add還是有一些時候會free。
R420則是Tex Add和Shader0/1都是分開的,只是Shader0/1合起來的效能稍微小於NV40一些,
完全free的Tex Add仍然有頗強的助益,只是和R3x0比起來,R420的Tex Cache應該又強化了很多,
才真正地讓AF的效益體現出來。

GZeasy宣稱結構上NV40約為R3x0的1.5倍,不過因為最佳化問題,所以還要打一點折扣。
R420在Shader上頭則沒有結構上的改進,只有暫存器相應的增加;
不過R420回應給NV40的是以1.3倍的時脈優勢來反制,實質上是大略抵銷了。

總之,如果Shader長度拉長的話,NV40在AF上相對於R420的弱項會有一些機會可以抵銷掉。
舊 2004-05-06, 03:06 AM #13
回應時引用此文章
Artx1離線中