瀏覽單個文章
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by 宗毛
有關af演算法的問題,我記得有聽過前輩說過nv geforce基本上是一個堆疊上來的架構
(我是不知道這樣說對不對啦^^a)
而我會有疑問是好奇af在nv3x上是否有完全異於nv2x的硬體去做
如果他們是一樣的話,除了提升頻率外我不知道有別的方法可以提升速度?
(r3xx和r200應該在存在非常大的相異點吧?…這也是我猜的-_-|||)

我的確是覺得nv用省工增加速度,
但是我已經盡量試圖不要在我一開始的文章給人加上先入為主的觀念(看來是失敗了XD)
因為cho又說nv是用不同的方法達到8x的quality
""NVIDIA的�z理方式是�三𠄌性�e𥹉,抖�。""
但是我就是不認為original 44.03的8xaf看起來像8x
我也怕自己說錯,所以也不太用篤定的字眼下結論
但是cho似乎不願正面回答我"nv如何用那種方法達到加了ad後的品質?"……sigh

--
RPWT,這可是在cn那邊的論壇學來的呀!


要達到8x AF的品質很簡單啊, 8x AF照算就好了.

------
架構啊....

well, 整個nVIDIA的產品架構的確是疊上來的, 如果你去看過Register Combiner(NV1x~NV3x的Pixel Pipeline底層架構), 你就能很確實地體會到這點.

http://eji7a045.hp.infoseek.co.jp/GPU/T&C_GL.jpg
OpenGL本身的fragment處理架構

http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV10.jpg
NV10
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV20.jpg
NV20
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV30.jpg
NV30

很像吧?

雖然實際上的架構不知道是怎樣, 但是nv_register_combiner的確是NV1x以來到現在NV3x, nVIDIA最重要的處理架構. 也是唯一能夠完全發揮nVIDIA架構硬體效能的資源..... 所以應該和硬體架構實際設計有不小的關係. 雖然用的人真的很少.(汗)

不過AF的部分要怎麼加速, 這個我前面有講到.... 基本上和TMU的單時脈讀取能力有關係.

雖說NV3x最大的設計差異是將TMU從color blending(著色單元)給分開出來, 但是其實這部分NV1x就開始做了, NV1x~NV2x與NV3x最大的差異在於沒辦法將color blending的結果回送給TMU, NV3x主要就是加入了這一點而已. R200已經具備了類似的能力, 但是只能回送一次.(PS1.4), 能回送幾次基本上只是控制的問題.

R300其實也是有類似的特性, 比如說R300一個時脈內能同時做Texture Addressing和color blending, 就是因為這兩個單元是分離的.

所以現在的重點就在於, 要提高AF的能力, 有兩個努力方向.
1. 必須增加TMU的規模, 以強化AF所需的Texel讀取能力
2. 在1的前提下, 增加記憶體頻寬以應付增加的記憶體吞吐量需求
看起來NV30有做到1, 只是不知道改善多少; 而NV35則做到了2.

總之, 並不是因為架構一路疊上來, 所以只能靠提高時脈來增加效能的喔.
舊 2003-07-25, 03:05 AM #27
回應時引用此文章
Artx1離線中