要達到8x AF的品質很簡單啊, 8x AF照算就好了.
------
架構啊....
well, 整個nVIDIA的產品架構的確是疊上來的, 如果你去看過Register Combiner(NV1x~NV3x的Pixel Pipeline底層架構), 你就能很確實地體會到這點.
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_GL.jpg
OpenGL本身的fragment處理架構
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV10.jpg
NV10
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV20.jpg
NV20
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV30.jpg
NV30
很像吧?
雖然實際上的架構不知道是怎樣, 但是nv_register_combiner的確是NV1x以來到現在NV3x, nVIDIA最重要的處理架構. 也是唯一能夠完全發揮nVIDIA架構硬體效能的資源..... 所以應該和硬體架構實際設計有不小的關係. 雖然用的人真的很少.(汗)
不過AF的部分要怎麼加速, 這個我前面有講到.... 基本上和TMU的單時脈讀取能力有關係.
雖說NV3x最大的設計差異是將TMU從color blending(著色單元)給分開出來, 但是其實這部分NV1x就開始做了, NV1x~NV2x與NV3x最大的差異在於
沒辦法將color blending的結果回送給TMU, NV3x主要就是加入了這一點而已. R200已經具備了類似的能力, 但是只能回送一次.(PS1.4), 能回送幾次基本上只是控制的問題.
R300其實也是有類似的特性, 比如說R300一個時脈內能同時做Texture Addressing和color blending, 就是因為這兩個單元是分離的.
所以現在的重點就在於, 要提高AF的能力, 有兩個努力方向.
1. 必須增加TMU的規模, 以強化AF所需的Texel讀取能力
2. 在1的前提下, 增加記憶體頻寬以應付增加的記憶體吞吐量需求
看起來NV30有做到1, 只是不知道改善多少; 而NV35則做到了2.
總之, 並不是因為架構一路疊上來, 所以只能靠提高時脈來增加效能的喔.
