引用:
|
作者竹雲公子
感謝大大詳細的解說...又懂了不少
那看來R5X0新增加的那個Ultra-Threaded Pixel Shader Engine技術也是為了要提昇Pixel Shader的使用效率摟?
記得之前站上的大大(好像是三星大的樣子)也說過R580的效能還沒有完全發揮
這個說法跟大大您不謀而合阿~~~
再次謝謝大大的解說
|
可以參考一下Beyond3D的R580結構工程師訪談。
http://www.beyond3d.com//reviews/ati/r580/int/
其實那個不能算"新增"....
以往指令指令分派也都是以quad為單位,每4個"管線"為一組....
只是現在ATI每4個管線為一組,使用一個很注重Threading資源的處理器來分配指令,
並且還把這個處理器可以連接的ALU數量也跟著擴充(12個)....
基本上R580的每個ALU本身的效率因為threading資源被進一步瓜分的關係,和R520相比時變得較差;
不過基本上它仍然是增加了3倍的ALU、而在不少狀況下取得了相當的強化。
有些瓶頸於ALU的狀況下,R580可以達到R520的兩倍速度....而且至少沒有看到R580反而比R520來得慢的地方。
總和來說,多投資20%的電晶體,取得的確有20%的效能提升;
而如果增加R580的threading資源的話,很可能電晶體上的成本又不合算了....
所以,ATI的工程師認為,R580至少是個平衡度上比R520來得好的產品。
只是R520 delay的關係,看起來好像就很失敗....
如果R520順利在本來預定的2005年春~年中這段時間推出的話,看起來就不會那麼糟糕。
(當然現在講這個都來不及了)
----
反過來講G71。目前傳說它是32管的結構,比較合理的預測是8vs32ps16ROP,
亦即將G70現在的24ps增加到1.5倍。
可是ATI的工程師覺得,G7x的結構增加PS的數量就會增加TMU,
使得Tex與Pixel的比值又開始增加(如2:1),他們認為這並不是個好的選擇,
因為材質目前使用量是比較少的。
注意:NV43/44的TMU:ROP比值是2:1、NV40/41/42的TMU:ROP比值則是1:1;
G70的TMU:ROP比值變為3:2,算是變得比以前高;
實質上目前Tex的使用比例減少的話,G70的這個比例可能有過高的嫌疑,G71就更高了。
當然了,NV4x/G7x的PS/TMU的比值基本上仍然是固定的,
光是TMU的增加也不會帶來很多問題(有個問題是NV4x/G7x的TMU和ALU0是互斥使用),
只是如果記憶體頻寬沒有增加的話,光是增加TMU並不會帶來什麼特定的幫助。
----
這邊有個必須注意的地方:
因為雙方的結構設計上有很大的落差,細部設計上的差異更是所在多有,
所以ATI工程師的觀點,自然無法代表NVIDIA產品的優劣(反而常常應該要打上問號);
不過仍然可以作為參考。
比方說,ATI認為他們的架構對未來的程式幫助較大,是個路遙知馬力的結構;
G7x則是個以往的程式也能跑得很好的結構,但是投注資源於以往的程式,ATI認為是沒什麼意義的。
(也就是說他們自認著眼未來)
但是,不論結構相對性上對現有、過去、或未來的程式較有助益,
"絕對性能"上的比較,也就是說到底誰快誰慢、還有誰提供的品質較好,
應該才是user所注目的地方....
所以,雙方理念上的差異、以及各自所選擇的道路是否正確,
只能以未來的考驗來決定了。