Master Member
您的住址: 耗電量頗高的地方.
文章: 1,959
|
唔.... 前面u865兄有一個蠻有道理的地方是說,
基本上如果GPU能夠照規範來做的話,核心同clock的話效能會大略相同;
大略是說,"同時間內能做的事情數量差不多",因為即使GPU裡面有很特殊的設計,
也可能會因為沒使用特殊的指令,而變成沒有使用出那個GPU的特性。
問題是,"使用出那個GPU的特性"是好事嗎?
這又不是電視遊樂器.... 這種事情是不太可能的。
照DirectX的規範,作出更容易在更多的PC上執行,而不會遇到問題,
才是DirectX的目的才對。
所以從這個觀點來看,較注重功能的設計,效能方面的表現就要有犧牲的覺悟了。
從這點來看,"多做"也不會"多得",是GPU功能面的一個負面影響。
因為多做了,就使用更多電晶體了。
反過來說,為了能夠同時取得效能和功能上的表現,
通常會希望併列更多的單元,主要的原因是因為繪圖的工作有個很大的性質,在於容易平行化。
GPU和CPU不同的地方在於工作的性質,
繪製畫面的像素時,像素與像素之間不會有什麼很大的影響(目前的GPU就是針對這點作的),
所以反過來說,只要後端的記憶體夠快,能夠容納的吞吐量夠大,增加管線就會不斷地變快,
而不會像現在CPU這樣可能會有額外的問題。
(Shader的Brench似乎會帶來額外的問題沒錯,但是原則上是不會變的:
不應該寫會造成太多分歧的Brench,才能夠有效地維持效能)
所以從這點來看,高階卡的主要成本,完完全全地在其提供的記憶體的頻寬上。
因為晶片的成本,完全只受到晶片大小的影響(同時影響數量與良率),
所以比方說廠商有時候寧可把中階打入低階,只降低記憶體頻寬就拿出來賣,
就是因為記憶體很可能佔了這張卡實際成本的大半。
*:提升製程用所需的成本,是代工廠開出代工價格時的影響條件:
不過原則上更精密的製程,單片晶圓報價成長速度會低於晶片生產可以增加的數量,
也就是晶片單價通常會降低,除非良率較上一代惡化;
而這目前被認為屬於該製程成熟與否的指標。
----
另外一點,我先前曾經問過Hotball兄一點,為什麼有些GPU對CPU的依賴性非常低,有些又很高呢?
Hotball兄的回答比較出人意表:完全看Driver怎麼作。
比方說3Dlabs的卡這方面的傾向就比較劇烈,不只GPU本身不依賴CPU,
甚至連換快CPU都可能不會對校能帶來多少幫助!
有些人因此認為"所以3Dlabs沒有用到模擬",然後用CPU usage較高,
來認為N / A的產品有用到模擬,這是不正確的:
繪圖需要的速度實在太快了,CPU的效能是杯水車薪,只要是GPU沒有的功能,
透過CPU模擬的時候就絕對不可能在實際運作中得到"可以讓人接受"的表現。
(玩過NVemulate的人大概就會知道,用上一代的卡模擬下一代的卡,只能拿來檢查程式有沒有寫錯,完全不能夠看效果的)
NVIDIA在測試裡面出現的特性,大概就是介於過去3Dlabs,和ATI現在的狀況之間吧。
|