PCDVD數位科技討論區 - 瀏覽單個文章 - 『CPU＆顯示卡』前世今生徹底解析！

唔.... 前面u865兄有一個蠻有道理的地方是說，
基本上如果GPU能夠照規範來做的話，核心同clock的話效能會大略相同；
大略是說，"同時間內能做的事情數量差不多"，因為即使GPU裡面有很特殊的設計，
也可能會因為沒使用特殊的指令，而變成沒有使用出那個GPU的特性。

問題是，"使用出那個GPU的特性"是好事嗎？
這又不是電視遊樂器.... 這種事情是不太可能的。
照DirectX的規範，作出更容易在更多的PC上執行，而不會遇到問題，
才是DirectX的目的才對。

所以從這個觀點來看，較注重功能的設計，效能方面的表現就要有犧牲的覺悟了。
從這點來看，"多做"也不會"多得"，是GPU功能面的一個負面影響。
因為多做了，就使用更多電晶體了。

反過來說，為了能夠同時取得效能和功能上的表現，
通常會希望併列更多的單元，主要的原因是因為繪圖的工作有個很大的性質，在於容易平行化。
GPU和CPU不同的地方在於工作的性質，
繪製畫面的像素時，像素與像素之間不會有什麼很大的影響(目前的GPU就是針對這點作的)，
所以反過來說，只要後端的記憶體夠快，能夠容納的吞吐量夠大，增加管線就會不斷地變快，
而不會像現在CPU這樣可能會有額外的問題。

(Shader的Brench似乎會帶來額外的問題沒錯，但是原則上是不會變的：
不應該寫會造成太多分歧的Brench，才能夠有效地維持效能)

所以從這點來看，高階卡的主要成本，完完全全地在其提供的記憶體的頻寬上。
因為晶片的成本，完全只受到晶片大小的影響(同時影響數量與良率)，
所以比方說廠商有時候寧可把中階打入低階，只降低記憶體頻寬就拿出來賣，
就是因為記憶體很可能佔了這張卡實際成本的大半。

*:提升製程用所需的成本，是代工廠開出代工價格時的影響條件：
不過原則上更精密的製程，單片晶圓報價成長速度會低於晶片生產可以增加的數量，
也就是晶片單價通常會降低，除非良率較上一代惡化；
而這目前被認為屬於該製程成熟與否的指標。

----
另外一點，我先前曾經問過Hotball兄一點，為什麼有些GPU對CPU的依賴性非常低，有些又很高呢？
Hotball兄的回答比較出人意表：完全看Driver怎麼作。
比方說3Dlabs的卡這方面的傾向就比較劇烈，不只GPU本身不依賴CPU，
甚至連換快CPU都可能不會對校能帶來多少幫助！

有些人因此認為"所以3Dlabs沒有用到模擬"，然後用CPU usage較高，
來認為N / A的產品有用到模擬，這是不正確的：
繪圖需要的速度實在太快了，CPU的效能是杯水車薪，只要是GPU沒有的功能，
透過CPU模擬的時候就絕對不可能在實際運作中得到"可以讓人接受"的表現。
(玩過NVemulate的人大概就會知道，用上一代的卡模擬下一代的卡，只能拿來檢查程式有沒有寫錯，完全不能夠看效果的)

NVIDIA在測試裡面出現的特性，大概就是介於過去3Dlabs，和ATI現在的狀況之間吧。