引用:
|
作者0220
Dual Core應該是指在單晶片中封裝兩個GPU核心,
Dual Chip是指在一張顯卡上焊上兩個單核的晶片,
Fury MaXX應是屬後者! 
|
唔,那NV40算不算NV43雙核心?

還是你要說一條管線,還是一個quad(2x2像素)的管線群是一個核心?
喔,那不得了。
所以話不能這樣講....
實質上,GPU因為處理的工作的關係,提高平行度可得來的效率比CPU高出許多。
比方說從Pentium開始,就開始有多指令發送的能力,並且透過superscaler來提高效率;
但是因為指令相依性,並沒有辦法保證不會遭到打斷,後來又開始提出分支預測與亂序執行(OOOE)等技術,
只是目前我們的架構仍然無法再提高平行度,目前的P4與K8都還是3-issue的架構,
而朝向On-Chip SMP的方向前進。
但是GPU不同,雖然開始引入了Shader等可程式化功能,並且開始加入分支能力,
GPU目前仍然保有相當大的平行度,在絕大部分的狀況下,GPU都能保持很高的效率,
所以目前GPU想要加速,幾乎都是增加管線數量和增加記憶體頻寬就可以解決,
未來五年內顯然也都是這樣,要對付的課題就是
"如何在實作新的標準這個前提下,維持速度與效率,並且與成本求平衡。"
顯然地,新的標準本身也會是一個大問題,比方說NV3x為了實作規格更高的架構,
與效能的平衡取捨不佳,而被取捨得比較好的R3x0架構趕過,
未來兩年內很可能NVIDIA還需要承擔這個惡果;
NV4x的取捨雖然要來得比NV3x好,表現出了應有的效能,
但是因為它的規格仍然比起R4x0高出許多,所以也反應在成本(電晶體數量)上,
(雖然R4x0的die-size好像和它的電晶體數量不成比例....?)
所以仍然是會給NVIDIA帶來一些負面壓力。
不過,總之目前五年內可以預測的是,只要記憶體夠快,製程可以支撐,
GPU就會不斷地再快下去。
----
那麼,我們回到這個標題吧。"SLI"為什麼能夠加快速度呢?
因為它倍增了現有的管線數量,而且倍增了記憶體頻寬。
所以可以解消掉存在於GPU的fillrate/memory bandwidth瓶頸,進而提高效率。
但是目前的繪圖系統有兩個明顯的瓶頸:CPU & fillrate/Memory,
所以SLI對這兩個瓶頸只能解消掉一個,也因為如此,
如果我們透過FSAA和高解析度增加繪圖系統的壓力,
讓fillrate/memory瓶頸再度地顯現出來,才能看到SLI的高效率,
這也是當初說SLI只有在很極端的狀況才會看得出改善的說辭的成因,
實際上在AnandTech的測試中可以發現,SLI在繪圖子系統壓力極大的狀況下,
幾乎可以保證得到倍數的效能成長,而這其實算不上什麼很稀少的狀況,
因為就是有人想在這種解析度(1600x1200)底下開高倍率的FSAA。
而以目前的繪圖系統進展來說,大略上可以得到的進展幅度,
就大約是每半年到九個月,效能會進展一倍左右,所以才說
"透過SLI可以實際上取得下一代核心的繪圖效能"。
於是,SLI的價值是很顯而易見的。
雖然功能不會因為SLI而增加,但是它可以在合理的狀況下,延伸出可取的效能,
而取得成本也有機會因為時間推展而降低,只要需求足夠的話。
而前面說過,GPU帶來的效能進展比CPU要來得顯著,
所以我個人認為會比多CPU要來得容易推展。
所以反過來說,其實當初在AGP的規格下,本來就比較難以設計類似SLI的解決方案,
R3x0其實是存在串聯能力的(它有tile-based的快速Z-reject能力),
只是目前的解決方案(E&S的四晶片卡)顯然極為不經濟,PCIE則能夠突破這個瓶頸。
所以要ATI能推出類似SLI的架構,應該只是時間問題。
說實在的,上回是PCIe回傳頻寬測試解消了訊號品質疑慮,
現在又能夠輕易地推出串聯擴充架構,都是靠對手的晶片組,
其實ATI真的要好好感謝NVIDIA。
或者該說,總是有在前面推展新規格的人,也總是有在後面乘涼的人。
GDDR3,SM3.0,OpenEXR,SLI,然後是未來的DX10。
其實這也反應出了兩家公司的性格,不是嗎?
