PCDVD數位科技討論區 - 瀏覽單個文章 - ATi計劃推出新技術內建核心與VGA來SLi !?

引用:

作者0220

Dual Core應該是指在單晶片中封裝兩個GPU核心,
Dual Chip是指在一張顯卡上焊上兩個單核的晶片,
Fury MaXX應是屬後者!

唔，那NV40算不算NV43雙核心?

還是你要說一條管線，還是一個quad(2x2像素)的管線群是一個核心?
喔，那不得了。

所以話不能這樣講....

實質上，GPU因為處理的工作的關係，提高平行度可得來的效率比CPU高出許多。
比方說從Pentium開始，就開始有多指令發送的能力，並且透過superscaler來提高效率；
但是因為指令相依性，並沒有辦法保證不會遭到打斷，後來又開始提出分支預測與亂序執行(OOOE)等技術，
只是目前我們的架構仍然無法再提高平行度，目前的P4與K8都還是3-issue的架構，
而朝向On-Chip SMP的方向前進。

但是GPU不同，雖然開始引入了Shader等可程式化功能，並且開始加入分支能力，
GPU目前仍然保有相當大的平行度，在絕大部分的狀況下，GPU都能保持很高的效率，
所以目前GPU想要加速，幾乎都是增加管線數量和增加記憶體頻寬就可以解決，
未來五年內顯然也都是這樣，要對付的課題就是
"如何在實作新的標準這個前提下，維持速度與效率，並且與成本求平衡。"

顯然地，新的標準本身也會是一個大問題，比方說NV3x為了實作規格更高的架構，
與效能的平衡取捨不佳，而被取捨得比較好的R3x0架構趕過，
未來兩年內很可能NVIDIA還需要承擔這個惡果；
NV4x的取捨雖然要來得比NV3x好，表現出了應有的效能，
但是因為它的規格仍然比起R4x0高出許多，所以也反應在成本(電晶體數量)上，
(雖然R4x0的die-size好像和它的電晶體數量不成比例....?)
所以仍然是會給NVIDIA帶來一些負面壓力。

不過，總之目前五年內可以預測的是，只要記憶體夠快，製程可以支撐，
GPU就會不斷地再快下去。

----
那麼，我們回到這個標題吧。"SLI"為什麼能夠加快速度呢？
因為它倍增了現有的管線數量，而且倍增了記憶體頻寬。
所以可以解消掉存在於GPU的fillrate/memory bandwidth瓶頸，進而提高效率。

但是目前的繪圖系統有兩個明顯的瓶頸：CPU & fillrate/Memory，
所以SLI對這兩個瓶頸只能解消掉一個，也因為如此，
如果我們透過FSAA和高解析度增加繪圖系統的壓力，
讓fillrate/memory瓶頸再度地顯現出來，才能看到SLI的高效率，
這也是當初說SLI只有在很極端的狀況才會看得出改善的說辭的成因，
實際上在AnandTech的測試中可以發現，SLI在繪圖子系統壓力極大的狀況下，
幾乎可以保證得到倍數的效能成長，而這其實算不上什麼很稀少的狀況，
因為就是有人想在這種解析度(1600x1200)底下開高倍率的FSAA。

而以目前的繪圖系統進展來說，大略上可以得到的進展幅度，
就大約是每半年到九個月，效能會進展一倍左右，所以才說
"透過SLI可以實際上取得下一代核心的繪圖效能"。

於是，SLI的價值是很顯而易見的。
雖然功能不會因為SLI而增加，但是它可以在合理的狀況下，延伸出可取的效能，
而取得成本也有機會因為時間推展而降低，只要需求足夠的話。
而前面說過，GPU帶來的效能進展比CPU要來得顯著，
所以我個人認為會比多CPU要來得容易推展。

所以反過來說，其實當初在AGP的規格下，本來就比較難以設計類似SLI的解決方案，
R3x0其實是存在串聯能力的(它有tile-based的快速Z-reject能力)，
只是目前的解決方案(E&S的四晶片卡)顯然極為不經濟，PCIE則能夠突破這個瓶頸。
所以要ATI能推出類似SLI的架構，應該只是時間問題。

說實在的，上回是PCIe回傳頻寬測試解消了訊號品質疑慮，
現在又能夠輕易地推出串聯擴充架構，都是靠對手的晶片組，
其實ATI真的要好好感謝NVIDIA。

或者該說，總是有在前面推展新規格的人，也總是有在後面乘涼的人。
GDDR3，SM3.0，OpenEXR，SLI，然後是未來的DX10。

其實這也反應出了兩家公司的性格，不是嗎？