引用:
作者samsung
現在ATI根本沒有SM3.0的產品庫存,
NV在開始積蓄G71/G72/G73的庫存而且目標明確,超高階工作站/遊戲市場
(如果能明年率先支援SLI 不用存雙份資料與 SLI 2),
ATI現在面對的問題是R580/RV530/RV560/R590這種設計(3:1)真的有用?
看X1600就知道了,
一大堆人在吹R580性能,看看RV530與RV515差距,
一個只有同時脈150% R520的R580,
最後的結果是ATI 2006整年報銷,
SM3.0的設計實在是Orz
|
我是回過頭來一個一個回應啦....
不過必須要強調的是,我並不喜歡ATI的設計。
我是覺得從專利來看,NVIDIA一開始的SLI結構就已經支援NUMA了,
但是因為沒有可以支援的條件,所以不開放這個功能,免得反而拖慢效率。
可以支援的條件很簡單,就是兩張卡之間的高速通道。
以現在的SLI-16x來說,應該可以做到兩張卡各有8x到系統、8x用來彼此互傳資訊,
也就是雙向2.1GB/s;但是這個頻寬其實還是先過一次PCIe Tunnel,所以latency不小。
所以還是要有SLI bridge,用來傳的是更有急迫性的同步用指令。
而且其實我是覺得這個頻寬還是算小的....
其次,RV530的05分數很高、遊戲卻跑不高這點。
某種意味上也可以說是市場因素,比方說回頭看NV3x當時在市場壽命期間,遊戲上造成的差異並不明顯;但是過了壽命期之後,效率就被甩得很遠了。
所以如果"假設"ATI賭的是對的話,有一年的時間讓這個架構可以慢慢發揮,現在說它不好我是覺得稍嫌過早。
其次,要說3:1的話,其實真正更誇張的是C1。
http://pc.watch.impress.co.jp/docs/...17/kaigai_1.jpg
這個是R520的結構,每個quad有4個ps、每個ps每次分配到4個pixel,
所以就是每4個ps分配到16個pixel,然後16個pixel是1個thread。
沒錯的話C1的結構從這個觀點是是4:1,也就是每1個掌管4x4 pixel的thread,
分到的1個Bank剛好是完整的16個PS組成的。
RV530/R580的結構則是同樣128個thread,讓3個quad core去分。
這個可以參照這兩張圖:
http://www.gzeasy.com/Articlephoto/...rchitecture.png
http://www.gzeasy.com/Articlephoto/...rchitecture.png
主要的問題大概就是dispatcher可以接更多的shader ALU來分擔工作,
但是TMU則是固定的,所以RV530只有1組dispatcher,所以就只有1個quad的TMU了;
反過來說就是RV560如果有24個ps ALU,應該就是最多2個quad的TMU,也就是8個。
----
至於這個結構考量的可信度問題,
我是覺得B3D的DaveB已經在R520的發表時展現出他的訊息來源可靠度了。
所以現在說RV560/R580/R590會長什麼樣子,說起來DaveB的可信度應該是最高的沒錯。
我只有一個疑問:
這樣的東西你們(ATI)有辦法順利生產嗎?