Anandtech:GeForce 7600 and 7200 Launch Schedule Leaked

Artx1

Registered User

加入日期: Jun 2002

您的住址: 耗電量頗高的地方.

文章: 1,959

引用:

作者samsung

RV530效能差(雖然有80nm的RV535),RV560是DaveB講的,8-1-3-2可行度很高,搭配GDDR3 600MHz X2而且以256bit效能至少不會如此丟臉

可行度高嗎？
8-1-3-2的RV560的die size看起來接近250mm2，
這種東西拿來跑中階會不會太傷本了？

如果只顧慮效能的話，乾脆R520砍管拿來出中階或許更快？
反正ATI說他們良率很好，只是低頻而已，那想必有一堆可用吧？

此文章於 2005-11-09 08:35 PM 被 Artx1 編輯.

2005-11-09, 08:28 PM #11

superscalar

Senior Member

加入日期: Jul 2002

您的住址: 光碟托盤

文章: 1,495

引用:

作者Artx1

Eji 問題是

引用:

良率很好，只是低頻

你相信嗎????

2005-11-09, 09:23 PM #13

samsung

Master Member

加入日期: Dec 2000

您的住址: Cambridge Law School

文章: 1,780

引用:

作者superscalar

Eji 問題是

你相信嗎????

現在ATI根本沒有SM3.0的產品庫存,NV在開始積蓄G71/G72/G73的庫存而且目標明確,超高階工作站/遊戲市場(如果能明年率先支援SLI 不用存雙份資料與 SLI 2),ATI現在面對的問題是R580/RV530/RV560/R590這種設計(3:1)真的有用?看X1600就知道了,一大堆人在吹R580性能,看看RV530與RV515差距,一個只有同時脈150% R520的R580,最後的結果是ATI 2006整年報銷,SM3.0的設計實在是Orz

__________________
￡500 per day, low-wage labour

此文章於 2005-11-09 09:47 PM 被 samsung 編輯.

2005-11-09, 09:39 PM #14

Artx1

Registered User

加入日期: Jun 2002

您的住址: 耗電量頗高的地方.

文章: 1,959

引用:

作者samsung

現在ATI根本沒有SM3.0的產品庫存,
NV在開始積蓄G71/G72/G73的庫存而且目標明確,超高階工作站/遊戲市場
(如果能明年率先支援SLI 不用存雙份資料與 SLI 2),

ATI現在面對的問題是R580/RV530/RV560/R590這種設計(3:1)真的有用?
看X1600就知道了,
一大堆人在吹R580性能,看看RV530與RV515差距,
一個只有同時脈150% R520的R580,
最後的結果是ATI 2006整年報銷,

SM3.0的設計實在是Orz

我是回過頭來一個一個回應啦....
不過必須要強調的是，我並不喜歡ATI的設計。

我是覺得從專利來看，NVIDIA一開始的SLI結構就已經支援NUMA了，
但是因為沒有可以支援的條件，所以不開放這個功能，免得反而拖慢效率。
可以支援的條件很簡單，就是兩張卡之間的高速通道。
以現在的SLI-16x來說，應該可以做到兩張卡各有8x到系統、8x用來彼此互傳資訊，
也就是雙向2.1GB/s；但是這個頻寬其實還是先過一次PCIe Tunnel，所以latency不小。
所以還是要有SLI bridge，用來傳的是更有急迫性的同步用指令。
而且其實我是覺得這個頻寬還是算小的....

其次，RV530的05分數很高、遊戲卻跑不高這點。
某種意味上也可以說是市場因素，比方說回頭看NV3x當時在市場壽命期間，遊戲上造成的差異並不明顯；但是過了壽命期之後，效率就被甩得很遠了。
所以如果"假設"ATI賭的是對的話，有一年的時間讓這個架構可以慢慢發揮，現在說它不好我是覺得稍嫌過早。

其次，要說3:1的話，其實真正更誇張的是C1。
http://pc.watch.impress.co.jp/docs/...17/kaigai_1.jpg
這個是R520的結構，每個quad有4個ps、每個ps每次分配到4個pixel，
所以就是每4個ps分配到16個pixel，然後16個pixel是1個thread。

沒錯的話C1的結構從這個觀點是是4:1，也就是每1個掌管4x4 pixel的thread，
分到的1個Bank剛好是完整的16個PS組成的。

RV530/R580的結構則是同樣128個thread，讓3個quad core去分。
這個可以參照這兩張圖：
http://www.gzeasy.com/Articlephoto/...rchitecture.png
http://www.gzeasy.com/Articlephoto/...rchitecture.png
主要的問題大概就是dispatcher可以接更多的shader ALU來分擔工作，
但是TMU則是固定的，所以RV530只有1組dispatcher，所以就只有1個quad的TMU了；
反過來說就是RV560如果有24個ps ALU，應該就是最多2個quad的TMU，也就是8個。

----
至於這個結構考量的可信度問題，
我是覺得B3D的DaveB已經在R520的發表時展現出他的訊息來源可靠度了。
所以現在說RV560/R580/R590會長什麼樣子，說起來DaveB的可信度應該是最高的沒錯。

我只有一個疑問：
這樣的東西你們(ATI)有辦法順利生產嗎？

此文章於 2005-11-10 02:54 AM 被 Artx1 編輯.

2005-11-10, 02:53 AM #16

Artx1

Registered User

加入日期: Jun 2002

您的住址: 耗電量頗高的地方.

文章: 1,959

好，我自己回應自己：
收到了R580的die size，大小相當讓人意外....
數字不能說，不過可以講一下感想。

分析起來，是因為我忘記dispatch processor的規模要算進去了，所以才會把die size估錯。
因為R580沒增加dispatch processor，只有ALU增加，其實也不會多很多電晶體；
反過來說，就是回到 n x 3 的結構，那麼效率就不會改善多少。

如此一來將會一如Samsung兄的說法：
R520：16x1、RV515：4x1
RV530：4x3、RV560：8x3、R580：16x3

結果ATI剛好撞上NVIDIA在NV3x遇上的問題。
NV30的FP32--FX12--FX12變成NV35的FP32--mini32--mini32，
理論上這個轉變讓浮點效能增加一倍以上，但是因為平行度的問題，效能跑不出來。

RV515到RV530有兩個性能改善的原因：
ring bus MC帶來的效率改善、以及ALU數量增加。
而我們看到了05的分數從RV515的3K進展到RV530的5K左右，提升接近兩倍。

所以其實雖然RV530的ALU相對於RV515多了3倍，但看來對效能帶來的幫助並不如想像中的多....
或者說，ATI在dispatch processor結構上的努力，其實很可能與當年NVIDIA在NV3x上所做的事情不會差太多；
這也是NVIDIA的David Kirk先前在Bit-tech接受訪談時，對ATI的架構提出的質疑。

於是，等到R520 -> R580的時候，因為R520已經有ring bus MC了，
那ALU加了3倍的部份能增加多少呢？這其實是有很大的疑問的。
(samsung兄上面說了，大約是150%)

最後，那其實仍然是個很大的東西，他們能順利做出來嗎？

此文章於 2005-11-13 06:24 AM 被 Artx1 編輯.

2005-11-13, 05:33 AM #18

熱鬥小狐

*停權中*

加入日期: Apr 2001

您的住址: 香港

文章: 1,441

引用:

作者Artx1

那即是說，就算用80nm都未必做得出來？
即使做得出來良率也是

這樣時程足足慢人家一年...，看來ATI變3dfx的日子不遠

2005-11-13, 06:43 AM #19

steven_jou0407 停權中加入日期: Dec 2004 您的住址: Taipei 文章: 584	內行人的對話! 只在 kXG...................Orz 酸 !
2005-11-11, 12:47 AM #17

推倒停權中加入日期: Apr 2004 您的住址: 中華民國台灣台北文章: 455	您們真內行！慢慢吸收中
2005-11-13, 09:51 AM #20