PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

  回應
 
主題工具
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
作者samsung
RV530效能差(雖然有80nm的RV535),RV560是DaveB講的,8-1-3-2可行度很高,搭配GDDR3 600MHz X2而且以256bit效能至少不會如此丟臉


可行度高嗎?
8-1-3-2的RV560的die size看起來接近250mm2,
這種東西拿來跑中階會不會太傷本了?

如果只顧慮效能的話,乾脆R520砍管拿來出中階或許更快?
反正ATI說他們良率很好,只是低頻而已,那想必有一堆可用吧?
     
      

此文章於 2005-11-09 08:35 PM 被 Artx1 編輯.
舊 2005-11-09, 08:28 PM #11
回應時引用此文章
Artx1離線中  
stratos2005
Power Member
 

加入日期: Mar 2005
文章: 648
抱歉,誤貼,已刪除,謝謝
 

此文章於 2005-11-09 09:14 PM 被 stratos2005 編輯.
舊 2005-11-09, 09:13 PM #12
回應時引用此文章
stratos2005離線中  
superscalar
Senior Member
 

加入日期: Jul 2002
您的住址: 光碟托盤
文章: 1,495
引用:
作者Artx1
可行度高嗎?
8-1-3-2的RV560的die size看起來接近250mm2,
這種東西拿來跑中階會不會太傷本了?

如果只顧慮效能的話,乾脆R520砍管拿來出中階或許更快?
反正ATI說他們良率很好,只是低頻而已,那想必有一堆可用吧?

Eji 問題是

引用:
良率很好,只是低頻


你相信嗎????
舊 2005-11-09, 09:23 PM #13
回應時引用此文章
superscalar離線中  
samsung
Master Member
 

加入日期: Dec 2000
您的住址: Cambridge Law School
文章: 1,780
引用:
作者superscalar
Eji 問題是



你相信嗎????




現在ATI根本沒有SM3.0的產品庫存,NV在開始積蓄G71/G72/G73的庫存而且目標明確,超高階工作站/遊戲市場(如果能明年率先支援SLI 不用存雙份資料與 SLI 2),ATI現在面對的問題是R580/RV530/RV560/R590這種設計(3:1)真的有用?看X1600就知道了,一大堆人在吹R580性能,看看RV530與RV515差距,一個只有同時脈150% R520的R580,最後的結果是ATI 2006整年報銷,SM3.0的設計實在是Orz
__________________
£500 per day, low-wage labour

此文章於 2005-11-09 09:47 PM 被 samsung 編輯.
舊 2005-11-09, 09:39 PM #14
回應時引用此文章
samsung離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
作者superscalar
Eji 問題是

你相信嗎????


他們的RD大頭回信的時候親自寫的,不然要怎樣?
他唬人的話,最後也是市場決定一切啊。
舊 2005-11-10, 02:25 AM #15
回應時引用此文章
Artx1離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
作者samsung
現在ATI根本沒有SM3.0的產品庫存,
NV在開始積蓄G71/G72/G73的庫存而且目標明確,超高階工作站/遊戲市場
(如果能明年率先支援SLI 不用存雙份資料與 SLI 2),

ATI現在面對的問題是R580/RV530/RV560/R590這種設計(3:1)真的有用?
看X1600就知道了,
一大堆人在吹R580性能,看看RV530與RV515差距,
一個只有同時脈150% R520的R580,
最後的結果是ATI 2006整年報銷,

SM3.0的設計實在是Orz


我是回過頭來一個一個回應啦....
不過必須要強調的是,我並不喜歡ATI的設計。

我是覺得從專利來看,NVIDIA一開始的SLI結構就已經支援NUMA了,
但是因為沒有可以支援的條件,所以不開放這個功能,免得反而拖慢效率。
可以支援的條件很簡單,就是兩張卡之間的高速通道。
以現在的SLI-16x來說,應該可以做到兩張卡各有8x到系統、8x用來彼此互傳資訊,
也就是雙向2.1GB/s;但是這個頻寬其實還是先過一次PCIe Tunnel,所以latency不小。
所以還是要有SLI bridge,用來傳的是更有急迫性的同步用指令。
而且其實我是覺得這個頻寬還是算小的....

其次,RV530的05分數很高、遊戲卻跑不高這點。
某種意味上也可以說是市場因素,比方說回頭看NV3x當時在市場壽命期間,遊戲上造成的差異並不明顯;但是過了壽命期之後,效率就被甩得很遠了。
所以如果"假設"ATI賭的是對的話,有一年的時間讓這個架構可以慢慢發揮,現在說它不好我是覺得稍嫌過早。

其次,要說3:1的話,其實真正更誇張的是C1。
http://pc.watch.impress.co.jp/docs/...17/kaigai_1.jpg
這個是R520的結構,每個quad有4個ps、每個ps每次分配到4個pixel,
所以就是每4個ps分配到16個pixel,然後16個pixel是1個thread。

沒錯的話C1的結構從這個觀點是是4:1,也就是每1個掌管4x4 pixel的thread,
分到的1個Bank剛好是完整的16個PS組成的。

RV530/R580的結構則是同樣128個thread,讓3個quad core去分。
這個可以參照這兩張圖:
http://www.gzeasy.com/Articlephoto/...rchitecture.png
http://www.gzeasy.com/Articlephoto/...rchitecture.png
主要的問題大概就是dispatcher可以接更多的shader ALU來分擔工作,
但是TMU則是固定的,所以RV530只有1組dispatcher,所以就只有1個quad的TMU了;
反過來說就是RV560如果有24個ps ALU,應該就是最多2個quad的TMU,也就是8個。

----
至於這個結構考量的可信度問題,
我是覺得B3D的DaveB已經在R520的發表時展現出他的訊息來源可靠度了。
所以現在說RV560/R580/R590會長什麼樣子,說起來DaveB的可信度應該是最高的沒錯。

我只有一個疑問:
這樣的東西你們(ATI)有辦法順利生產嗎?

此文章於 2005-11-10 02:54 AM 被 Artx1 編輯.
舊 2005-11-10, 02:53 AM #16
回應時引用此文章
Artx1離線中  
steven_jou0407
*停權中*
 

加入日期: Dec 2004
您的住址: Taipei
文章: 584
內行人的對話!








只在 kXG...................Orz
酸 !
舊 2005-11-11, 12:47 AM #17
回應時引用此文章
steven_jou0407離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
好,我自己回應自己:
收到了R580的die size,大小相當讓人意外....
數字不能說,不過可以講一下感想。

分析起來,是因為我忘記dispatch processor的規模要算進去了,所以才會把die size估錯。
因為R580沒增加dispatch processor,只有ALU增加,其實也不會多很多電晶體;
反過來說,就是回到 n x 3 的結構,那麼效率就不會改善多少。

如此一來將會一如Samsung兄的說法:
R520:16x1、RV515:4x1
RV530:4x3、RV560:8x3、R580:16x3

結果ATI剛好撞上NVIDIA在NV3x遇上的問題。
NV30的FP32--FX12--FX12變成NV35的FP32--mini32--mini32,
理論上這個轉變讓浮點效能增加一倍以上,但是因為平行度的問題,效能跑不出來。

RV515到RV530有兩個性能改善的原因:
ring bus MC帶來的效率改善、以及ALU數量增加。
而我們看到了05的分數從RV515的3K進展到RV530的5K左右,提升接近兩倍。

所以其實雖然RV530的ALU相對於RV515多了3倍,但看來對效能帶來的幫助並不如想像中的多....
或者說,ATI在dispatch processor結構上的努力,其實很可能與當年NVIDIA在NV3x上所做的事情不會差太多;
這也是NVIDIA的David Kirk先前在Bit-tech接受訪談時,對ATI的架構提出的質疑。

於是,等到R520 -> R580的時候,因為R520已經有ring bus MC了,
那ALU加了3倍的部份能增加多少呢? 這其實是有很大的疑問的。
(samsung兄上面說了,大約是150%)

最後,那其實仍然是個很大的東西,他們能順利做出來嗎?

此文章於 2005-11-13 06:24 AM 被 Artx1 編輯.
舊 2005-11-13, 05:33 AM #18
回應時引用此文章
Artx1離線中  
熱鬥小狐
*停權中*
 
熱鬥小狐的大頭照
 

加入日期: Apr 2001
您的住址: 香港
文章: 1,441
引用:
作者Artx1
好,我自己回應自己:
收到了R580的die size,大小相當讓人意外....
數字不能說,不過可以講一下感想。

分析起來,是因為我忘記dispatch processor的規模要算進去了,所以才會把die size估錯。
因為R580沒增加dispatch processor,只有ALU增加,其實也不會多很多電晶體;
反過來說,就是回到 n x 3 的結構,那麼效率就不會改善多少。

如此一來將會一如Samsung兄的說法:
R520:16x1、RV515:4x1
RV530:4x3、RV560:8x3、R580:16x3

結果ATI剛好撞上NVIDIA在NV3x遇上的問題。
NV30的FP32--FX12--FX12變成NV35的FP32--mini32--mini32,
理論上這個轉變讓浮點效能增加一倍以上,但是因為平行度的問題,效能跑不出來。

RV515到RV530有兩個性能改善的原因:
ring bus MC帶來的效率改善、以及ALU數量增加。
而我們看到了05的分數從RV515的3K進展到RV530的5K左右,提升接近兩倍。

所以其...

那即是說,就算用80nm都未必做得出來?
即使做得出來良率也是

這樣時程足足慢人家一年...,看來ATI變3dfx的日子不遠
舊 2005-11-13, 06:43 AM #19
回應時引用此文章
熱鬥小狐離線中  
推倒
*停權中*
 
推倒的大頭照
 

加入日期: Apr 2004
您的住址: 中華民國台灣台北
文章: 455
您們真內行!

慢慢吸收中
舊 2005-11-13, 09:51 AM #20
回應時引用此文章
推倒離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是02:00 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。