![]() |
||
Master Member
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
引用:
可行度高嗎? 8-1-3-2的RV560的die size看起來接近250mm2, 這種東西拿來跑中階會不會太傷本了? 如果只顧慮效能的話,乾脆R520砍管拿來出中階或許更快? 反正ATI說他們良率很好,只是低頻而已,那想必有一堆可用吧? 此文章於 2005-11-09 08:35 PM 被 Artx1 編輯. |
||||||||
![]() |
![]() |
Power Member
![]() ![]() 加入日期: Mar 2005
文章: 648
|
抱歉,誤貼,已刪除,謝謝
此文章於 2005-11-09 09:14 PM 被 stratos2005 編輯. |
||
![]() |
![]() |
Senior Member
![]() ![]() ![]() 加入日期: Jul 2002 您的住址: 光碟托盤
文章: 1,495
|
引用:
Eji 問題是 引用:
你相信嗎???? |
||
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Dec 2000 您的住址: Cambridge Law School
文章: 1,780
|
引用:
現在ATI根本沒有SM3.0的產品庫存,NV在開始積蓄G71/G72/G73的庫存而且目標明確,超高階工作站/遊戲市場(如果能明年率先支援SLI 不用存雙份資料與 SLI 2),ATI現在面對的問題是R580/RV530/RV560/R590這種設計(3:1)真的有用?看X1600就知道了,一大堆人在吹R580性能,看看RV530與RV515差距,一個只有同時脈150% R520的R580,最後的結果是ATI 2006整年報銷,SM3.0的設計實在是Orz
__________________
£500 per day, low-wage labour ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() 此文章於 2005-11-09 09:47 PM 被 samsung 編輯. |
|
![]() |
![]() |
Master Member
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
引用:
他們的RD大頭回信的時候親自寫的,不然要怎樣? 他唬人的話,最後也是市場決定一切啊。 |
|
![]() |
![]() |
Master Member
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
引用:
我是回過頭來一個一個回應啦.... 不過必須要強調的是,我並不喜歡ATI的設計。 我是覺得從專利來看,NVIDIA一開始的SLI結構就已經支援NUMA了, 但是因為沒有可以支援的條件,所以不開放這個功能,免得反而拖慢效率。 可以支援的條件很簡單,就是兩張卡之間的高速通道。 以現在的SLI-16x來說,應該可以做到兩張卡各有8x到系統、8x用來彼此互傳資訊, 也就是雙向2.1GB/s;但是這個頻寬其實還是先過一次PCIe Tunnel,所以latency不小。 所以還是要有SLI bridge,用來傳的是更有急迫性的同步用指令。 而且其實我是覺得這個頻寬還是算小的.... 其次,RV530的05分數很高、遊戲卻跑不高這點。 某種意味上也可以說是市場因素,比方說回頭看NV3x當時在市場壽命期間,遊戲上造成的差異並不明顯;但是過了壽命期之後,效率就被甩得很遠了。 所以如果"假設"ATI賭的是對的話,有一年的時間讓這個架構可以慢慢發揮,現在說它不好我是覺得稍嫌過早。 其次,要說3:1的話,其實真正更誇張的是C1。 http://pc.watch.impress.co.jp/docs/...17/kaigai_1.jpg 這個是R520的結構,每個quad有4個ps、每個ps每次分配到4個pixel, 所以就是每4個ps分配到16個pixel,然後16個pixel是1個thread。 沒錯的話C1的結構從這個觀點是是4:1,也就是每1個掌管4x4 pixel的thread, 分到的1個Bank剛好是完整的16個PS組成的。 RV530/R580的結構則是同樣128個thread,讓3個quad core去分。 這個可以參照這兩張圖: http://www.gzeasy.com/Articlephoto/...rchitecture.png http://www.gzeasy.com/Articlephoto/...rchitecture.png 主要的問題大概就是dispatcher可以接更多的shader ALU來分擔工作, 但是TMU則是固定的,所以RV530只有1組dispatcher,所以就只有1個quad的TMU了; 反過來說就是RV560如果有24個ps ALU,應該就是最多2個quad的TMU,也就是8個。 ---- 至於這個結構考量的可信度問題, 我是覺得B3D的DaveB已經在R520的發表時展現出他的訊息來源可靠度了。 所以現在說RV560/R580/R590會長什麼樣子,說起來DaveB的可信度應該是最高的沒錯。 我只有一個疑問: 這樣的東西你們(ATI)有辦法順利生產嗎? 此文章於 2005-11-10 02:54 AM 被 Artx1 編輯. |
|
![]() |
![]() |
*停權中*
加入日期: Dec 2004 您的住址: Taipei
文章: 584
|
內行人的對話!
只在 kXG...................Orz 酸 ! |
![]() |
![]() |
Master Member
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
好,我自己回應自己:
收到了R580的die size,大小相當讓人意外.... 數字不能說,不過可以講一下感想。 分析起來,是因為我忘記dispatch processor的規模要算進去了,所以才會把die size估錯。 因為R580沒增加dispatch processor,只有ALU增加,其實也不會多很多電晶體; 反過來說,就是回到 n x 3 的結構,那麼效率就不會改善多少。 如此一來將會一如Samsung兄的說法: R520:16x1、RV515:4x1 RV530:4x3、RV560:8x3、R580:16x3 結果ATI剛好撞上NVIDIA在NV3x遇上的問題。 NV30的FP32--FX12--FX12變成NV35的FP32--mini32--mini32, 理論上這個轉變讓浮點效能增加一倍以上,但是因為平行度的問題,效能跑不出來。 RV515到RV530有兩個性能改善的原因: ring bus MC帶來的效率改善、以及ALU數量增加。 而我們看到了05的分數從RV515的3K進展到RV530的5K左右,提升接近兩倍。 所以其實雖然RV530的ALU相對於RV515多了3倍,但看來對效能帶來的幫助並不如想像中的多.... 或者說,ATI在dispatch processor結構上的努力,其實很可能與當年NVIDIA在NV3x上所做的事情不會差太多; 這也是NVIDIA的David Kirk先前在Bit-tech接受訪談時,對ATI的架構提出的質疑。 於是,等到R520 -> R580的時候,因為R520已經有ring bus MC了, 那ALU加了3倍的部份能增加多少呢? 這其實是有很大的疑問的。 (samsung兄上面說了,大約是150%) 最後,那其實仍然是個很大的東西,他們能順利做出來嗎? 此文章於 2005-11-13 06:24 AM 被 Artx1 編輯. |
![]() |
![]() |
*停權中*
加入日期: Apr 2001 您的住址: 香港
文章: 1,441
|
引用:
那即是說,就算用80nm都未必做得出來? 即使做得出來良率也是 ![]() 這樣時程足足慢人家一年...,看來ATI變3dfx的日子不遠 ![]() |
|
![]() |
![]() |
*停權中*
加入日期: Apr 2004 您的住址: 中華民國台灣台北
文章: 455
|
您們真內行!
慢慢吸收中 |
![]() |
![]() |