瀏覽單個文章
Nightmare
Power Member
 
Nightmare的大頭照
 

加入日期: Sep 2000
文章: 552
引用:
作者lobben
電腦王3x期有講過driver這個問題
R600為了省成本,用較簡單設計與大量的stream processor
得靠強力的driver才能發揮320p的威力

G80的設計相對複雜...可以說是HW solution,代價是良率可能會降低、成本較高,但driver開發較容易

而且該篇指出,R600很像當年的NV30 都需要強大的driver
當年NV為了榨出NV30的效能,花了一整年的時間搞driver
還是沒辦法幹掉R300....

過了半年再回頭看
NV和遊戲商關係較好
NV driver團隊似乎比較強且G80的driver比較好搞
在grid computing裡,R600有驚人的效能,320p不是做假的,但在遊戲裡看起來像假的
此外
ATi driver每個月都有改善R600的效能...只是幅度有限,以7.10較為明顯
不仿自己上網找半年前和半年後 driver不同但遊戲相同的效能測試
這足以說明driver是問題所在
看來R600已經步入NV30的後塵了



補充一下....(算是吧)
正確來說 ATi 並不是 320sp,而是 64 個 4+1D 的 ALU,相對於 G80、G92 的 sp 都是 1D ALU,差不多等效 320sp,「但是」,這 64 個 4+1D ALU 並非都是可以一直維持在 peak 的,必須要依靠 compiler 或 programer 把相依的指令排序在一起才能完全發揮,但是世界上沒有這麼好的事情,遊戲中並不是剛好都把指令整整齊齊排好的,造成 R6x0 一堆 sp 閒置空轉;nv 的 G8x、G9x 的 1D ALU 相較來說不需要 compiler、programer 去對指令排序(但是程式的效率還是要 programer 去處理啦),遊戲中的指令到了 GPU 都會被拆成單一的指令去處理,不用去理會是否有相依的指令等待處理,於是 G8x、G9x 的 1D ALU 很容易就可以達到最大吞吐量,跟現行的 cpu 比較起來,nv 的 G8x、G9x 就像是超純量架構(大部份的 cpu),而 R6x0 就像是 VLIW 架構(如 Itanium),需要 compiler 最佳化,但是 G8x、G9x 的設計會相對複雜一些,因為像是控制單元、cache 等都需要為每一個獨立的 sp 配置,所以 nv 用了 700M 的電晶體才塞了 128 個 sp,但是優點就是對軟體適應性高,也造就了 8800 系列一整年不敗的神話....(好像有點誇張 XD)
舊 2007-11-12, 04:42 PM #64
回應時引用此文章
Nightmare離線中