瀏覽單個文章
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
well, BrookGPU算是蠻有趣的東西.
不過不要搞錯了, 它裡面講的東西是有前提的.


BrookGPU是一個工具包, 可以搭配於GNU GPL現有的程式開發工具上,
它定義了一些額外的資料型態, 以Stream的方式運作,
在寫作程式的時候引用的話, 可以透過指定backend來辨別GPU種類,
然後把你的程式結構中的部分工作分配給GPU運算,
感覺上就是把GPU當成DSP之類的玩意兒使用.

所以, 如果把你的程式(比如說MPEG Encoder)根據BrookGPU重寫,
有機會透過GPU裡面比一般CPU更強的浮點運算效能, 加速自己程式的運作.
不過如果沒有改寫的話沒用.亦即對現有的程式沒有幫助.
不過倒是可以期望ogg vorbis, XviD之類的媒體CODEC透過這個新技術得到更好的效率.
等等看新版本嘍?

----
另外, 說到ATI的GPU相當於多快的P4呢?

基本上NV35的Shader Core在400MHz運作時有16GFLOPs, 加上Mini32的話可以上到32GFLOPs (FP32狀態下)
所以我不知道為什麼該網頁會把5900指出有20GFLOPs, 因為應該不只;
但如果是FX5800Ultra的話, 500MHz x 4 pipe x 10flops per pipe, 就真的應該有20GFLOPs.

該網頁指出20GFLOPs = 10GHz的P4, 所以我們暫且拿這個數字為基準.
FX5900Ultra則是475MHz x 4 x 20flops(每管線兩個Shader core) = 38GFLOPs.
那也就是說, FX5900Ultra相當於變成19GHz的P4嘍?

9800XT運作於412MHz, 管線為8x1, 總運算能量為16flops x 8 = 128flops, 帳面數字52.736GFLOPs.
所以以P4來作比喻的話, 大概會是26.3GHz的P4嘍.

就算是9600pro, 跑在400MHz的話也有400MHz x 4 x 16 = 25.6GFLOPs, 亦即相當於12.8GHz的P4?

--------
不過別想得太好了.

目前AGP8x的頻寬雖然看似有2.1GB/s, 但是各家Driver都針對上傳到GPU的方向最佳化,
回傳的部分,上回Tech-Report曾經自己寫程式測AGP4x的回傳速度, 測出來是133MB左右, 大概只有PCI的水準....
所以考慮運算結果回傳速度的話, 不一定會贏過現在直接由CPU算.

不過PCI-Express實用化的話, 情況就會改觀了吧.
PCI-Express 16x有上下流各4.8GB/s, 所以回傳效率也會非常好.
相信到時候也會跟著出現很多這方面的應用.

以後就不會讓人覺得"買上好的顯示卡只為了玩遊戲太浪費"嘍.
舊 2003-12-23, 02:10 PM #3
回應時引用此文章
Artx1離線中