引用:
|
作者Raziel
老兄~ 不依你的比較方式就是嘴砲.... 這會不會太狹隘 ?
上文只是單純對標題 著墨在 每秒有多少次運算的數據(flops).
n社的CUDA GPU銷售已經累積超過7000 petaflops的運算力也是有數據可查的.
0.5%x7000 peteflop = 35petaflops 沒有> Roadrunner 的 1peta嗎?
先不看能做什麼用, 個人認為能達到很高的運算次數,本身就可以是一種工藝技術.
G80單一core就有345G+flops的運算力, Roadrunner 回除12k個core, 並不覺得GPU有比cell落後.
至於實際運算輸出的結果, 當然會跟 測試情境有關. 我不否認Cell有強項,但也未必是無敵.
由於適合A去跑的任務, B下去跑也可能變半殘, 特性不同的晶片沒有什麼絕對的好與壞,
端看如何適才適性的去應用, 以任一情境或框架下去比都未必是公平.
那麼單純看每秒運算次數就不能是一種方式?
|
講成"我的比較方式"就不對了,架構性質和專用性本來就都是看工作性質來比較的,NVIDIA以前說過G71本身有總和1.8TFLOPS的運算能力,你會把這個數字拿來張飛打岳飛嗎?
我覺得你的比較方式有問題,但是你把我講的話扯成"只要不照我講的就是不對",那剩下的都不必講了,因為我講多少都聽不進去。
----
剩下的就說給想聽的人聽:
我們都知道G80在single-issue底下有345GFLOPS、dual-issue底下有518GFLOPS。
CELL的8個SPE大約是204GFLOPS單精度、eDP CELL有倍精度102.4GFLOPS的能力,帳面上PPE的VMX比較快,但是實際上因為register資源不足所以快不起來。
但是實際上G8x的TMU和ROP極為強大,強大到在die area上也是TMU和ROP的規模大過shader很多。
G80有681M電晶體(已經扣掉NVIO)、但是只有不到1/3是shader;CELL的235M電晶體,eDP CELL只增加到約250M不到。
所以以架構效率來說的話,GPU目前和multi-core CPU是有落差的。
假定今天製程相同的話,那麼對用途比較廣泛的需求下,應該還是會做multi-core CPU。
畢竟GPU真的是對繪圖特化的東西,只是為了公司本身的商業利益,GPU廠商希望不要永遠只依存在遊戲市場上(工業用的專業繪圖毛利高但是產值並不高),所以希望能利用GPU的性能,而GPU在通用運算上真正強大的部分是記憶體頻寬,而不是運算能量本身。
但是當GPU本身有專職其實還有很大進步空間的時候,你就不太可能在兼職上投資多少資源。
積少成多當然是毫無疑問,Folding@Home目前總和大概接近2Peta FLOPS,有1.5Peta是PS3貢獻的,大約是五萬台。(實際執行過的大約53萬,然後全球的PS3大約一千三百萬)
如果這世界上真的有那麼多有CUDA GPU(全球每年PC市場大約25%、其中的0.5~1%)的client願意來跑看看FAH for CUDA的話,那就有很大的機會翻盤。