瀏覽單個文章
Weichung
Power Member
 

加入日期: May 2000
您的住址: Taiwan
文章: 697
引用:
作者dabochi
恩...其實與其說在下對Cell有很深的期待
不如說在下很好奇到底有多少廠家真能寫出可以充分使用這麼多個核心的遊戲出來?
SCEI有特別為了Cell辦比賽(Cell Speed Challenge)
2007年看第一屆比賽時 在下對於Cell在API與Compiler上的不成熟真的是很詫異
諸如透過DMA隱藏主記憶體的Latency,Double Buffer這些東西全部都得要參賽者自己寫API出來實做 更不用談當時參加44隊中 只有6隊能在一個月的時間內做出10個規定課題的正解
而且Cell給SPE的Cache只有很驚人的256K 說真的 在下是真的很好奇當在高速平行運算時要如何做最佳化-光資料就噎死了
如果真的要說期待的話 Cell上的東西其實可以說是非常先進 很值得期待哪天也能應用在廣大的消費性電子用多核心系統 真要做出來的話 手機 電視這些東西的樣貌應該會變很多的

就如我之前所言, 就算SPE被充分運用, 拿來當成3D處理器
7顆3.2GHz的SPE, 運算能力(32bits float)充其量也不過才89.6GFLOPs

講7800GTX大家可能會對他有所期待, 如果把比較對象換成ATI HD3650, 大家就會比較有感覺了...
HD3650有120個Stream Processor(Unified Shader), 一個時脈周期可以計算兩筆資料
因此他的運算能力有120 x 2 x 0.725(GHz) --> 174GFLOPs
這是理論值的部分 (當然, 整體效能並沒有那麼的理想)

所以Cell並不如預期般的強大, 老實說, 如果是拿來當成GPGPU, 當年會是不錯的選擇
但以現在的眼光來看, 他甚至遠不如nvidia的G92核心(軟體和硬體都不如)

而相比之下, Intel 如果有弄個 120個core, 每個core執行時脈是4GHz當然很嚇人
如果真的有120個core, 每個core又能4GHz, 而單個core同時能運算16筆32 bits float [512 bit的SIMD reg(或稱為vector reg)]
如果再把加法跟乘法運算單元錯開, 能夠同時運算, 則運算效能應該是高的嚇人
120 x 32 x 2 x 4GHz --> 大約 30 TFLOPs

但不曉得Intel是否會內建這麼多個核心進去(當初是喊說內建千個也沒問題, 但天曉得咧?)
不過我對於Intel的Larrabee是還抱持著蠻高的興趣的...
舊 2009-02-11, 01:23 AM #25
回應時引用此文章
Weichung離線中