PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

  回應
 
主題工具
Weichung
Power Member
 

加入日期: May 2000
您的住址: Taiwan
文章: 697
引用:
作者dabochi
現在來說Cell的能力被榨了多少出來都還難說
要的話不如來個PS3.5-顯卡先升級 然後把PS2的硬體引擎建回去再說
談PS4感覺還有點早

大大似乎還對PS3有很深的期待

但在下還是得說, Cell並不如Sony/IBM宣稱的那麼神奇
PS3先前的計畫是只用Cell就要取代GPU了, 但後來發現太困難了, 而且效能並不高

假設Cell 裡頭的SPE運作時脈是3.2GHz, 則每個Cell的浮點運算能力就是25.6GFLOPs
(SPE每個周期有執行一次SIMD指令的能力, 而他具有128bits的reg, 如果使用遊戲16 bits的浮點計算, 則一次運算可以有8筆資料同時計算出來)
但如果他是接近目前遊戲的需求, 則他只有12.8GFLOPs

7個SPE core --> 89.6GFLOPS
而7800GTX如果以32 bits的運算來說, 他具有
(24 + 8)* 4 * 2 * 2 * 0.43GHz = 220.16 GFLOP/s on G70 (7800 GTX)
24 --> Pixel Shader
8 --> Vertex Shader
4 --> SIMD register (128bits 裡有4筆資料)
2 --> 2 FLOPS per cycle per ALU
2 --> 2 ALUs per pipe

算一下也知道自己輸別人多少, 所以最後才會放棄使用SPE當成GPU的念頭
如果說拿SPE全部資源去計算3D畫面, 那本身PPE的運算資源, 又要應付音效, 物理運算, 人工智慧等等, 說實在有點捉襟見肘....

那如果說SPE去幫助GPU一些, 似乎又辦不到, 別人資料的動線設計得好好的, 你SPE算了一點東西就想插進去, 恐怕只會延誤到原本應有的效能

那要提升FPS, 剩下的只有類似AFR/MultiGPU的方式, 但GPU跟SPE差異這麼大, 這個程式撰寫的難度似乎非常的高, 除非SCEI有完整的API以及實驗報告, 否則大多遊戲公司會怯步

那剩下SPE到底可以幹甚麼? 大概就剩物理計算, 音效處理等等了...

只能說PS3整個架構就是相當不協調, 在這樣不協調的情況下, SPE運算資源沒使用到是很正常的
     
      
舊 2009-02-09, 10:59 AM #21
回應時引用此文章
Weichung離線中  
KKao
*停權中*
 

加入日期: Jan 2002
您的住址: 台北
文章: 172
長久以來一直有Cell 的運算效能沒被有效利用的說法,
但是這個說法背後有一個問題一直被忽略。
Sony 早在 PS3 上市的時候就承認,Cell 內部的 BUS 速度不夠。
同時啟動超過 5 SPE 處理資料就超過 internal bus 的頻寬。
或許 7個 SPE 的運算效能還沒用完,但是 bus 頻寬問題沒解決,
SPE 再多也沒用。
 

此文章於 2009-02-10 12:41 AM 被 KKao 編輯.
舊 2009-02-10, 12:38 AM #22
回應時引用此文章
KKao離線中  
dabochi
*停權中*
 
dabochi的大頭照
 

加入日期: Nov 2002
您的住址: 東湖
文章: 1,688
引用:
作者Weichung
大大似乎還對PS3有很深的期待

但在下還是得說, Cell並不如Sony/IBM宣稱的那麼神奇
PS3先前的計畫是只用Cell就要取代GPU了, 但後來發現太困難了, 而且效能並不高

假設Cell 裡頭的SPE運作時脈是3.2GHz, 則每個Cell的浮點運算能力就是25.6GFLOPs
(SPE每個周期有執行一次SIMD指令的能力, 而他具有128bits的reg, 如果使用遊戲16 bits的浮點計算, 則一次運算可以有8筆資料同時計算出來)
但如果他是接近目前遊戲的需求, 則他只有12.8GFLOPs

7個SPE core --> 89.6GFLOPS
而7800GTX如果以32 bits的運算來說, 他具有
(24 + 8)* 4 * 2 * 2 * 0.43GHz = 220.16 GFLOP/s on G70 (7800 GTX)
24 --> Pixel Shader
8 --> Vertex Shader
4 --> SIMD register (128bits 裡有4筆資料)
2 --> 2 FLOPS per cycle per ALU
2 --> 2 ALUs per pipe

算一下也知道自己輸別人多少, 所以最後才...


恩...其實與其說在下對Cell有很深的期待
不如說在下很好奇到底有多少廠家真能寫出可以充分使用這麼多個核心的遊戲出來?
SCEI有特別為了Cell辦比賽(Cell Speed Challenge)
2007年看第一屆比賽時 在下對於Cell在API與Compiler上的不成熟真的是很詫異
諸如透過DMA隱藏主記憶體的Latency,Double Buffer這些東西全部都得要參賽者自己寫API出來實做 更不用談當時參加44隊中 只有6隊能在一個月的時間內做出10個規定課題的正解
而且Cell給SPE的Cache只有很驚人的256K 說真的 在下是真的很好奇當在高速平行運算時要如何做最佳化-光資料就噎死了
如果真的要說期待的話 Cell上的東西其實可以說是非常先進 很值得期待哪天也能應用在廣大的消費性電子用多核心系統 真要做出來的話 手機 電視這些東西的樣貌應該會變很多的
舊 2009-02-10, 12:52 AM #23
回應時引用此文章
dabochi離線中  
speedchaser
Regular Member
 

加入日期: Aug 2008
文章: 56
說也奇怪,Intel明明專精在行的是CPU,卻找它作GPU;
雖Intel大肆宣傳要大刀闊斧進軍顯示卡領域,並不表示一定成功,
且那是它的處女作,Sony下注在上面是豁出去了嗎?!
舊 2009-02-10, 09:10 PM #24
回應時引用此文章
speedchaser離線中  
Weichung
Power Member
 

加入日期: May 2000
您的住址: Taiwan
文章: 697
引用:
作者dabochi
恩...其實與其說在下對Cell有很深的期待
不如說在下很好奇到底有多少廠家真能寫出可以充分使用這麼多個核心的遊戲出來?
SCEI有特別為了Cell辦比賽(Cell Speed Challenge)
2007年看第一屆比賽時 在下對於Cell在API與Compiler上的不成熟真的是很詫異
諸如透過DMA隱藏主記憶體的Latency,Double Buffer這些東西全部都得要參賽者自己寫API出來實做 更不用談當時參加44隊中 只有6隊能在一個月的時間內做出10個規定課題的正解
而且Cell給SPE的Cache只有很驚人的256K 說真的 在下是真的很好奇當在高速平行運算時要如何做最佳化-光資料就噎死了
如果真的要說期待的話 Cell上的東西其實可以說是非常先進 很值得期待哪天也能應用在廣大的消費性電子用多核心系統 真要做出來的話 手機 電視這些東西的樣貌應該會變很多的

就如我之前所言, 就算SPE被充分運用, 拿來當成3D處理器
7顆3.2GHz的SPE, 運算能力(32bits float)充其量也不過才89.6GFLOPs

講7800GTX大家可能會對他有所期待, 如果把比較對象換成ATI HD3650, 大家就會比較有感覺了...
HD3650有120個Stream Processor(Unified Shader), 一個時脈周期可以計算兩筆資料
因此他的運算能力有120 x 2 x 0.725(GHz) --> 174GFLOPs
這是理論值的部分 (當然, 整體效能並沒有那麼的理想)

所以Cell並不如預期般的強大, 老實說, 如果是拿來當成GPGPU, 當年會是不錯的選擇
但以現在的眼光來看, 他甚至遠不如nvidia的G92核心(軟體和硬體都不如)

而相比之下, Intel 如果有弄個 120個core, 每個core執行時脈是4GHz當然很嚇人
如果真的有120個core, 每個core又能4GHz, 而單個core同時能運算16筆32 bits float [512 bit的SIMD reg(或稱為vector reg)]
如果再把加法跟乘法運算單元錯開, 能夠同時運算, 則運算效能應該是高的嚇人
120 x 32 x 2 x 4GHz --> 大約 30 TFLOPs

但不曉得Intel是否會內建這麼多個核心進去(當初是喊說內建千個也沒問題, 但天曉得咧?)
不過我對於Intel的Larrabee是還抱持著蠻高的興趣的...
舊 2009-02-11, 01:23 AM #25
回應時引用此文章
Weichung離線中  
dabochi
*停權中*
 
dabochi的大頭照
 

加入日期: Nov 2002
您的住址: 東湖
文章: 1,688
引用:
作者Weichung
就如我之前所言, 就算SPE被充分運用, 拿來當成3D處理器
7顆3.2GHz的SPE, 運算能力(32bits float)充其量也不過才89.6GFLOPs

講7800GTX大家可能會對他有所期待, 如果把比較對象換成ATI HD3650, 大家就會比較有感覺了...
HD3650有120個Stream Processor(Unified Shader), 一個時脈周期可以計算兩筆資料
因此他的運算能力有120 x 2 x 0.725(GHz) --> 174GFLOPs
這是理論值的部分 (當然, 整體效能並沒有那麼的理想)

所以Cell並不如預期般的強大, 老實說, 如果是拿來當成GPGPU, 當年會是不錯的選擇
但以現在的眼光來看, 他甚至遠不如nvidia的G92核心(軟體和硬體都不如)

而相比之下, Intel 如果有弄個 120個core, 每個core執行時脈是4GHz當然很嚇人
如果真的有120個core, 每個core又能4GHz, 而單個core同時能運算16筆32 bits float [512 bit的SIMD reg(或稱為vector reg)]
如果再把加法跟乘法運...


不不不 在下期待的不是Cell的"效能"
而是為了把Cell能力榨乾而搞出來的"花樣"
如同閣下所提 多核心的程式很難寫
遠者有Cell跟Linux這兩個一硬一軟一對寶 近者有ATi的R600及後繼的架構
坦白說 目前看起來最能把多核心活用的是Web Server跟DB Server
除此之外 目前常人常用軟體在多核心架構上的演進其實蠻慢的
很多時候與其說是多核心架構軟體跑的更快了 不如說是CPU/GPU的微架構演進讓軟體跑的更快了
而期待Cell的理由也很簡單-Cell是CPU 比起GPU更適合通用運算 比起Sun的Niagra家族來說更普及 加上他的硬體特性比X86更接近消費性電子產品用的CPU
因此在下認為Cell上的花樣將會具有相當的前瞻性與啟發性
舊 2009-02-11, 08:53 AM #26
回應時引用此文章
dabochi離線中  
rainthink
Power Member
 
rainthink的大頭照
 

加入日期: Oct 2008
您的住址: 高雄市
文章: 572
PS3 的Cell本質上還是處理器CPU
顯示晶片是RSX(Nvidia研發)

用CPU跟GPU比較感覺上是有失公平
就發揮Cell處理器(8+1核心)效能上的軟體
應該就算是F@H的蛋白質模擬運算了

就當初Cell所提供的產值(PPD) 每日約2700 PPD
當時推出的時候 Intel的產品還是只有P4
甚至一直要到四核的出現 才有辦法追上
舉例來說 雙核的E4系列 充其量用SMP來運算蛋白質
每日PPD約在600-1000上下

就時間點來說 Cell處理器在當時算是頂尖的CPU
IBM拿來做伺服器 東芝用閹割的版本(4核心)來作筆電
SONY就是做PS3了

只可惜有個新聞稿忘了是在那邊看到的
有位美國大學教授 買了八台PS3做串接 性能跟當時的超級
電腦可以相比擬 甚至在價位上比超級電腦便宜

不過在實際運用上面 是能裝Linux系統的
遊戲機畢竟是遊戲機 雖然PS3處理器強大
但是RAM還是無法像現在電腦有那麼大的容量

IBM拿來做伺服器核心倒是另外一回事了
不過價格倒也不便宜 畢竟是伺服器

話說回來 PS4的處理器在巴哈看到的新聞
是預計使用Cell的製程改良版
還蠻好奇Intel要做PS4的GPU
挺新鮮的 就現階段Intel有內顯的晶片組效能來說
懷疑能強到那個地步 畢竟會用到Intel內顯晶片的使用者不多
大多是使用Nvidia跟Ati的顯卡做輸出...
__________________

此文章於 2009-02-11 11:56 AM 被 rainthink 編輯.
舊 2009-02-11, 11:54 AM #27
回應時引用此文章
rainthink離線中  
alsr
Major Member
 
alsr的大頭照
 

加入日期: May 2000
您的住址: 台北
文章: 263
引用:
作者rainthink

只可惜有個新聞稿忘了是在那邊看到的
有位美國大學教授 買了八台PS3做串接 性能跟當時的超級
電腦可以相比擬 甚至在價位上比超級電腦便宜



其餘恕刪,這句話絕對是唬爛的,就像當年ps2的晶片可以用在彈道飛彈上一樣。
舊 2009-02-11, 09:07 PM #28
回應時引用此文章
alsr離線中  
rainthink
Power Member
 
rainthink的大頭照
 

加入日期: Oct 2008
您的住址: 高雄市
文章: 572
引用:
作者alsr
其餘恕刪,這句話絕對是唬爛的,就像當年ps2的晶片可以用在彈道飛彈上一樣。


絕對唬爛?

看看這新聞原來PS3可以這樣子用

或者是想看原文
http://news.ncsu.edu/releases/2007/march/041.html
http://www.engadget.com/2007/03/10/...playstation-3s/
http://www.thewolfweb.com/message_t...px?topic=465538

不好意思 我不會打嘴砲 只求事實

還蠻欣賞你的簽名檔
__________________

此文章於 2009-02-11 11:21 PM 被 rainthink 編輯.
舊 2009-02-11, 11:17 PM #29
回應時引用此文章
rainthink離線中  
rainthink
Power Member
 
rainthink的大頭照
 

加入日期: Oct 2008
您的住址: 高雄市
文章: 572
The PS3 cluster at NC State does not break into the top 500
或許這幾個(八台)PS3的叢集無法打進世界前五百大超級電腦

His cluster of eight PS3 machines – the first such academic cluster in the world – packs the power of a small supercomputer, but at a total cost of about $5,000, it costs less than some desktop computers that have only a fraction of the computing power.

他的(八台)PS3的叢集電腦,是世界上第一個用在學術上的叢集電腦,
,聚集了運算能力的小型超級電腦,但是只需要總共5000美金,
所耗費的金錢比一些桌上型(叢集)電腦來得少

如果單就"超級電腦"這個字意來說 是無法打入前五百大
但是不是前五百大就不是超級電腦嗎?

就維基百科裡面 超級電腦

裡面的解釋來說 是或不是 就看每一個人開的窗戶是如何了
__________________
舊 2009-02-11, 11:46 PM #30
回應時引用此文章
rainthink離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是11:05 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。