消息來源
通過NVIDIA官方網站上的一份PDF技術文檔,我們確認了上週的一則消息:基於Fermi新架構的Tesla 20系列專業計算卡僅有448個流處理器。
根據NVIDIA最初公佈的規格,完整的Fermi核心由16組SM陣列構成,每組之中又有32個流處理器(NVIDIA稱之為CUDA核心),總共512個,但在Tesla 20系列上屏蔽了兩組SM陣列即64個流處理器。
與此同時,Tesla 20的顯存位寬標註為384-bit,而在NVIDIA的原始計劃中,Fermi架構應該要搭配512-bit位寬的。
如此精簡的原因也很簡單:控制功耗。Tesla 20系列的典型功耗就已經有190W,最大功耗則可達225W,使用了六針和八針兩個PCI-E輔助供電接口。如果開啟全部512個流處理器,整卡功耗勢必會超過250W,對於一款單晶顯卡來說實在太熱,恐怕得歷史性地需要兩個八針供電接口。
Tesla 20專業卡的命運也讓我們不得不擔憂未來的桌上型型號,不知道NVIDIA會不會同樣被迫妥協,或者孤注一擲拿出全規格怪物?至少在NVIDIA網站上針對Fermi架構的介紹中,依然在說512個處理器。
Tesla 20系列完整規格一覽:
1、GPU核心:
- 流處理器數量:448個
- Shader單元頻率:1.25-1.40GHz
- 電壓:1.05V
- 封裝:1981針BGA 42.5×42.5毫米(不是核心尺寸)
2、顯存:
- 類型:GDDR5
- 位寬:384-bit
- 顯存頻率:1.8-2.0GHz
- 容量:
Tesla C2050 3GB/24顆32M×32 GDDR5
Tesla C2070 6GB/24顆64M×32 GDDR5
3、整卡:
- PCB電路板:十層
- 系統接口:PCI-E 2.0 x16
- 物理尺寸:4.376×9.75英吋(11.12×24.77釐米),雙插槽
- 功耗:不高於225W
4、輸出接口:一個Dual-Link DVI-I
5、供電接口:一個六針、一個八針
6、性能:雙精度計算最高600GFlops
7、技術特點:
- 支持下一代IEEE 754-2008雙精度浮點標準
- 支持ECC(錯誤校驗碼)以提高可靠性和精確度
- 一級、二級多層緩存體系
- 支持C++編程語言
- 支持最多1TB系統內存
- 並行內核執行、快速上下文切換、10倍速度原子指令、64位虛擬尋址空間、系統調用與遞歸函數
Tesla C2050/C2070 GPU計算處理面向工作站客戶,售價2499/3499美元,還有相應的1U計算系統Tesla S2050/S2070,面向數據中心客戶,售價12995/18995美元,均將在2010年第二季上市。