PCDVD數位科技討論區 - 瀏覽單個文章 - GK110強勢到來！Tesla K20X/K20正式發佈

消息來源

新一屆超級計算大會SC12今天開幕了，除了公佈新的TOP500超算榜單，各大相關廠商也是一股腦地發佈或者宣佈了多款高性能計算產品。先來看NVIDIA這邊，基於開普勒大核心GK110、擁有71億個晶體管的Tesla K20終於正式發佈了，而且還有更高端的Tesla K20X。

Tesla K20X擁有十四組SMX、2688個流處理器，遮蔽了一組192個，但同時啟用完整的384-bitVRAM頻寬和1.5MB二級快取，搭配6GB GDDR5。頻率方面核心定在732MHz，浮點性能為單精度FP32 3.95TFlops、雙精度FP64 1.31TFlops(這代3:1上代費米2:1)，VRAM頻率則是5.2GHz，頻寬達249.6GB/s。

事實上，美國橡樹嶺國家實驗室的新一代超級電腦「泰坦」裡配備的就是Tesla K20X，而不是Tesla K20，只不過之前雙方都口風甚緊，誰也沒有明說。泰坦此番不僅成功登頂超算王者，拿下世界性能第一，還在效率上超越了半年前的綠色超級電腦第一名。

Tesla K20又放棄了一組SMX和一個VRAM控制器，因此有2496個流處理器、320-bit頻寬，VRAM容量5GB GDDR5，二級快取也對應地減少到1.25MB。核心頻率也略降至706MHz，因此浮點性能減少為單精度3.52TFlops、雙精度1.17TFlops，而VRAM頻率仍然是5.2GHz，頻寬為208GB/s。

Tesla K20X的熱設計功耗為235W，Tesla K20則降低到225W——別小看了這區區10W，225W正是絕大多數伺服器和機櫃所允許的擴展卡最大TDP，再高就需要定製了，AMD 375W的雙核型FirePro S10000就比較麻煩。二者都提供主動和被動散熱，供客戶選擇。

相比之下，上一代費米架構的Tesla M2090/M2070Q只有30億個晶體管、最多512個流處理器、384-bit 3.7GHz 6GB GDDR5 VRAM，浮點性能最高單精度1.33TFlops、雙精度655GFlops，熱設計功耗最高250W。AMD FirePro S10000單精度高達5.91TFlops，雙精度也有1.48TFlops，比之Tesla K20X分別高出50％、13％，但到了實際生態裡顯然還是Tesla更有優勢。

Tesla K20的建議零售價為3199美元，Tesla K20X則未公佈，估計 4000-5000 美元範圍。二者均已開始大規模出貨了，客戶包括Appro、華碩、Cray、Eurotech、富士通、惠普、IBM、廣達、SGI、Supermicro、T-Platforms、泰安。

除了橡樹嶺，其它採納Tesla K20系列的機構還有：美國克萊姆森大學、印第安納大學、南加州大學(USC)、托馬斯·傑斐遜國家加速器實驗室、國家超級計算應用中心(NCSA)、國家海洋和大氣管理局(NOAA)；沙特阿拉伯阿卜杜拉國王科技大學(KAUST)；中國上海交大。

NVIDIA宣稱，Tesla K20X搭配Intel Sandy Bridge處理器，可以將大量高性能計算應用的性能提升十倍乃至更多，包括：

－ MATLAB(工程)：18.1倍
－ Chroma(物理)：17.9倍
－ SPECFEM3D(地球科學)：10.5倍
－ AMBER(分子動力學)：8.2倍

NVIDIA還表示，Tesla K20X/K20在過去三十天內就累計出貨提供了超過30PFlops的浮點性能，相當於過去時間最快超級電腦的總和！

之前發佈的雙GK104核心的Tesla K10並不會被取代和淘汰，而是將與Tesla K20系列並存。事實上，Tesla K20的單精度浮點性能還更高呢，達到了4.5TFlops，只是沒有SRAM ECC、HyperQ、Dynamic Parallelism等高階技術。