消息來源
NVIDIA今天正式宣佈了最新版並行計算開發工具CUDA 6,相比之前的CUDA 5.5有著革命性的巨大進步。
NVIDIA表示,CUDA 6可以讓並行編碼前所未有的輕鬆,能夠顯著節省開發人員的時間和精力,而通過GPU加速可帶來比CPU模式最多8倍的性能提升。
CUDA 6的關鍵新特性包括:
1、 統一尋址(Unified Memory):
可直接訪問CPU記憶體、GPU VRAM,無需在彼此之間手動拷貝數據,可在大量編碼語言中更簡單地添加GPU加速支援。
其實CUDA 4就開始支援統一虛擬尋址,x86 CPU、GPU記憶體池可在同一空間內進行尋址,但那僅僅是簡單的記憶體管理,擺脫不了手動數據轉移。
CUDA 6則在現有的記憶體池結構上增加了一個統一記憶體系統,程式設計師可以直接訪問任何記憶體/ VRAM資源,或者在合法的記憶體空間內尋址,而不用管涉及到的到底是記憶體還是 VRAM。
不過注意,CUDA 6並不是完全不需要數據拷貝,只不過將這個工作從程式設計師那裡接過來自動執行而已,它仍然受制於PCI-E的頻寬和延遲,因此和AMD hUMA異構統一尋址架構是不一樣的。
另外值得一提的是,NVIDIA之前已經宣佈下代GPU Maxwell將會支援統一虛擬記憶體,但它要到明年才會發佈。NVIDIA表示,他們找到了完全通過軟體執行統一記憶體的方法,所以就提前這麼做了,Maxwell則會有某種硬體層面的統一記憶體技術(或許性能更高),但具體細節還有待公佈。
2、 替換庫(Drop-in Libraries):
簡單地用GPU加速庫替換已有的CPU庫,BLAS(基礎線性代數程序集)、FFTW(快速傅立葉變換)計算即自動提速最多8倍。
3、 多GPU支援(Multi-GPU Scaling):
重新設計的BLAS、FFT GPU庫,單個節點可自動支援最多八顆GPU,雙精度浮點性能可超過9TFlops,並且支援最多512GB的更大負載。
此外,CUDA 6平台還會提供一整套的編碼工具、GPU加速數學庫、文檔和編碼指導。
CUDA 6目前只是紙面宣佈,2014年初才會開放下載。有需要的可註冊加入CUDA-GPU開發者項目。