PCDVD數位科技討論區 - 瀏覽單個文章 - NVIDIA正式宣佈CUDA 6：支援統一尋址！

消息來源
NVIDIA今天正式宣佈了最新版並行計算開發工具CUDA 6，相比之前的CUDA 5.5有著革命性的巨大進步。

NVIDIA表示，CUDA 6可以讓並行編碼前所未有的輕鬆，能夠顯著節省開發人員的時間和精力，而通過GPU加速可帶來比CPU模式最多8倍的性能提升。

CUDA 6的關鍵新特性包括：

1、統一尋址(Unified Memory)：

可直接訪問CPU記憶體、GPU VRAM，無需在彼此之間手動拷貝數據，可在大量編碼語言中更簡單地添加GPU加速支援。

其實CUDA 4就開始支援統一虛擬尋址，x86 CPU、GPU記憶體池可在同一空間內進行尋址，但那僅僅是簡單的記憶體管理，擺脫不了手動數據轉移。

CUDA 6則在現有的記憶體池結構上增加了一個統一記憶體系統，程式設計師可以直接訪問任何記憶體/ VRAM資源，或者在合法的記憶體空間內尋址，而不用管涉及到的到底是記憶體還是 VRAM。

不過注意，CUDA 6並不是完全不需要數據拷貝，只不過將這個工作從程式設計師那裡接過來自動執行而已，它仍然受制於PCI-E的頻寬和延遲，因此和AMD hUMA異構統一尋址架構是不一樣的。

另外值得一提的是，NVIDIA之前已經宣佈下代GPU Maxwell將會支援統一虛擬記憶體，但它要到明年才會發佈。NVIDIA表示，他們找到了完全通過軟體執行統一記憶體的方法，所以就提前這麼做了，Maxwell則會有某種硬體層面的統一記憶體技術(或許性能更高)，但具體細節還有待公佈。

2、替換庫(Drop-in Libraries)：

簡單地用GPU加速庫替換已有的CPU庫，BLAS(基礎線性代數程序集)、FFTW(快速傅立葉變換)計算即自動提速最多8倍。

3、多GPU支援(Multi-GPU Scaling)：

重新設計的BLAS、FFT GPU庫，單個節點可自動支援最多八顆GPU，雙精度浮點性能可超過9TFlops，並且支援最多512GB的更大負載。

此外，CUDA 6平台還會提供一整套的編碼工具、GPU加速數學庫、文檔和編碼指導。

CUDA 6目前只是紙面宣佈，2014年初才會開放下載。有需要的可註冊加入CUDA-GPU開發者項目。