PCDVD數位科技討論區 - NVIDIA正式宣佈CUDA 6：支援統一尋址！

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)

- 顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)

- - NVIDIA正式宣佈CUDA 6：支援統一尋址！ (https://www.pcdvd.com.tw/showthread.php?t=1030884)

NVIDIA正式宣佈CUDA 6：支援統一尋址！

消息來源
NVIDIA今天正式宣佈了最新版並行計算開發工具CUDA 6，相比之前的CUDA 5.5有著革命性的巨大進步。

NVIDIA表示，CUDA 6可以讓並行編碼前所未有的輕鬆，能夠顯著節省開發人員的時間和精力，而通過GPU加速可帶來比CPU模式最多8倍的性能提升。

CUDA 6的關鍵新特性包括：

1、統一尋址(Unified Memory)：

可直接訪問CPU記憶體、GPU VRAM，無需在彼此之間手動拷貝數據，可在大量編碼語言中更簡單地添加GPU加速支援。

其實CUDA 4就開始支援統一虛擬尋址，x86 CPU、GPU記憶體池可在同一空間內進行尋址，但那僅僅是簡單的記憶體管理，擺脫不了手動數據轉移。

CUDA 6則在現有的記憶體池結構上增加了一個統一記憶體系統，程式設計師可以直接訪問任何記憶體/ VRAM資源，或者在合法的記憶體空間內尋址，而不用管涉及到的到底是記憶體還是 VRAM。

不過注意，CUDA 6並不是完全不需要數據拷貝，只不過將這個工作從程式設計師那裡接過來自動執行而已，它仍然受制於PCI-E的頻寬和延遲，因此和AMD hUMA異構統一尋址架構是不一樣的。

另外值得一提的是，NVIDIA之前已經宣佈下代GPU Maxwell將會支援統一虛擬記憶體，但它要到明年才會發佈。NVIDIA表示，他們找到了完全通過軟體執行統一記憶體的方法，所以就提前這麼做了，Maxwell則會有某種硬體層面的統一記憶體技術(或許性能更高)，但具體細節還有待公佈。

2、替換庫(Drop-in Libraries)：

簡單地用GPU加速庫替換已有的CPU庫，BLAS(基礎線性代數程序集)、FFTW(快速傅立葉變換)計算即自動提速最多8倍。

3、多GPU支援(Multi-GPU Scaling)：

重新設計的BLAS、FFT GPU庫，單個節點可自動支援最多八顆GPU，雙精度浮點性能可超過9TFlops，並且支援最多512GB的更大負載。

此外，CUDA 6平台還會提供一整套的編碼工具、GPU加速數學庫、文檔和編碼指導。

CUDA 6目前只是紙面宣佈，2014年初才會開放下載。有需要的可註冊加入CUDA-GPU開發者項目。

我只想知道跑F@H有沒有更快? :confused:

引用:

作者ben_chien

我只想知道跑F@H有沒有更快? :confused:

應該會, 大概也要新卡才能跑, 只是還得要史丹佛的團隊也寫出新版的F@H程式才行.

引用:

作者ChungWhaCanon

...
不過注意，CUDA 6並不是完全不需要數據拷貝，只不過將這個工作從程式設計師那裡接過來自動執行而已，它仍然受制於PCI-E的頻寬和延遲，因此和AMD hUMA異構統一尋址架構是不一樣的。
...

看起來只是簡化程式設計, 為將來的真正統一尋址做準備 !

引用:

作者ben_chien

我只想知道跑F@H有沒有更快? :confused:

應該不會耶 ! 因為還是要數據拷貝

這可以對抗HSA還是Mantle?

為什麼這種平行運算可以支援到4GPU以上
而遊戲就只能到4GPU，而且還要SLI模式
跑運算好像不需要裝SLI橋接卡就可以用了(網路上有人插4塊690)

引用:

作者我要開機啦

為什麼這種平行運算可以支援到4GPU以上
而遊戲就只能到4GPU，而且還要SLI模式
跑運算好像不需要裝SLI橋接卡就可以用了(網路上有人插4塊690)

運算好像是一個核心算一個單元???(十個人同時被分配到做十個蛋糕，一人做一個)
遊戲是多個核心算同一個遊戲，所以比較難搞(十個女人要嘗試在一個月內生出一個小孩，現在是天方夜譚的，但將來天曉得能不能這樣搞... (喂 )