![]() |
PCDVD數位科技討論區
(https://www.pcdvd.com.tw/index.php)
- 顯示卡討論區
(https://www.pcdvd.com.tw/forumdisplay.php?f=8)
- - NVIDIA正式宣佈CUDA 6:支援統一尋址!
(https://www.pcdvd.com.tw/showthread.php?t=1030884)
|
---|
NVIDIA正式宣佈CUDA 6:支援統一尋址!
消息來源
NVIDIA今天正式宣佈了最新版並行計算開發工具CUDA 6,相比之前的CUDA 5.5有著革命性的巨大進步。 NVIDIA表示,CUDA 6可以讓並行編碼前所未有的輕鬆,能夠顯著節省開發人員的時間和精力,而通過GPU加速可帶來比CPU模式最多8倍的性能提升。 CUDA 6的關鍵新特性包括: 1、 統一尋址(Unified Memory): 可直接訪問CPU記憶體、GPU VRAM,無需在彼此之間手動拷貝數據,可在大量編碼語言中更簡單地添加GPU加速支援。 其實CUDA 4就開始支援統一虛擬尋址,x86 CPU、GPU記憶體池可在同一空間內進行尋址,但那僅僅是簡單的記憶體管理,擺脫不了手動數據轉移。 CUDA 6則在現有的記憶體池結構上增加了一個統一記憶體系統,程式設計師可以直接訪問任何記憶體/ VRAM資源,或者在合法的記憶體空間內尋址,而不用管涉及到的到底是記憶體還是 VRAM。 不過注意,CUDA 6並不是完全不需要數據拷貝,只不過將這個工作從程式設計師那裡接過來自動執行而已,它仍然受制於PCI-E的頻寬和延遲,因此和AMD hUMA異構統一尋址架構是不一樣的。 另外值得一提的是,NVIDIA之前已經宣佈下代GPU Maxwell將會支援統一虛擬記憶體,但它要到明年才會發佈。NVIDIA表示,他們找到了完全通過軟體執行統一記憶體的方法,所以就提前這麼做了,Maxwell則會有某種硬體層面的統一記憶體技術(或許性能更高),但具體細節還有待公佈。 2、 替換庫(Drop-in Libraries): 簡單地用GPU加速庫替換已有的CPU庫,BLAS(基礎線性代數程序集)、FFTW(快速傅立葉變換)計算即自動提速最多8倍。 3、 多GPU支援(Multi-GPU Scaling): 重新設計的BLAS、FFT GPU庫,單個節點可自動支援最多八顆GPU,雙精度浮點性能可超過9TFlops,並且支援最多512GB的更大負載。 此外,CUDA 6平台還會提供一整套的編碼工具、GPU加速數學庫、文檔和編碼指導。 CUDA 6目前只是紙面宣佈,2014年初才會開放下載。有需要的可註冊加入CUDA-GPU開發者項目。 |
我只想知道跑F@H有沒有更快? :confused:
|
引用:
應該會, 大概也要新卡才能跑, 只是還得要史丹佛的團隊也寫出新版的F@H程式才行. |
引用:
看起來只是簡化程式設計, 為將來的真正統一尋址做準備 ! 引用:
應該不會耶 ! 因為還是要數據拷貝 |
這可以對抗HSA還是Mantle?
|
為什麼這種平行運算可以支援到4GPU以上
而遊戲就只能到4GPU,而且還要SLI模式 跑運算好像不需要裝SLI橋接卡就可以用了(網路上有人插4塊690) |
引用:
運算好像是一個核心算一個單元???(十個人同時被分配到做十個蛋糕,一人做一個) 遊戲是多個核心算同一個遊戲,所以比較難搞(十個女人要嘗試在一個月內生出一個小孩,現在是天方夜譚的,但將來天曉得能不能這樣搞... (喂 ) |
所有的時間均為GMT +8。 現在的時間是08:18 AM. |
vBulletin Version 3.0.1
powered_by_vbulletin 2025。