PCDVD數位科技討論區 - 瀏覽單個文章 - Nvidia被發現不支援DX12的非同步渲染功能

引用:

作者freaky

以preemption的議題而言，這樣的比喻是恰當的。
不過async compute比較像是一條馬路要劃幾線道給兩種不同車輛（汽車和機車來比方好了）使用的情況。
Maxwell 2.0的架構類似只有一條機車專用道(compute)，其他都是給汽車走(graphics)。機車和汽車現在可以不用互相排隊了，但是機車道的容量比較小，如果民眾都改騎機車並且走機車專用道，自然就變慢了。但是這些民眾原本可以開車。

以DX12的定義要求一定要走graphics或者compute真的是有點"管太寬"...
Maxwell 2.0還不只這樣而已吧還需要一個交通警察來"分配指揮"

相信從驅動是可以做到但是能做到甚麼層度有待商榷已經先天不良
所以按照現在的狀態連Pascal有可能還是這樣做所以最近幾版BSOD連連的驅動是這樣來的嗎?

引用:

作者freaky

> 粒度是對岸翻譯
其實我引用那個日文網頁也是叫粒度 (基本上對岸的東西我很少去看，也不知道對岸怎麼翻就是了)
當然這個英文，很容易在intel 那篇原文內找的到

我大概了解 lzarconlony1 提到的那些是什麼
那其實是GPU平行處理能力，但這跟粒度是不一樣的東西
就GPU平行處理能力NV,AMD是類似的，但是DX11沒辦法顯示出這一點

這篇有說一些，粒度大小對效能的影響
http://pc.watch.impress.co.jp/docs/...514_168480.html
在這段 "データ並列の粒度とデータ並列ハードウェアの関係"

這樣講可能有誤，不過簡單的敘述
粒度就是CPU 與GPU溝通的頻率
粒度大的情形就是CPU 一次下很多命令給GPU運算
粒度小的情形是CPU 一次下一點給GPU運算

兩者的差異在於CPU下的運算指令是不是適合GPU運算
GPU是個向量特化的運算單元
如果給他運算的東西剛好是向量那粒度大有優勢，也就是之前我提到的粒度大對傳統圖形運算效率高
如果給他運算的是沒有太多向量的東西(反而CPU處理速度較快) 那粒度小比較好

以上屬於AMD的看法先不管AMD 這樣認為對不對，最終他選擇的粒度小很明顯不利於dx11 但有利於dx12
DX11 單執行緒取向沒辦法多下很多指令，DX12就可以平行下很多指令來填滿GPU運算(不管向量還是非向量)

兩者是本質相同的東西硬體有硬體名詞軟體有軟體名詞
兩個不同角度去探討事情的本質這跟AMD甚麼沒關係
從2009-2010就看到有相關硬體與軟體paper
Fine-grained進行一段時間相當來說是老東西..

你貼的那篇裡面有稍微提到
●データ並列の粒度とデータ並列ハードウェアの関係

------
單從granularity的角度來看還是行不通
NV的Warp一次是32 threads/4 cycles
AMD則是Wavefront一次64 threads/4 cycles
所以AMD一次進來流量較大單從這邊來看GCN較有效率

NV驅動能改善大概就是Warp Scheduling的問題
不管是要31+1還是怎樣這種方案似乎在整體效率上很難比肩

反正NV需要再加上一個驅動或者軟體來調度資源
DX12還有空間希望最後不是又見到NV到處壓迫遊戲商

引用:

一些觀點統整不是結論嘿(不要扣我帽子沒有結論沒有不支援沒有XXX no no no...there is nothing add...

從DX12廣義來說 Maxwell不存在"支援"問題
從處理器設計來說 GPU是一種為了追求在影像3D/2D應用上更加有效率(更快)而"特化"設計的專用處理器
既然是處理器硬體上不可避免會探討效率

不過用軟體做也不是不行重點能夠提升整理效率即可(不是關閉XXX來提升!!!)