瀏覽單個文章
lzarconlony1
*停權中*
 
lzarconlony1的大頭照
 

加入日期: Jun 2015
您的住址: 金一十大女支三
文章: 1,282
引用:
作者freaky
以preemption的議題而言,這樣的比喻是恰當的。
不過async compute比較像是一條馬路要劃幾線道給兩種不同車輛(汽車和機車來比方好了)使用的情況。
Maxwell 2.0的架構類似只有一條機車專用道(compute),其他都是給汽車走(graphics)。機車和汽車現在可以不用互相排隊了,但是機車道的容量比較小,如果民眾都改騎機車並且走機車專用道,自然就變慢了。但是這些民眾原本可以開車。


以DX12的定義 要求一定要走graphics或者compute真的是有點"管太寬"...
Maxwell 2.0還不只這樣而已吧 還需要一個交通警察來"分配指揮"

相信從驅動是可以做到 但是能做到甚麼層度有待商榷 已經先天不良
所以按照現在的狀態 連Pascal有可能還是這樣做 所以最近幾版BSOD連連的驅動是這樣來的嗎?


引用:
作者freaky
> 粒度是對岸翻譯
其實我引用那個日文網頁也是叫粒度 (基本上對岸的東西我很少去看,也不知道對岸怎麼翻就是了)
當然這個英文,很容易在intel 那篇原文內找的到

我大概了解 lzarconlony1 提到的那些是什麼
那其實是GPU平行處理能力,但這跟粒度是不一樣的東西
就GPU平行處理能力NV,AMD是類似的,但是DX11沒辦法顯示出這一點

這篇有說一些,粒度大小對效能的影響
http://pc.watch.impress.co.jp/docs/...514_168480.html
在這段 "データ並列の粒度とデータ並列ハードウェアの関係"

這樣講可能有誤,不過簡單的敘述
粒度就是CPU 與GPU溝通的頻率
粒度大的情形就是CPU 一次下很多命令給GPU運算
粒度小的情形是CPU 一次下一點 給GPU運算

兩者的差異在於CPU下的運算指令是不是適合GPU運算
GPU是個向量特化的運算單元
如果給他運算的東西剛好是向量 那粒度大有優勢,也就是之前我提到的粒度大對傳統圖形運算效率高
如果給他運算的是沒有太多向量的東西(反而CPU處理速度較快) 那粒度小比較好

以上屬於AMD的看法 先不管AMD 這樣認為對不對,最終他選擇的粒度小 很明顯不利於dx11 但有利於dx12
DX11 單執行緒取向沒辦法多下很多指令,DX12就可以平行下很多指令來填滿GPU運算(不管向量還是非向量)


兩者是本質相同的東西 硬體有硬體名詞 軟體有軟體名詞
兩個不同角度去探討事情的本質 這跟AMD甚麼沒關係
從2009-2010就看到有相關硬體與軟體paper
Fine-grained進行一段時間 相當來說是老東西..

你貼的那篇裡面有稍微提到
●データ並列の粒度とデータ並列ハードウェアの関係

------
單從granularity的角度來看還是行不通
NV的Warp一次是32 threads/4 cycles
AMD則是Wavefront一次64 threads/4 cycles
所以AMD一次進來流量較大 單從這邊來看GCN較有效率

NV驅動能改善大概就是Warp Scheduling的問題
不管是要31+1還是怎樣 這種方案似乎在整體效率上很難比肩

反正NV需要再加上一個驅動或者軟體來調度資源
DX12還有空間 希望最後不是又見到NV到處壓迫遊戲商

引用:
一些觀點統整 不是結論嘿(不要扣我帽子 沒有結論 沒有不支援 沒有XXX no no no...there is nothing add...
從DX12廣義來說 Maxwell不存在"支援"問題
從處理器設計來說 GPU是一種為了追求在影像3D/2D應用上更加有效率(更快)而"特化"設計的專用處理器
既然是處理器 硬體上不可避免會探討效率

不過 用軟體做也不是不行 重點能夠提升整理效率即可(不是關閉XXX來提升!!!)
舊 2015-09-08, 11:40 PM #94
回應時引用此文章
lzarconlony1離線中