引用:
作者freaky
Microsoft一直想做到的是mid-buffer preemption,目前nVidia的GPU在這方面確實有所限制,也在和DX team討論其他的可行方式,因其最終目的是在降低latency。不過最近這個benchmark的議題主因可能倒不是在此,而是遊戲針對AMD GPU的特性使用async compute的方式,導致speedup的因素來自於compute-compute concurrency而非compute-render concurrency。
|
你一直在這邊中傷 有本事回overclock.net那帖去講這些 好嗎
看看那些人有沒有鬼島人這麼好說話 甚麼是針對AMD?
Async Compute甚麼時候還有分不同廠商
現在就是因為DX12做法跟以前不同 GCN得益較多
很簡單的事實有需要扯出對手中傷論嗎
源點是第三方 這樣也能解讀成對手出招?
http://wccftech.com/nvidia-async-co...12-oxide-games/
threads切小deep pipeline受益較多本來就很合理
asynchronous shaders影片也只是圖解這個概念
GCN如果是一群螞蟻 那NV就是十六隻蝗蟲(GM204)
DX11時螞蟻無法團結 工作分配不到極限 打不贏蝗蟲
DX12把工作切細 螞蟻能發揮效率 蝗蟲習慣單打獨鬥 要面對平行運算效率下降
螞蟻甚麼工作都接 蝗蟲身價太高沒等上面發號司令就不幹
驅動真能把Warp Scheduling變的不同?
通常硬體實做才是能真正發揮效率關鍵
------
SMX, Kepler
SMM, Maxwell
不管怎麼說 這樣改進還是脫離不了原先概念
CUDA 32個一組或許在DX11很吃香 DX12 1+31能夠Work嗎?
------
Shader Processors與Unified Shaders
兩個名詞的迥異其實道明設計方針的差異性
Maxwell, GM204
2048 Shader Processors 128 Texture mapping units 64 Render output units
GCN 1.2, Tanga Pro
1792 Unified Shaders 112 Texture Mapping Units 32 Render Output Units
題外話 似乎看到有人在做這兩者的效率分析囉
比較令人納悶的是好像是AMD的人 這什碼情況
有點後悔今年買GTX 980...應該再等等
