不好意思 我英文不夠好
經過再看一遍 該怎麼說 不該說是ROP SM(SMM)或者是L2問題
應該說有好幾個問題點 要分開討論
直接改圖 不知道該怎麼表達 這算是一個資源分配的問題 最主要是controller沒處理好
我相信這理論上是有可能從韌體或驅動改善結果的
http://i.imgur.com/scvFGZu.jpg
兩個部分 簡單結論因為應該不是大家都是Computing背景
1.圖中紅色方塊1
SMM(Streaming Multiprocessor Maxwell). 還是習慣稱其SM..
13 SM give you 52pixel/clock, 8 ROPs accept 56pixel/clock. the bottleneck is SMMs not ROPs.
2.圖中紅色方塊2
L2 block 7 recived twice requesting and getting more. it's take twice time compare other 6 L2 blocks and effect memory controller.
有人說SM沒影響 瓶頸在SM根本不在ROPs 怎麼不影響?
然後L2取消了一個方塊 只有7個port要接受所有要求
這樣就...