PCDVD數位科技討論區 - 瀏覽單個文章 - 請問GTX978少L2及ROP影響多少效能?

不好意思我英文不夠好
經過再看一遍該怎麼說不該說是ROP SM(SMM)或者是L2問題
應該說有好幾個問題點要分開討論

直接改圖不知道該怎麼表達這算是一個資源分配的問題最主要是controller沒處理好
我相信這理論上是有可能從韌體或驅動改善結果的

兩個部分簡單結論因為應該不是大家都是Computing背景
1.圖中紅色方塊1
SMM(Streaming Multiprocessor Maxwell). 還是習慣稱其SM..
13 SM give you 52pixel/clock, 8 ROPs accept 56pixel/clock. the bottleneck is SMMs not ROPs.

2.圖中紅色方塊2
L2 block 7 recived twice requesting and getting more. it's take twice time compare other 6 L2 blocks and effect memory controller.

有人說SM沒影響瓶頸在SM根本不在ROPs 怎麼不影響?
然後L2取消了一個方塊只有7個port要接受所有要求
這樣就會變成最後一個port的L2接收兩倍要求所以等其他六個L2送到MC(memory controller), 第七個還在執行.

理論上應該會設計通知也就是說cache更新會需要回傳訊號其他六個都回傳OK
第七個還沒有回應這時候就不會refresh L2資料這樣間接影響到MC的速度

不曉得這樣做的意義是因為cache良率不佳還是??不甚理解會這樣動的原因何在

還有應該要參照一下這個上圖表達不完全盡善不只會影響到最後一個MC
而是你用到就會影響到整體效率因為所有request都必須要等第七個L2處理完畢
http://international.download.nvidi...paper_FINAL.PDF

不管從結構還是實測來看確實用超過就會有FPS低落的情況
這已經算是big bug應該提出解決方案或者recall
當初都沒小量產測試就直接大量產嗎...