引用:
作者lintinshen1999
FIRE STRIKE 35.6%
TIME SPY 36.2%
我是覺得這些測試軟體4K也應該極限了, 不能再高了, 除非以後遊戲和驅動對新卡友善
|
圖靈架構每個CUDA可以"同時"執行INT32跟FP32
安培架構每"一對"CUDA分為一組INT32跟FP32(但INT32跟FP32不能同時執行,跟圖靈比算是半殘)一組 + 一組獨立FP32
https://benchlife.info/nvidia-gefor...ucture-details/
"Turing SM 內部 INT32 整數運算單元和 FP32 浮點運算單元各自獨立,Ampere 則是替 INT32 單元也加上了 FP32 處理能力,讓這個單元能夠執行 INT32 或是 FP32 運算;簡言之,就是每個 SM 的 FP32 峰值效能達到以往的 2 倍,單一時脈週期可執行 128 個 FMA 運算。"
NV發表圖靈架構時表示,跑遊戲的時候FP32指令數:INT32指令數=100:36
方便計算稍微改成100:40=1:0.4
假設CUDA FP32算力與FPS呈正相關
CUDA FPS FP32:INT32
100 100 100:40(圖靈SM可同時計算INT跟FP)
200 143 143:57(安培)
143=43組半殘+100組獨立FP32
57=57組半殘
FSP
100:143=增加43%
假設新架構只探討CUDA方面的改動,不考慮其他的情況下
3080 CUDA數等於2080 TI CUDA數*2
效能增幅就是40%左右
如果遊戲有支援RT或是DLSS,新架構得益於新的RT核心、Tensor核心
在開啟這些效果的情況下,3080性能增長幅度較2080 TI應該會大幅大於40%