瀏覽單個文章
space
Junior Member
 

加入日期: Apr 2003
文章: 730
引用:
作者lintinshen1999
FIRE STRIKE 35.6%
TIME SPY 36.2%
我是覺得這些測試軟體4K也應該極限了, 不能再高了, 除非以後遊戲和驅動對新卡友善

圖靈架構每個CUDA可以"同時"執行INT32跟FP32
安培架構每"一對"CUDA分為一組INT32跟FP32(但INT32跟FP32不能同時執行,跟圖靈比算是半殘)一組 + 一組獨立FP32

https://benchlife.info/nvidia-gefor...ucture-details/
"Turing SM 內部 INT32 整數運算單元和 FP32 浮點運算單元各自獨立,Ampere 則是替 INT32 單元也加上了 FP32 處理能力,讓這個單元能夠執行 INT32 或是 FP32 運算;簡言之,就是每個 SM 的 FP32 峰值效能達到以往的 2 倍,單一時脈週期可執行 128 個 FMA 運算。"


NV發表圖靈架構時表示,跑遊戲的時候FP32指令數:INT32指令數=100:36
方便計算稍微改成100:40=1:0.4

假設CUDA FP32算力與FPS呈正相關

CUDA FPS FP32:INT32
100 100 100:40(圖靈SM可同時計算INT跟FP)
200 143 143:57(安培)
143=43組半殘+100組獨立FP32
57=57組半殘

FSP
100:143=增加43%

假設新架構只探討CUDA方面的改動,不考慮其他的情況下
3080 CUDA數等於2080 TI CUDA數*2
效能增幅就是40%左右

如果遊戲有支援RT或是DLSS,新架構得益於新的RT核心、Tensor核心
在開啟這些效果的情況下,3080性能增長幅度較2080 TI應該會大幅大於40%
舊 2020-09-12, 01:01 PM #9
回應時引用此文章
space離線中