瀏覽單個文章
jordanpchome
Senior Member
 
jordanpchome的大頭照
 

加入日期: Jan 2007
文章: 1,023
轉:GeForce GTX 480/470架構技術疑點解答

GeForce GTX 480/470的評測文章中,我們曾對GF100架構進行了較為深入的闡述,但因為種種原因還是遺漏了很多內容,而且有不少地方就連NVIDIA也沒有說清楚。近日有媒體通過郵件向NVIDIA提出了一些疑點問題,也讓我們對新架構和新卡有了更多瞭解。

1、晶體管

NVIDIA公開的說法是30億個,看起來只是個約數。有消息稱確切的數字是32億個,也有說30多億個的。最終證實,就是30億個。

2、頻率

GTX 480/470的核心頻率分別是700MHz、607MHz,但GF100架構內的各個單元模塊的實際運行頻率並不完全一致。據解釋,兩個標稱的核心頻率代表了所有關鍵單元的速度,但Shader單元例外,GTX 480/470分別異步運行在1401MHz、1215MHz,而且也不包括顯存界面,只是NVIDIA並未說清是僅限顯存控制器還是包括連帶的二級緩存和ROP單元。

3、載入和存儲單元

每個流式多處理器(SM)之內有16個載入和存儲單元,完整的GF100芯片一共256個,GTX 480/470分別是240個和224個。雖然看起來它們很適合紋理拾取,但NVIDIA表示載入和存儲、紋理拾取的路徑是不同的:載入和存儲單元使用的是一級緩存、二級緩存、顯存,紋理拾取路徑則是紋理緩存(每個12KB)、三級緩存、顯存。

4、共享存儲器和一級緩存

我們知道,每個SM都有專用的64KB片上存儲,可配置為48KB共享存儲器加16KB一級高速緩存,或者16KB共享存儲器加48KB一級高速緩存,那麼默認的配置是什麼?消息顯示,在使用更頻繁的圖形模式中48KB配置為共享存儲器,這取決於驅動編譯器的圖形內核的特點。

5、幾何性能

NVIDIA宣稱GF100的幾何性能取得了突飛猛進,是GT200的八倍之多,那麼這個比例是如何算出來的呢?GF100的曲面細分幾何峰值速率是每時鐘週期4個繪製三角形,但GT200並不支持曲面細分,所以很難直接比較。考慮到GT200頻率和峰值三角形速率(每時鐘週期0.5個繪製三角形而每時鐘週期1個僅限實心三角形)都比較低,所以八倍應該是個合理的估計。

另外要注意的是,每時鐘週期4個繪製三角形只是GF100的理論峰值性能,實際速度要看具體情況了,有消息稱合理的實際速度最高是3.2 個。

6、雙精度速率

雖然是基於同樣的核心架構,但不同定位的產品在這方面差異很大。Tesla並行計算產品上,雙精度速率是單精度的1/2,是個了不起的突破,不過GeForce消費級顯卡上雙精度速率被限制了很多,只有單精度的1/8。

7、像素填充率

NVIDIA只公佈了GTX 480/470的紋理填充率,那麼像素填充率呢?按照NVIDIA的說法,完整的 Fermi/GF100核心每時鐘週期可輸出32個像素,以及256個Z軸採樣(如果數據是可壓縮的),但在具體產品上會隨著GPC/SM的不同而有所差異,比如GTX 480只有15個SM(屏蔽了一組),每時鐘週期的像素輸出就是30個,GTX 470就是28個了。


Fermi/GF100內核照片
     
      
__________________
懷念ATI,懷念第一次的感動

~燦坤卡號歡迎取用~
60061360

----------------------
2022/03/27

CPU:AMD Ryzen 9 5950X
MB:ASUS ProArt X570-Creator WiFi
RAM:A-DATA DDR4 3200 ECC 32G*4
VGA:AMD Radeon Vega Frontier Edition*2
SSD:PLEXTOR M9PeGn 512GB
Power:Leadex Titanium 1000W
舊 2010-03-30, 10:48 AM #1
回應時引用此文章
jordanpchome離線中