![]() |
||
Elite Member
![]() ![]() ![]() ![]() ![]() 加入日期: Aug 2001
文章: 12,393
|
引用:
那位大大在PCDVD也有帳號.... ![]() |
||||||||
![]() |
![]() |
Master Member
加入日期: Jun 2002 您的住址: 耗電量頗高的地方.
文章: 1,959
|
引用:
其實沒那麼複雜啦....... 簡單講,去掉後面ROP的問題,光看Shader的話, 很籠統地說, R3x0是8 x 1.5(0.5是mini-ALU),R4x0是16x 1.5 NV40是16x 1.8~2(前後兩個Shader)。 但是,要用到後半的小ALU,需要指令的編排.... 所以大部分狀況下,都等於8x1、16x1的狀況。 所以不如直接做成32x1..... 論效率的話這樣最高。 NV4x開始有這樣的雛形,所以R5x0也學Shader和ROP分開的設計。 Mini-ALU當初是因為ROP和Shader還是連在一起的時候,為了效率所做的; 現在兩者分開了,效率的衡量帶來的平衡就又不同了。 這樣說來NV4x等於只做了一半,還是包了個頗大的ALU,利用率也不高? 不過這邊要補充的是,NV4x的考量不太一樣,它的ALU想要有效率地處理FP16,所以設計方向不同。 此文章於 2005-06-14 05:54 PM 被 Artx1 編輯. |
|||
![]() |
![]() |