PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   顯示卡討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=8)
-   -   [心得]手頭的6800GT在3DMark05底下的表現 (https://www.pcdvd.com.tw/showthread.php?t=391918)

Artx1 2004-10-01 08:46 AM

引用:
作者Reich 唐
用512bit的GDDR3記憶體來解決記憶體頻寬的問題? 這樣1GHz的記憶體時脈就可以提供64GB的記憶體頻寬,不知道能否抒解3D加速卡的瓶頸 :laugh:

其實還有一個問題,就是要實現比32bit Floating Point Precision Color(浮點精度色彩) 還要高的色彩,也需要更高的記憶體頻寬,不然看到的3D畫面永遠假假的像是彩色筆畫的


我是覺得512bit 沒必要啦.... 因為512bit顯然一定會突破1000腳。
而就我所知1000腳是個分水嶺,往上很難壓低價錢。
然後其次是DRAM數量,目前256bit使用的是32bit的顆粒,主流是8顆的設計。
512bit的話,因為目前沒有64bit的DRAM顆粒,
想必一定要使用到16顆DRAM,而目前GDDR3是144腳。
使用512bit DRAM介面的話,會同時使晶片封裝/PCB/DRAM上的成本都提高。

實際上,記憶體只是相比之下成長速度較慢,但是並不是已經面臨瓶頸了。
GDDR3/4目前看來時脈仍然有很大的空間可以提升,只要等製程相應的改善,
或者真的用XDR DRAM都是個方向。

正常狀況下,以雙方的ROADMAP而言,
2005年的時候,GDDR3可以達到1.6Gtps(800MHz,目前是600MHz左右),
256bit下就是51.2GB/s;
而XDR DRAM是3.2Gtps預定,亦即256bit下是100GB/s,
或者就可以用128bit介面來節省成本;
而且XDR DRAM的介面protocol不需要等長配線,這也能進一步降低PCB成本。
ATI是GDDR3/4 Group的發起者之ㄧ,已知不可能使用close standard,
但是NVIDIA就不一定了,也許真的他們會手賤跑去用XDR也說不定,
不然至少也有PS3會用。

======
另外,FP32 color.... 我不知道有沒有必要。
人眼的辨識能力其實也並不是那麼高,
用稍高一點的格式然後dithering回去應該就夠了,
FP32 color已經快算是overkill了,NV3x/4x使用FP16/FP32運算,
並不是完全只看效能問題,而是色彩用FP16 storage應該算相當足夠,
運算過程才應該使用FP32.... lighting的話需要FP32運算。

最後,DVI介面限制在32bit.... 10bit目前也只能使用在類比輸出上,
能支援10bit輸出的OS也還窩著不出來(Longhorn),
就算真的都使用FP32的色彩,顯然設備也是個要考慮的問題。

Reich 唐 2004-10-01 09:02 AM

引用:
作者Artx1
我是覺得512bit 沒必要啦.... 因為512bit顯然一定會突破1000腳。
而就我所知1000腳是個分水嶺,往上很難壓低價錢。

是啊,Artx1大大對於顯示記憶體分析的非常有深度,看起來應該GDDR還有拉高時脈的空間,那的確不用增加位元數。的確,小弟我也知道增加記憶體位元數更花錢,所以便宜的蟑螂地雷卡都是64bit的囉。 :p

不過關於那個FP32 color的部分,小弟其實是看Tom's的文章,現節錄於下:

原文網址: http://www.big5.tomshardware.com/gr...precision_color
PS 2.0中最重要的一點在於支援64位元或甚至128位元的浮點色彩精度。它為什麼如此重要?

直到目前為止,我們在電腦上能使用的最高色彩精度是32位元。一個32位元的整數能夠表現出0與232-1(= 4,294,967,295)之間的任何整數。乍看之下您也許會認為32位元色彩精度能夠表現出超過40億種的色彩,難道這還不夠嗎?

首先要知道的是32位元色彩精度並不代表能夠表現出40億種色彩。實際上,這32位元中用在儲存RGB(紅Red、綠Green、藍Blue)色彩資訊上的只有24位元而已。剩下的8位元通常存放alpha值。224只等於16,777,216,這也正是我們一般說的全彩(true color)所能表現的顏色:1677萬種不同顏色。當然啦,這數字看起來已經很不錯了,不過要是再更深入一點看,您就會發現32位元色彩精度其實並不沒有什麼了不起的。在存放色彩資訊的24位元中,包括了用來表現紅色的8位元,用來表現綠色的8位元以及用來表現藍色的8位元。換句話說,每一個原色的色彩精度都只有8位元,換成整數來看就是0到255。這其實並不多不是嗎?這種單色8位元的色彩精度有個很嚴重的缺陷,就是它缺少大幅度的變化(Dynamic)。在這裡變化指的是最低與最高值間的差異,如果我們姑且忽略0而從1開始算的話,那我們會發現8位元整數間的最大差異只有255。這正是遊戲開發人員所面臨的挑戰,他們想在一個3D世界裡內表現出極亮和極暗的區域,然而每個顏色只有8位元的值,自然也沒辦法呈現出對比過於強烈的畫面。

.....在128位元浮點色彩精度中,每個色彩都具有32位元的浮點精度(支援IEEE單一精確度,還記得SSE嗎?),分別代表1個正負號位元,8個指數位元(含一個正負號)以及23個尾數位元.這樣一來這個32位元浮點數能表示的值可以從0.00000000000000000000000000000000000000294(=2-128)到170,000,000,000,000,000,000,000,000,000,000,000,000(=2127),而且23位元的精確度也比8位元要高的多。


弟是指這個部分,Tom's那時有兩個顏色的對比:

左邊部份是以32位元色彩精度繪製的,而右邊部份由於使用了128位元浮點色彩精度

弟個人的感覺是128bit下,畫面比較接近照片,不然32bit下,就像一般的3D畫面一樣,好像彩色筆畫出來的。

當然弟的觀念可能有誤解,還請Artx1大大指教。 :)

Artx1 2004-10-01 09:12 AM

引用:
作者Reich 唐
是啊,Artx1大大對於顯示記憶體分析的非常有深度,看起來應該GDDR還有拉高時脈的空間,那的確不用增加位元數。的確,小弟我也知道增加記憶體位元數更花錢,所以便宜的蟑螂地雷卡都是64bit的囉。 :p

不過關於那個FP32 color的部分,小弟其實是看Tom's的文章,現節錄於下:

原文網址: http://www.big5.tomshardware.com/gr...precision_color



唔.... Tom's有些東西忘記講:
1. 顏色會看起來怪怪的,不是因為輸出,
而是因為整數8bit(共32bit)會使得顏色在運算過程****現誤差,
剛剛提到過現在也沒有OS支援8bit per component以上的輸出,10bit都要巴望著等了,
如果真的在輸出這邊出問題的話,那Radeon9700 Demo這張screenshot本身就很可疑。:)
(因為沒辦法輸出啊)

2. 我自己覺得輸出的話10bit (共40bit)應該就夠了,
Dithering回8bit(共32bit)是為了相容性問題,
不過現在好像沒有廠商在GPU裡面塞有這種能力的RAMDAC,
而且也沒必要了。

而運算需要FP32(128bit),儲存則需要FP16(64bit),
更高的精確度對Graphic而言應該沒有必要了,所以GPU短期發展
也不會再朝向更高的精確度潛進了。

除非未來的市場裡面,GPU負責非常規運算(繪圖以外的運算)的狀況,
已經多到非常普遍的地步,那可能就會有GPU設計上考慮到這些特定運算,
那麼科學運算顯然需要到FP64,這時候追加這種能力才有意思。

Reich 唐 2004-10-01 09:19 AM

引用:
作者Artx1
唔.... Tom's有些東西忘記講:
1. 顏色會看起來怪怪的,不是因為輸出,
而是因為整數8bit(共32bit)會使得顏色在運算過程****現誤差,
剛剛提到過現在也沒有OS支援8bit per component以上的輸出,10bit都要巴望著等了,
如果真的在輸出這邊出問題的話,那Radeon9700 Demo這張screenshot本身就很可疑。:)
(因為沒辦法輸出啊)

...

讚喔,Artx1大大您應該是業界的專家! :agree: :agree: :agree:

其實弟只有一個核心問題,就是我們的3D畫面何時能夠跟照片一樣啊?像素生成率應該是夠了,加上FSAA等技術可以平滑邊緣,但顏色就是怎麼看怎麼怪,何時能夠讓我們的3D畫面讓別人以為是在看電視呢? :like:

anomaly 2004-10-01 09:33 AM

啊。。。小弟回覆有點慢﹐大家原來都同意。。。

引用:
作者Artx1
我是覺得512bit 沒必要啦.... 因為512bit顯然一定會突破1000腳。
而就我所知1000腳是個分水嶺,往上很難壓低價錢。


針腳問題其實可以用RAMBUS解決﹐不過好像為了省那US$10﹐除非逼不得已一般不會用RAMBUS。小弟我家裡還有一台i850E的RAMBUS電腦﹐是我用過最穩的﹐比任何DDR/DDR2還要穩。RAMBUS科技真的是最近10年來最好的memory設計﹐可惜他們公司因玩法律而被其它DRAM廠商唾棄。

引用:
作者Artx1
另外,FP32 color.... 我不知道有沒有必要。
人眼的辨識能力其實也並不是那麼高,
用稍高一點的格式然後dithering回去應該就夠了,
FP32 color已經快算是overkill了,NV3x/4x使用FP16/FP32運算,
並不是完全只看效能問題,而是色彩用FP16 storage應該算相當足夠,
運算過程才應該使用FP32.... lighting的話需要FP32運算。


其實人眼對顏色的分辨是看色彩的波長。目前研究報告是說眼鏡看不同色階的程度不一樣。分辨綠色最強(800-900階)﹐紅(500-600階)﹐藍(300-400階)。也就是說﹐我們目前RGB24/32bit不夠用。小弟認為未來應該會朝向最後輸出10bit基本色為目標﹐RGB共30bit﹐RGBA﹐ 40bit。運算過程方面可以用INT64或FP64 register﹐甚至更高做運算﹐最需要FP64應該是Z-buffer。最後再輸出10bit per component color。這樣就是很完美的系統了

leader0419 2004-10-01 11:38 AM

其實有時候雖然很講究畫面品質~不過真如要達到像在看現在的電影特效~
就如唐大所說的看電視的話~我想銀子要先準備好XD
不過我覺得~如果是3D遊戲~也別太接近真實~
遊戲畫面~就要有遊戲畫面的感覺~(有講等於沒講>"<)
那種感覺就好像~我們看的卡通~看起來都像真的人在演的感覺~
那應該蠻怪的喔~~或許有人也希望更接近真實~譬如說~~~(耶~18禁>"<)
恩~~~偏題了~~不過看兩位大大這樣討論下來還看的蠻爽的~恩~有收穫有收穫~~

引用:
作者Reich 唐
讚喔,Artx1大大您應該是業界的專家! :agree: :agree: :agree:

其實弟只有一個核心問題,就是我們的3D畫面何時能夠跟照片一樣啊?像素生成率應該是夠了,加上FSAA等技術可以平滑邊緣,但顏色就是怎麼看怎麼怪,何時能夠讓我們的3D畫面讓別人以為是在看電視呢? :like:

Reich 唐 2004-10-01 11:52 AM

引用:
作者anomaly
其實人眼對顏色的分辨是看色彩的波長。目前研究報告是說眼鏡看不同色階的程度不一樣。分辨綠色最強(800-900階)﹐紅(500-600階)﹐藍(300-400階)。也就是說﹐我們目前RGB24/32bit不夠用。

是啊,經您一解說,目前8bit每個顏色只有255階,差的還真遠,難怪就算是Farcry、Doom3之流的遊戲,看起來還是像彩色筆畫的,連油畫的水準都搆不上! :jolin:

Artx1 2004-10-01 12:08 PM

引用:
作者anomaly
針腳問題其實可以用RAMBUS解決﹐不過好像為了省那US$10﹐除非逼不得已一般不會用RAMBUS。小弟我家裡還有一台i850E的RAMBUS電腦﹐是我用過最穩的﹐比任何DDR/DDR2還要穩。RAMBUS科技真的是最近10年來最好的memory設計﹐可惜他們公司因玩法律而被其它DRAM廠商唾棄。


是啊,前兩篇小弟也提過XDR,這個就是RAMBUS的產品。
不過就我所知,其實不只是這10usd,對DRAM廠商而言最大的問題,
是這個ASIC要放在裡面,所以這個DRAM不能移作它用,對廠商而言風險成本有點大。
(所以FB-DIMM才要搞個橋接晶片在Module上)

當然,這是主記憶體Module才會面對的問題,
XDR DRAM作為顯示用時直接連結GPU,而且也沒有替換的問題。
最後,為了降低採用廠商的風險成本,
RAMBUS計畫推出GDDR3/XDR兩用的記憶體控制器,
這個就有機會造就出低階產品使用DDR,效能取向產品採用XDR的方案,
我相信這個對PCB成本普遍較高的NVIDIA而言應該頗有吸引力。

當然啦,RAMBUS光靠PS2和SONY就很夠活了,他們才不過是50人的小公司,
專門賣IP.... (高頻傳輸處理方面RAMBUS真的是業界最高水準)


引用:
作者anomaly
其實人眼對顏色的分辨是看色彩的波長。目前研究報告是說眼鏡看不同色階的程度不一樣。
分辨綠色最強(800-900階)﹐紅(500-600階)﹐藍(300-400階)。也就是說﹐我們目前RGB24/32bit不夠用。
小弟認為未來應該會朝向最後輸出10bit基本色為目標﹐RGB共30bit﹐RGBA﹐ 40bit。
運算過程方面可以用INT64或FP64 register﹐甚至更高做運算﹐最需要FP64應該是Z-buffer。
最後再輸出10bit per component color。
這樣就是很完美的系統了


喔,還真的40bit就差不多了....
(10bit per component的話就有1024階可用了)
感謝釋疑。

其實已知從NV2x(還是NV3x?)開始,
NVIDIA的GPU採用的RAMDAC已經能夠提供10bit輸出了,
ATI也是從R300開始就有了....
40bit RAMDAC是由Parhelia創始應該沒錯,因為Parhelia比R300和NV3x都早。
不過現在不能用10bit輸出的問題顯然是在OS上頭,還有DVI也不能用40bit。

64bit Z-Buffer嗎,這個倒是怪怪的...
因為我以為Int32 or FP32 Z-buffer應該就很夠了,
目前的24bit是不太夠,不過64bit好像就太多了,不然也可以用32bit W-buffer啊?

=====
至於前面提到的"照片般的3D"....
要看你怎麼定義,不然其實現在的3DMark05已經很嚇人了....
如果今天你拿6800那樣的產品來畫一個很小的場景,
那顯然是已經有能力弄到以假亂真;但是如果又要兼顧規模的話,那就應該還很吃力。

畢竟3D不是"模擬",是騙過眼睛的戲法....
所以還是會穿幫的,我們沒有無限快的CPU/GPU可用,顯然以後也做不出來。

anomaly 2004-10-01 12:22 PM

引用:
作者Reich 唐
是啊,經您一解說,目前8bit每個顏色只有255階,差的還真遠,難怪就算是Farcry、Doom3之流的遊戲,看起來還是像彩色筆畫的,連油畫的水準都搆不上! :jolin:


其實游戲看起來會像彩色筆是因為我們現有的色彩學和光學的數學公式並不是100%準確﹐也沒有很好的公式可以把電腦輸出的東西在不同照明環境(例如日光燈﹐外面的日光﹐鎢絲燈泡)調整給人眼看因人眼是經過幾百萬年的進化﹐我們眼睛對光線的刺激會自動調整。數位相機就是很好的例子﹐顏色偏差在不同環境是很大的問題。

這些概算公式移轉到realtime游戲又因速度需求﹐必須再簡化一次。所以游戲裡頭吐出來的顏色是an approximate color based on a poor approximation。

目前最好的3D科技是迪士尼卡通裡頭用pixar renderman算出來的, 不過並不是realtime,而且色彩還是一個poor approximation。

能導出公式﹐讓電腦算出跟真實世界一樣的場景的人可以得諾貝爾獎

Artx1 2004-10-01 01:08 PM

話說剛剛把數據再拿出來算了一下.....
我這張6800GT在GT3應該還不算遇到Fillrate bound。

因為等價fillrate( fps x resolution,這算概算啦....)的部份,
有下列的狀況:
1280x1024 x 17.1 = 22.4M pixel/s
1600x900 x 15.6 = 22.4M pixel/s
本來應該看來應該已經變成瓶頸了....(卡在22.4M)
但是,
1600x1200 x 13.7 = 26.3M pixel/s
又提高了.....

也就是說,1280x1024 -> 1600x900之間fillrate遇上的問題,
可能是因為Driver問題.... 所以才會有點怪怪的數據。

當然,如果完全卡在CPU的話,那應該會出現不管怎麼改變解析度,
fps count都完全一樣的狀況,所以既然提高解析度還是會往下掉,
代表GPU本身有一部分已經成為瓶頸了。

不過,首先是等價fillrate的部分沒有卡住的話,代表應該不是卡在pipeline or Shader,而可能是卡在記憶體的部份;
話說我們本來就知道NV40的fillrate(colorwrite)本身就超過記憶體頻寬可以負載的數量,
所以這也是合理的。(Colorwrite和texture會被RAMDAC用量排擠到)


====
倒是聽說66.51用下去的話,6800U的等價fillrate在1600x1200可以衝到32M/s去....
晚點換版試試看。


所有的時間均為GMT +8。 現在的時間是10:32 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2026。