PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 顯示卡討論區
帳戶
密碼
 

  回應
 
主題工具
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by 宗毛
這個報告的意義不是要抓nv作弊
是因為之前cho有說A.D.破壞遊戲效能
我只是把裝了A.D.後的不同show給各位看而已
要談到"扁"ati,我還比較早測ati的antidetector不是嗎?
還是你會認為Unwinder根本就是要讓nv難看?

我也不知道扁nv對我有什麼好處,測這個東西好像不是一件很輕鬆的事?


well, 我是覺得Unwinder放出AD這件事本身的確是讓ATi 與NV難看了, 不論他的原意如何.
至於對誰有啥好處, 我倒覺得做這種事情本身就不需論其好處, 只是想不想做....
評論之類的事情就放旁人去吧.

ATi 在R200的時候會有45度的線條AF會失效的問題, R300似乎沒這個問題, 而且R300的AF可以達到16x.
而NV2x和NV3x能夠達到的AF倍率一樣是8x, 至於NV2x會有使用AF變慢的情形, 其實從NV15開始就這樣了.
當初NV15的時候, 雖然每條pipeline有兩個TMU, 但是打開Tilinear/Anisotropic Filtering的時候, fillrate都會減半;
而NV10沒有這個問題(不過NV10每個pipeline只有一個TMU).

最簡單的推論是NV15~NV2x的每個TMU在每個時脈都只能讀取4個texels, 而因為tilinear需要8個texels, 於是效率就減半了.
1:2 AF需要16個, 效率再減半.... 於是我們會發現, 因為fillrate受到架構問題限制, NV2x的AF效率變得無法和R300競爭.
NV3x 的架構AF效能如果能提高, 理應就是透過改善這個情形得來的.

宗毛這篇是有提出
"NV3x的AF會比NV2x快的原因是因為Driver把NV3x的部分動作做了一些簡化,讓效能提高"
的說法. 直覺會導向
"NV3x與NV2x之間的AF硬體實際效能差異不大"
的論調, 關鍵就在於有沒有改掉這個問題.
至於心態部分, 至少我在GZeasy裡面看到了宗毛"NV3x's AF is suck"的言論,
於是我做出了宗毛可能有"針對這件事情貶低nVIDIA的企圖"的推論.

業界的確因為競爭激烈而產生了嚴重的惡性競爭風氣....
同時期還有Trident XP4的狀況, Trident也堅稱他們的optimize是理所當然的做法,
不過他們卻造成了明顯可見的材質模糊, 於是早早就被抓包,
不過在nVIDIA vs ATi 的大環境下, 小廠出現的大問題其實也不會被當成大問題重視.

關鍵仍然在於optimize與cheating的區別.

----
AnisoBooster, RivaTuner的附屬scripting之一.
作用這部分直接引原文.

The D3D patch will unlock D3D aniso optimizations for pre-GF4 cards.
The OGL patch will increase anisotropic performance in OGL. THIS is a MUST DO patch.
     
      

此文章於 2003-07-25 12:13 AM 被 Artx1 編輯.
舊 2003-07-24, 11:38 PM #21
回應時引用此文章
Artx1離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
我想你真的是誤會我的意思了
我會說"nv3x的af演算法和nv2x的差別?"我是真的不懂想看看你知不知道
至於"不過我是覺得很奇怪,為何要提升af速度是用降低品質的作法?"
我的意思是,nv在我測的nv3x上無疑的是存在detect機制(沒錯吧?)
detect到ut2k3這個application就"改變"(好吧,我還是不要用降低這個詞)貼圖的品質
而速度明顯地比44.03ad(看來和9700相近的品質)來得快許多呢?
原因到底為何?(請釋疑?)

而在下在gzeasy說的那句話的意思你從我的custom demo測試應該就可以發現
既使不裝AD(lower quality?),5900nu仍然無法完勝一年前推出的9700p
以我對nv的期望,這種成績太糟了
(對了,根據上次firingsquad的custom demo測試,更高解析度5900nu只會輸得更慘)

我在這篇討論中我沒記錯的話我沒有提到"作弊"兩個字吧?
我只是很好奇為什麼你的態度好像跟cho有點類似
不願意正面看待這個問題
還是就無所謂呢?
希望我們能夠就這個問題討論,而不是懷疑我這個測試員有RPWT

算了,我才剛吃完晚餐(沒錯,正是晚餐)回來,
現在就來試c3.6 w AD.

--
給你參考
http://bbs.gzeasy.com/index.php?showtopic=36339&st=0

引用:
Originally posted by Artx1
well, 我是覺得Unwinder放出AD這件事本身的確是讓ATi 與NV難看了, 不論他的原意如何.
至於對誰有啥好處, 我倒覺得做這種事情本身就不需論其好處, 只是想不想做....
評論之類的事情就放旁人去吧.

ATi 在R200的時候會有45度的線條AF會失效的問題, R300似乎沒這個問題, 而且R300的AF可以達到16x.
而NV2x和NV3x能夠達到的AF倍率一樣是8x, 至於NV2x會有使用AF變慢的情形, 其實從NV15開始就這樣了.
當初NV15的時候, 雖然每條pipeline有兩個TMU, 但是打開Tilinear/Anisotropic Filtering的時候, fillrate都會減半;
而NV10沒有這個問題(不過NV10每個pipeline只有一個TMU).

最簡單的推論是NV15~NV2x的每個TMU在每個時脈都只能讀取4個texels, 而因為tilinear需要8個texels, 於是效率就減半了.
1:2 AF需要16個, 效率再減半.... 於是我們會發現, 因為fillrate受到架構問題限制, NV2x的AF效率變得無法和R300競爭.
NV3x 的架構AF效能如果能提高, 理應就是透過改善這個情形得來的.

宗毛這篇是有提出
"NV3x的AF會比NV2x快的原因是因為Driver把NV3x的部分動作做了一些簡化,讓效能提高"
的說法. 直覺會導向
"NV3x與NV2x之間的AF硬體實際效能差異不大"
的論調, 關鍵就在於有沒有改掉這個問題.
至於心態部分, 至少我在GZeasy裡面看到了宗毛"NV3x's AF is suck"的言論,
於是我做出了宗毛可能有"針對這件事情貶低nVIDIA的企圖"的推論.

業界的確因為競爭激烈而產生了嚴重的惡性競爭風氣....
同時期還有Trident XP4的狀況, Trident也堅稱他們的optimize是理所當然的做法,
不過他們卻造成了明顯可見的材質模糊, 於是早早就被抓包,
不過在nVIDIA vs ATi 的大環境下, 小廠出現的大問題其實也不會被當成大問題重視.

關鍵仍然在於optimize與cheating的區別.

----
AnisoBooster, RivaTuner的附屬scripting之一.
作用這部分直接引原文.

The D3D patch will unlock D3D aniso optimizations for pre-GF4 cards.
The OGL patch will increase anisotropic performance in OGL. THIS is a MUST DO patch.
 
舊 2003-07-25, 01:03 AM #22
回應時引用此文章
宗毛離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by 宗毛
我想你真的是誤會我的意思了
我會說"nv3x的af演算法和nv2x的差別?"我是真的不懂想看看你知不知道
至於"不過我是覺得很奇怪,為何要提升af速度是用降低品質的作法?"
我的意思是,nv在我測的nv3x上無疑的是存在detect機制(沒錯吧?)
detect到ut2k3這個application就"改變"(好吧,我還是不要用降低這個詞)貼圖的品質
而速度明顯地比44.03ad(看來和9700相近的品質)來得快許多呢?
原因到底為何?(請釋疑?)


OK, 那我就事論事了, 雖然我覺得你的問題問辭還是怪怪的.
基本上, NV2x和NV3x的AF演算法應該是完全一樣的, 只差在NV3x應該能把這個演算法"跑得比較快", 而我覺得這個測試目標應該是測AF的部分到底有沒有改善performance.

另一個要點是AF演算法.
http://hotball.webhop.net/mipmap/page_4.html
就這個樣子了, 我沒看過更淺顯的說明了.


而你的問題是
1. 你認為NV3x的Driver有detect UT2K3啟動與否的動作
2. 速度看起來經過AD的Driver得到了和9700相近的品質, 而速度比不動到Driver本身慢
3. 你想知道上述現象原因為何
我現在是直接和你講啦, 你這樣的確可以說nVIDIA的AF部分有偵測性的省工.
不知道你想知道的是不是這個呢?

引用:
而在下在gzeasy說的那句話的意思你從我的custom demo測試應該就可以發現
既使不裝AD(lower quality?),5900nu仍然無法完勝一年前推出的9700p
以我對nv的期望,這種成績太糟了
(對了,根據上次firingsquad的custom demo測試,更高解析度5900nu只會輸得更慘)

我在這篇討論中我沒記錯的話我沒有提到"作弊"兩個字吧?
我只是很好奇為什麼你的態度好像跟cho有點類似
不願意正面看待這個問題
還是就無所謂呢?
希望我們能夠就這個問題討論,而不是懷疑我這個測試員有RPWT


我倒覺得我的態度沒特別的問題.... 反倒是你言外之意頗明顯的.
在我看起來, 你的確是在積極地想"證明"AD前後的5900的AF效能有落差.
而且非常積極地要求他人認同這個現象; 我必須要說, 我是認同你的實驗結果的.

至於RPWT, 我又不知道這個字是啥意思了.

至於cho的部分, 我也覺得他這篇觀點有點問題.
Optimize理應維持在"不改變工作量與演算法"的前提下進行,
雖然直接把整個panel拆開來丟給user有點不負責任, 對user而言反而會造成不便;
但是替user做決定就有"侵犯User權利"的問題了.
除非nVIDIA做的事情是USER光靠調整設定值也做不出來的精細optimize,
比如說像cho桑所舉出來, 讓人幾乎分不出差異的screen shot.

在我的觀念中, nVIDIA可能適合去做類似在專業軟體的時候做的事情:
"設出一個D3D Game用的設定值preset集"
就像專業軟體的時候有optimize preset可以選擇那樣, 要不要那樣選擇應該交給user決定.

此文章於 2003-07-25 02:25 AM 被 Artx1 編輯.
舊 2003-07-25, 02:18 AM #23
回應時引用此文章
Artx1離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
依約擷9700+c3.6ad給各位看





可以發現和沒裝ad比較並沒有差別
但是中間那條走道在performance和quality都是一樣
到底是為什麼?

-----------
說真的,我這一系列測下來真的是很不爽ati的driver
nv反而讓我覺得很棒
因為nv的driver可以不關閉遊戲,直接更改aa/af的設定,並且會立即生效
ati的driver很糟榚,一定要結束遊戲不然不會生效
(有時候明明已經關了再改還是不生效! >_< )
而且一定要重開機才能解決這個問題,不然怎麼調都沒用

我本來還要擷noaa/noaf的圖,還有測一下custom demo
現在又要去重開機了 >_< >_<
舊 2003-07-25, 02:24 AM #24
回應時引用此文章
宗毛離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
引用:
Originally posted by Artx1
OK, 那我就事論事了, 雖然我覺得你的問題問辭還是怪怪的.
基本上, NV2x和NV3x的AF演算法應該是完全一樣的, 只差在NV3x應該能把這個演算法"跑得比較快", 而我覺得這個測試目標應該是測AF的部分到底有沒有改善performance.

另一個要點是AF演算法.
http://hotball.webhop.net/mipmap/page_4.html
就這個樣子了, 我沒看過更淺顯的說明了.


而你的問題是
1. 你認為NV3x的Driver有detect UT2K3啟動與否的動作
2. 速度看起來經過AD的Driver得到了和9700相近的品質, 而速度比不動到Driver本身慢
3. 你想知道上述現象原因為何
我現在是直接和你講啦, 你這樣的確可以說nVIDIA的AF部分有偵測性的省工.
不知道你想知道的是不是這個呢?



我倒覺得我的態度沒特別的問題.... 反倒是你言外之意頗明顯的.
在我看起來, 你的確是在積極地想"證明"AD前後的5900的AF效能有落差.
而且非常積極地要求他人認同這個現象; 我必須要說, 我是認同你的實驗結果的.

至於RPWT, 我又不知道這個字是啥意思了.

至於cho的部分, 我也覺得他這篇觀點有點問題.
Optimize理應維持在"不改變工作量與演算法"的前提下進行,
雖然直接把整個panel拆開來丟給user有點不負責任, 對user而言反而會造成不便;
但是替user做決定就有"侵犯User權利"的問題了.
除非nVIDIA做的事情是USER光靠調整設定值也做不出來的精細optimize,
比如說像cho桑所舉出來, 讓人幾乎分不出差異的screen shot.

在我的觀念中, nVIDIA可能適合去做類似在專業軟體的時候做的事情:
"設出一個D3D Game用的設定值preset集"
就像專業軟體的時候有optimize preset可以選擇那樣, 要不要那樣選擇應該交給user決定.


有關af演算法的問題,我記得有聽過前輩說過nv geforce基本上是一個堆疊上來的架構
(我是不知道這樣說對不對啦^^a)
而我會有疑問是好奇af在nv3x上是否有完全異於nv2x的硬體去做
如果他們是一樣的話,除了提升頻率外我不知道有別的方法可以提升速度?
(r3xx和r200應該在存在非常大的相異點吧?…這也是我猜的-_-|||)

我的確是覺得nv用省工增加速度,
但是我已經盡量試圖不要在我一開始的文章給人加上先入為主的觀念(看來是失敗了XD)
因為cho又說nv是用不同的方法達到8x的quality
""NVIDIA的处理方式是伪三线性过滤,抖动。""
但是我就是不認為original 44.03的8xaf看起來像8x
我也怕自己說錯,所以也不太用篤定的字眼下結論
但是cho似乎不願正面回答我"nv如何用那種方法達到加了ad後的品質?"……sigh

--
RPWT,這可是在cn那邊的論壇學來的呀!
舊 2003-07-25, 02:43 AM #25
回應時引用此文章
宗毛離線中  
NEC9821
Junior Member
 
NEC9821的大頭照
 

加入日期: Jan 2002
文章: 799
[Artx1]兄的意思是不是NV的DRIVE對遊戲"優化"呢?不過UNREAL的製作公司不是和NV關係不錯嗎?怎麼會有"令人玩味"的缺失!不過被拿來討論也是應該,不然花的錢越來越多(中階也要6~8千元!!這不是以前高階價格嗎!),卻還擔心有毛病....真是 !!
呼~~~好多專有名詞~~~好累好累~~~
舊 2003-07-25, 02:50 AM #26
回應時引用此文章
NEC9821離線中  
Artx1
Master Member
 

加入日期: Jun 2002
您的住址: 耗電量頗高的地方.
文章: 1,959
引用:
Originally posted by 宗毛
有關af演算法的問題,我記得有聽過前輩說過nv geforce基本上是一個堆疊上來的架構
(我是不知道這樣說對不對啦^^a)
而我會有疑問是好奇af在nv3x上是否有完全異於nv2x的硬體去做
如果他們是一樣的話,除了提升頻率外我不知道有別的方法可以提升速度?
(r3xx和r200應該在存在非常大的相異點吧?…這也是我猜的-_-|||)

我的確是覺得nv用省工增加速度,
但是我已經盡量試圖不要在我一開始的文章給人加上先入為主的觀念(看來是失敗了XD)
因為cho又說nv是用不同的方法達到8x的quality
""NVIDIA的�z理方式是�三𠄌性�e𥹉,抖�。""
但是我就是不認為original 44.03的8xaf看起來像8x
我也怕自己說錯,所以也不太用篤定的字眼下結論
但是cho似乎不願正面回答我"nv如何用那種方法達到加了ad後的品質?"……sigh

--
RPWT,這可是在cn那邊的論壇學來的呀!


要達到8x AF的品質很簡單啊, 8x AF照算就好了.

------
架構啊....

well, 整個nVIDIA的產品架構的確是疊上來的, 如果你去看過Register Combiner(NV1x~NV3x的Pixel Pipeline底層架構), 你就能很確實地體會到這點.

http://eji7a045.hp.infoseek.co.jp/GPU/T&C_GL.jpg
OpenGL本身的fragment處理架構

http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV10.jpg
NV10
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV20.jpg
NV20
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV30.jpg
NV30

很像吧?

雖然實際上的架構不知道是怎樣, 但是nv_register_combiner的確是NV1x以來到現在NV3x, nVIDIA最重要的處理架構. 也是唯一能夠完全發揮nVIDIA架構硬體效能的資源..... 所以應該和硬體架構實際設計有不小的關係. 雖然用的人真的很少.(汗)

不過AF的部分要怎麼加速, 這個我前面有講到.... 基本上和TMU的單時脈讀取能力有關係.

雖說NV3x最大的設計差異是將TMU從color blending(著色單元)給分開出來, 但是其實這部分NV1x就開始做了, NV1x~NV2x與NV3x最大的差異在於沒辦法將color blending的結果回送給TMU, NV3x主要就是加入了這一點而已. R200已經具備了類似的能力, 但是只能回送一次.(PS1.4), 能回送幾次基本上只是控制的問題.

R300其實也是有類似的特性, 比如說R300一個時脈內能同時做Texture Addressing和color blending, 就是因為這兩個單元是分離的.

所以現在的重點就在於, 要提高AF的能力, 有兩個努力方向.
1. 必須增加TMU的規模, 以強化AF所需的Texel讀取能力
2. 在1的前提下, 增加記憶體頻寬以應付增加的記憶體吞吐量需求
看起來NV30有做到1, 只是不知道改善多少; 而NV35則做到了2.

總之, 並不是因為架構一路疊上來, 所以只能靠提高時脈來增加效能的喔.

此文章於 2003-07-25 03:17 AM 被 Artx1 編輯.
舊 2003-07-25, 03:05 AM #27
回應時引用此文章
Artx1離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
我剛剛對9700p,c3.6 w/ ad做了custom demo的測試
同樣的設置就不多說了

NoAA/NoAF 51.746
4xAA/NoAF 45.706
NoAA/8XAF 48.819
4xAA/8xAF 39.460

之前的測試成績(抱歉,我已經懶得再把這個擺進去了,各位知道c3.6上了ad後沒有差異就好了 )



補圖:


附帶一提
我第一頁有貼ut2k3的設定
其中有一個Trilinear Filtering
我把這個取消勾選,但是用9700p+c3.6ad看firstcoloredmip居然一模一樣
(NoAA/NoAF)
要不要做三線過濾不是從那個去調整嗎?
舊 2003-07-25, 03:27 AM #28
回應時引用此文章
宗毛離線中  
宗毛
Elite Member
 
宗毛的大頭照
 

加入日期: Mar 2002
您的住址: 台北市
文章: 4,505
真是多謝了
--
不過說真的,nv35的af看來和nv30效能差異好像真的是不大(同時脈)
我實在是不太清楚多出那麼多的memory bandwidth到底有沒有用
我自己是不覺得nv30-->nv35的瓶頸會是memory bandwidth…

引用:
Originally posted by Artx1
要達到8x AF的品質很簡單啊, 8x AF照算就好了.

------
架構啊....

well, 整個nVIDIA的產品架構的確是疊上來的, 如果你去看過Register Combiner(NV1x~NV3x的Pixel Pipeline底層架構), 你就能很確實地體會到這點.

http://eji7a045.hp.infoseek.co.jp/GPU/T&C_GL.jpg
OpenGL本身的fragment處理架構

http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV10.jpg
NV10
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV20.jpg
NV20
http://eji7a045.hp.infoseek.co.jp/GPU/T&C_NV30.jpg
NV30

很像吧?

雖然實際上的架構不知道是怎樣, 但是nv_register_combiner的確是NV1x以來到現在NV3x, nVIDIA最重要的處理架構. 也是唯一能夠完全發揮nVIDIA架構硬體效能的資源..... 所以應該和硬體架構實際設計有不小的關係. 雖然用的人真的很少.(汗)

不過AF的部分要怎麼加速, 這個我前面有講到.... 基本上和TMU的單時脈讀取能力有關係.

雖說NV3x最大的設計差異是將TMU從color blending(著色單元)給分開出來, 但是其實這部分NV1x就開始做了, NV1x~NV2x與NV3x最大的差異在於沒辦法將color blending的結果回送給TMU, NV3x主要就是加入了這一點而已. R200已經具備了類似的能力, 但是只能回送一次.(PS1.4), 能回送幾次基本上只是控制的問題.

R300其實也是有類似的特性, 比如說R300一個時脈內能同時做Texture Addressing和color blending, 就是因為這兩個單元是分離的.

所以現在的重點就在於, 要提高AF的能力, 有兩個努力方向.
1. 必須增加TMU的規模, 以強化AF所需的Texel讀取能力
2. 在1的前提下, 增加記憶體頻寬以應付增加的記憶體吞吐量需求
看起來NV30有做到1, 只是不知道改善多少; 而NV35則做到了2.

總之, 並不是因為架構一路疊上來, 所以只能靠提高時脈來增加效能的喔.
舊 2003-07-25, 03:38 AM #29
回應時引用此文章
宗毛離線中  
alexlau
*停權中*
 

加入日期: Jan 2002
文章: 1,458
引用:
Originally posted by 宗毛
依約擷9700+c3.6ad給各位看





可以發現和沒裝ad比較並沒有差別
但是中間那條走道在performance和quality都是一樣
到底是為什麼?

-----------
說真的,我這一系列測下來真的是很不爽ati的driver
nv反而讓我覺得很棒
因為nv的driver可以不關閉遊戲,直接更改aa/af的設定,並且會立即生效
ati的driver很糟榚,一定要結束遊戲不然不會生效
(有時候明明已經關了再改還是不生效! >_< )
而且一定要重開機才能解決這個問題,不然怎麼調都沒用

我本來還要擷noaa/noaf的圖,還有測一下custom demo
現在又要去重開機了 >_< >_<


呵呵~現在您是否還堅持您當初的想法?
目前ATI 跟 NV 的撰寫DRIVER功力是"平分秋色"呢?
舊 2003-07-25, 03:40 AM #30
回應時引用此文章
alexlau離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是04:26 AM.


vBulletin Version 3.0.1
powered_by_vbulletin 2025。