PCDVD數位科技討論區 - 超微是線上３D遊戲之王？雙蕊K8＝K9?流行X87復古主義?

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)

- 效能極限 (https://www.pcdvd.com.tw/forumdisplay.php?f=18)

- - 超微是線上３D遊戲之王？雙蕊K8＝K9?流行X87復古主義? (https://www.pcdvd.com.tw/showthread.php?t=333605)

1. 仔細看網頁中最下方的說明, 這裡的 Latence 指的不是純粹延遲時間, 在目前 CPU 技術多管線的設計中, 不是單純算 cycles 而已, 而是指執行指令所需要的 Latence, 最好還是要加上 Throughput (狀態回復可以執行下一道指令的時間).

===運算量和運算時間才是主要的.等資料進來和狀態回覆只是性能的一部份.

但如果純以 SSE, 以前有人測過 Athlon 是比較慢的, 剛好印證.

===如果K7的SSE慢,那更證明只能用X87.不然怎樣說明天堂2之中P4這樣的怪事.

2. 維持整數運算並不難, 一個簡單的問題, 為什麼要浮點??如果運算結果 (螢幕座標)精度不要求到小數點以下的話, 為什麼不能整數化??而且 3D 建構模型 model 建立花費的時間, 是在開發時期的時候, 不是在遊戲執行期. 如果你不了解, 麻煩參考D3D、OpenGL 相關程式設計書籍, 自行摸索.

===在3D建模中任何的座標都是包含虛擬的Z軸的座標.我到現在也無法理解虛擬Z軸怎樣不用到浮點.得可怖的異形空間吧.建模不只是在遊戲設計初期要設定.遊戲之中也得有.不然你的Z座標座標怎樣算出來.像天堂2的人物有3千個頂點.都是3D的.整數是想像的.

我想扯開太遠了, 你要客觀, 就拿出更客觀的測試出來, 不要老是你啊你的, 會玩遊戲不代表就會設計遊戲, 也不是拿 x87 來唬人就算了. P4 的指令碼效率的確不如 Athlon, 只是 AMD 也是拿 PR Rate 在玩, 兩邊都各有問題.

===我可沒有扯遠.我還沒有想出不用浮點的即時3D座標秘訣.K7的PR把戲在單機版遊戲就玩不過FSB800-P4+865PE.這我也沒有否認.但網路遊戲就是P4怪怪的.我只有想到他的X87不是小廢.長大了的那種廢.

如果要講什麼 x87, 或是建構模型, 麻煩你對組合語言程式設計或是先去了解一下遊戲設計中 3D 模型的建構以及執行時期的差別, 再來做批評.

===用基本數學即可.呵呵.即時3D肯定要浮點數運算.另外超微也把整數乘法器做出來了.

0000000000

雲

Paris的核心跟Barton也不同，為什麼您說Prais是內建記憶體控制器的K7？

===比照P4E也叫P4的標準.所以我稱為加上記憶體控制單元的K7.不然去掉64位元技術,你怎樣稱呼--A64?

===P3-550吹冷氣超733去跑QIII會當.鬥龍600不吹冷氣一整天都不會當.都是VIA晶片組.

樓主顯示卡版吵夠了所以換區來吵嗎？

引用:

Originally posted by 妞妞

===用基本數學即可.呵呵.即時3D肯定要浮點數運算.另外超微也把整數乘法器做出來了
===比照P4E也叫P4的標準.所以我稱為加上記憶體控制單元的K7.不然去掉64位元技術,你怎樣稱呼--A64?

===P3-550吹冷氣超733去跑QIII會當.鬥龍600不吹冷氣一整天都不會當.都是VIA晶片組.

1.
PIII550 oc 733跑QuakeIII會當...:jolin:
您都沒用prime95的嗎？又不是能超就沒問題！:jolin:
您的Duron為何不超到800！ :jolin:
2.
原來基本數學就能用設計遊戲...那小學生來談不就好了！:jolin:
3.
Paris是K8 Core

原來基本數學就能用設計遊戲...那小學生來談不就好了

===所以我的小學數學想不出來怎樣讓Z座標變得不用浮點.

===問題是P3-550也會跳出流星蝴蝶劍.偶沒超啊.人家鬥龍600怎樣玩都沒事.你那流汗的頭怎樣弄的.

===沒有64位,基本是增加管線位階的K7.

你一直執著在 Z 軸做什麼??你既然知道 Z 軸是虛擬出來的, 那麼怎麼會不知道顯示在螢幕上的時候, 還是得轉成整數的實體座標？

跟你一直提醒過了, 程式的效能差距, 有很多原因, 不是只有 CPU 問題, 最常見的問題是程式的最佳化沒有做好. 就像以前有不少程式只對 SSE 做最佳化, 而沒有對 3D! Now 做處理一樣, 你是不是要說 Athlon 比 P4 差??

你拿天堂二亂比, 卻不知道為什麼, 扯什麼 x87 不 x87 的, FMUL 這行指令是做什麼？ cycles 多少？還跟我爭什麼 Latency .... 你最好去把我連結裡面有 IA32 指令集給我看懂, 再來跟我放話.

不用跟你解釋了, 朽木不可雕也, 連程式都沒寫過, 組合語言連一行程式都看不懂就在大放厥詞, 沒救了.

RogerShih~~~

好久沒見到這麼有深度的文章了

引用:

Originally posted by 妞妞

Paris的核心跟Barton也不同，為什麼您說Prais是內建記憶體控制器的K7？

===比照P4E也叫P4的標準.所以我稱為加上記憶體控制單元的K7.不然去掉64位元技術,你怎樣稱呼--A64?

===P3-550吹冷氣超733去跑QIII會當.鬥龍600不吹冷氣一整天都不會當.都是VIA晶片組.

唉..原來你是AMD請的命名師阿..真是受教了
要稱呼CPU為什麼名稱..似乎都讓你來命名好了
請你客觀一點吧..在還沒正式命名之前,請稱呼他為paris,ok?
不然你稱他為內建記憶體控制器的K7...我看你只能敢在這兒稱呼
你跟朋友提起時候也請稱呼他為閹割掉64bit指令集的K8

P3-550跑程式會當機嗎
ok,讓我告訴你
這只是........

.......純粹的功力不足吧

多多請教別人吧

//你一直執著在 Z 軸做什麼??你既然知道 Z 軸是虛擬出來的, 那麼怎麼會不知道顯示在螢幕上的時候, 還是得轉成整數的實體座標？

=====知道為甚麼要虛擬嗎.因為那是無法脫離的運算過程.整數的實體座標只是最後浮點數約略後的結果.這就是說這個虛擬過程必須用小數點.如果是用純整數運算,還是要通過整數乘法模擬浮點乘法.換言之浮點運算還是有的.要通過小數點的轉換過程.最後轉成實體座標只是最後結果.

//跟你一直提醒過了, 程式的效能差距, 有很多原因, 不是只有 CPU 問題, 最常見的問題是程式的最佳化沒有做好. 就像以前有不少程式只對 SSE 做最佳化, 而沒有對 3D! Now 做處理一樣, 你是不是要說 Athlon 比 P4 差??

=====你能規定SSE2-SSE3最佳化之後遊戲才能賣嗎.問題是市場上已經在賣了.其次天堂2是經過英特爾出錢的遊戲.英特爾不是傻瓜.錢不會白花..你說沒有作SSE2的最佳化?可惜沒用啊.網路環境就這樣.以你的邏輯去看更不可能在英特爾出錢的遊戲上只對超微作佳化,只有對 3D! Now 做處理根本不可能, 你是不是要承認P4 比 K7 差?

//你拿天堂二亂比, 卻不知道為什麼, 扯什麼 x87 不 x87 的, FMUL 這行指令是做什麼？ cycles 多少？還跟我爭什麼 Latency .... 你最好去把我連結裡面有 IA32 指令集給我看懂, 再來跟我放話.

=====看懂程式,不如遊戲跑不順的現實.這就像看不懂菜譜的人,卻可以知道菜不好吃.你知道為甚麼嗎. FMUL 是用整數乘法模擬浮點乘法.換言之浮點運算還是有的.當涉及到整數執行單元時,K7有3個完整管線整數執行單元,每個都能做所有的整數運算,所以K7擁有很強的整數功力.

=====舊式浮點計算,相對於向量浮點計算,K7以3個完整管線浮點執行單元FPUs型式來得到更多硬體功力,K7的3個浮點單元分別是FADD,FMUL和FSTORE,每個都是專門的單元,而且能夠執行特殊的浮點計算SIMD,如此K7能夠平行做不同型式的FP計算.

======FMUL -----FP multiplication, remainder, division, square-root ops · MMX integer ALU and multiplication ops · 3DNow! multiplications

//不用跟你解釋了, 朽木不可雕也, 連程式都沒寫過, 組合語言連一行程式都看不懂就在大放厥詞, 沒救了.

=====天堂2是針對英特爾處理器和NV卡最佳化的遊戲.你連程式都寫過, 組合語言每一行程式都看得懂,竟然不知道這個道理.

對你這種自做高明的白爛, 應該一開始就把你丟到鳥窩的白爛版去讓人看笑話.

有什麼評比是單純依靠個人的觀感的？這就像搞音響的說聲音好不好, 都是自己講的一樣, RMAA 沒有參考價值、所有規格都是廢物.

FMUL 你查了多久？你知道一個 FMUL 比 MUL 執行時間多了多少？你知不知道程式設計的效能原則是什麼？

我告訴你, 好的程式設計, 就是要盡量避開花費太多效能的地方, 最佳化工作, 不是支援什麼 SSE 還是 SSE2 而已, 還包括了許多項程式設計上可以改善的地方.

浮點跟整數差在哪裡??如果整數位元寬度夠 (如 64 Bit), 我運算照樣可以用整數而不見得要用浮點, SIMD 的資料寬度設那麼寬, 為的就是這個考量.

我從頭到尾, 只有一個重點, 你說天堂二上 P4 爆爛, 好像 x87 在跑, 有沒有實測數據證實??或者你有能力證明天堂二在 P4 上是跑 x87 而不是 SSE 或 SSE2 嗎？沒能力就給我閉嘴....扯什麼 x87 不 x87....有完沒完??

　　實測連接早給你了。又不是只有我這樣認為。天堂２就這樣。我自己看流星蝴蝶劍也是這樣。都是線上遊戲。K７超順。條件大家都一樣。

　　K７的X８７FPU其FMUL功能多了去。整數的乘法也能算。K７的FPU設計本來就是偏重以X８７的觀念為中心去思考的。P４的FPU是以SIMD為中心設計的。那是K７考慮到伺服器工作站與超級電腦市場。我說跑X８７也不能說錯。

　　問題在於天堂２,能把人物的３千個３D建模頂點都整數化嗎。要依你的說法該整數化才合理。問題是可能沒有啊。因為這圖畫得太細了。而且在空間中的移動要怎樣都整數化啊。那移動會一格一格的。可她的裙子還會隨風飄=.=""。你說的是２D或２.５D的扁扁形狀的遊戲吧。而且天堂２可能使用了Truform技術。

　　ATi的Truform是一項特殊且實用的新技術，無論3D遊戲有多新或多舊，這項技術都可以讓其有辦法呈現高層次的平面（higher order surfaces）。讓妞妞們的玉腿和臉蛋都珠圓玉潤。

　　它可以由平面的三角形做出弧面。三角形本來就是平面的。ATi這項功能可以利用各頂點的法線－平面向量,來描出三角形，並算出由許多三角形拼出的弧面。這項步驟也稱作「鑲裝」tesselation。

　　而Truform技術則可以調整由原來平面的三角形裡，再產生出多少新,也當然更小的三角形。如果一個三角形要被許多小三角形取代，那麼既然繪圖管線需要處理更多小三角形，想當然效能會有點降低。不過Truform技術的賣點，就是藉著加工過程,雖然不是每個平面都有必要被處理,可以讓3D物體看起來更真實。

　　可以使用在任何3D遊戲上而無論遊戲的新舊，和NVIDIA的技術比起來也顯得聰明多了。

　　在這個由許多三角形拼出的弧面上,這要維持整數運算有點難。處理器總是要協助建立這些頂點吧。

　　這也很可能是ATI８５００甚至９２００SE,都比GF3鈦２００與FX５２００還要順的一個原因。

　　至於程式設計可以改善的地方,也是P４和K７之間的公平競爭。就像壞跑道對這兩輛車都一樣是公平的。

　　另外３２位的浮點乘法可能比６４位整數運算要快。如果是依照你SIMD的設想,因為K７可以跑２個３２位浮點乘,所以會快。但快得不多。因為P４的SSE２是４個３２位浮點數並行。所以P４在SSE２支援度佳的地方可以以接近時脈比例的差距拉開彼此。這是我認為不像跑SIMD的原因。

　　另外因為K７的加法乘法是分開的,所以是２個３２位浮點乘和２個３２位浮點加。還省掉一個移除小數點的動作。而P４是作在一起的。