PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   效能極限 (https://www.pcdvd.com.tw/forumdisplay.php?f=18)
-   -   超微是線上3D遊戲之王?雙蕊K8=K9?流行X87復古主義? (https://www.pcdvd.com.tw/showthread.php?t=333605)

妞妞 2004-05-17 10:10 AM

SIMD 不是拿來做純浮點運算的, 在一般3D遊戲裡, 長整數的運算比浮點快的多, 是以一般演算法會盡量以長整數取代浮點的複雜運算, 這也是 SIMD 的最大長處.

===SIMD是有浮點與整數運算時候的不同。所以我才會說有浮點的SIMD。至於長整數運算的情況你可以說說嗎。建模的時候怎樣用長整數的SIMD?那為甚麼我會遇上流星蝴蝶劍的情況呢。


你知不知道我也是在寫遊戲的??

===那你就說實況吧。用K7為何會比較順。

00000000000000



裝Prascott與Northwood

===核心不一樣。本質不同。

===用網路遊戲是真實環境。單機板可以控制變數。就像賽道可以控制變數。問題是真實環境才是真的。軟體要是沒有最佳化是不是我們不許玩啊。

RogerShih 2004-05-17 10:51 AM

第一、你根本沒把你測試的環境一一表列出來, 要我解釋什麼?叫你測兩套系統的 benchmark 你又不測, 只會一口咬定 XP 跑天堂比較快, 還要人解釋什麼?

第二、從程式的觀點來看, XP跟P4之間的效能差異, 不是只有取決於 CPU 本身, 因素很多, 例如: 1. 程式最佳化是否都有做, 是否針對不同 CPU 指令集做不同版本的建立. 2. 作業系統環境的設定差異 3. 不同作業系統的影響. 4. 驅動程式....etc



我從 AMD 代工 286 開始就愛用 AMD, 286-20、386-40、486DX2-66、DX4、K6-300、K7-Athlon 600~900、XP1700+、Barton 2500+ 到現在, 除了曾接收過朋友的 Celeron 300 oc 450, 我自用的都是 AMD. 可是我看到你這種為了吹捧 AMD 的人, 就覺得有氣, 別讓人覺得 AMD Fans 都是這種水準, ok??

RogerShih 2004-05-17 11:23 AM

回答程式的問題.

不管是不是 SIMD, 浮點運算比長整數運算花時間是可以肯定的, 如果懂組合語言, 看指令執行 cycles, 浮點相關運算都很花時間, 即使是整數運算, 相乘/相除也比相加、相減要多上許多的執行時間, 所以寫組合語言時, 手動最佳化的方法中, 就有例如, 能用相加/相減的, 就少用相乘/相除, 如果相乘/相除的母數是 2、4、8、16 這種數字的話, 就用位移指令, 為的就是 效率 -

就算有了 SIMD 也一樣.

3D模型的建立, 螢幕的座標系統是最終的輸出, 但螢幕上的座標, 可是沒有所謂的浮點, 都是整數, 換句話說, 不管你頂點怎麼算、模型怎麼轉, 最終都是要轉成螢幕座標, 顯示在螢幕上, 都是整數.

就程式考量而言, 既然輸出最終必定是整數, 那麼如果能避免浮點運算過多的效能降低, 不但保持程式的一致, 也容易維護, 效率也會比較好.

說真的, 如果在程式期間才建模, 那是當然慢, 所以多數都是在開發期間就建模, 將資料預先產生好, 程式再以完整資料在遊戲中重建模型. 這之中當然有很多學問, 做的不好的, 就跟我前陣子聽一位朋友說國內某廠商寫出來的作品, 3D 效能很差, 差在哪??差在處理 3D 模型的程序上.

下面連結有一些 MMX/SSE/3D!Now 的資料, 我連結的是MMX/iSSE指令集在不同CPU所需的執行時間. 很有趣的, P3 裡指令幾乎都比 athlon 還快, 你要不要來一顆??

http://www.tommesani.com/MMXLatency.html

妞妞 2004-05-17 12:08 PM

1至於數據是看這個網上的數據和自己使用環境的結果。是這個網的網友的測試。我的姪子用鬥龍600玩雷神之錘3都沒當過。我的P3-733只要超過2小時就當。我還開冷氣。他沒開。

2我看的一些遊戲卡的資料都是說要跑浮點運算。這躲不掉。顯卡的頂點運算也是算浮點的。你說可以用整數代替---我也是很感到很新鮮。天堂2一個人物要用上3千個頂點。都是可以整數化啊。難以想像。

3你拿的是運算時候遲延的資料。

4你繼續說。

RogerShih 2004-05-17 01:03 PM

我看你提的例子都有限, 你看過那個網站、那本雜誌是拿天堂二來當測試平台的?

還有, 你知不知道遊戲 Render 是預先就已經建立好的, 也就是說, 你在玩天堂二的時候, 模型都已經建立好並且已經固定, 不需要再 render, 遊戲作的並不是建構, 而是依照算好的模型資料貼出來?

螢幕座標系統都是整數, 你是看不懂這句話是不是??連我說的程式技術都不懂....

簡單的題目, 整數跟浮點數, 在記憶體中儲存的格式是如何?差別在哪?

這是初學組合語言要學的基本資料型別知識, 先把你知道的說來聽聽....

RogerShih 2004-05-17 01:06 PM

http://developer.intel.com/design/p...uals/253667.htm

這是 Intel IA-32 指令集官方資料, 包括所有組合語言指令說明, 當然也有 MMX/SSE/SSE2, 不過, 你要看的懂才行.

這裡的 Latency : the number of clock cycles that are required to complete the execution of all of the µops that form an instruction.

別跟我說你看不懂英文.

RogerShih 2004-05-17 01:12 PM

還有, 你看過那張顯示卡的座標系統是 x - 1.0121321321 y-3.2321321 這樣子的??

妞妞 2004-05-17 01:59 PM

http://www.pcdvd.com.tw/showthread....t=%A4%D1%B0%F32

是網友測的。這當然不合你的要求。但我只是由我的使用經驗和天堂2去看的。

1Latency : 指令集的性能不完全是由遲延決定吧。延遲只是性能的一部份。難道你認為,這個SSE遲延比SSE2還要小,那SSE2就是倒退了?

2建模。經過移動後的電腦內部虛擬頂點位置還是整數的嗎?銀幕輸出是整數的。但實際上在內部跑的時候會變化,最後才又到銀幕上,而虛擬空間也是3D的,有深度的Z軸,這怎樣維持整數?

3呵呵。不好意思。

雲影 2004-05-17 02:24 PM

引用:
Originally posted by 妞妞
至於數據是看這個網上的數據和自己使用環境的結果。是這個網的網友的測試。我的姪子用鬥龍600玩雷神之錘3都沒當過。我的P3-733只要超過2小時就當。我還開冷氣。他沒開。


在下覺得是您的問題,在下也用PIII450玩過QuakeIII也沒有過當機的情形!

引用:
Originally posted by 妞妞 核心不一樣。本質不同。


Paris的核心跟Barton也不同,為什麼您說Prais是內建記憶體控制器的K7?

引用:
Originally posted by 妞妞 看成績啊。你不是喜歡說我主張1+1嗎。要是都跑SSE或SSE2。差距哪會差那樣多。頂多是使用UT引擎或是像新蘿拉黑暗天使那樣的大量頂點遊戲的差距而已。


原來您是看成績[SIZE=big]推斷[/SIZE],您很肯定您的推斷是對的?
:jolin:

RogerShih 2004-05-17 02:29 PM

引用:
Originally posted by 妞妞
http://www.pcdvd.com.tw/showthread....t=%A4%D1%B0%F32

是網友測的。這當然不合你的要求。但我只是由我的使用經驗和天堂2去看的。

1Latency : 指令集的性能不完全是由遲延決定吧。延遲只是性能的一部份。難道你認為,這個SSE遲延比SSE2還要小,那SSE2就是倒退了?

2建模。經過移動後的電腦內部虛擬頂點位置還是整數的嗎?銀幕輸出是整數的。但實際上在內部跑的時候會變化,最後才又到銀幕上,而虛擬空間也是3D的,有深度的Z軸,這怎樣維持整數?

3呵呵。不好意思。


1. 仔細看網頁中最下方的說明, 這裡的 Latence 指的不是純粹延遲時間, 在目前 CPU 技術多管線的設計中, 不是單純算 cycles 而已, 而是指執行指令所需要的 Latence, 最好還是要加上 Throughput (狀態回復可以執行下一道指令的時間).

但如果純以 SSE, 以前有人測過 Athlon 是比較慢的, 剛好印證.

2. 維持整數運算並不難, 一個簡單的問題, 為什麼要浮點??如果運算結果 (螢幕座標)精度不要求到小數點以下的話, 為什麼不能整數化??而且 3D 建構模型 model 建立花費的時間, 是在開發時期的時候, 不是在遊戲執行期. 如果你不了解, 麻煩參考D3D、OpenGL 相關程式設計書籍, 自行摸索.


我想扯開太遠了, 你要客觀, 就拿出更客觀的測試出來, 不要老是你啊你的, 會玩遊戲不代表就會設計遊戲, 也不是拿 x87 來唬人就算了. P4 的指令碼效率的確不如 Athlon, 只是 AMD 也是拿 PR Rate 在玩, 兩邊都各有問題.

如果要講什麼 x87, 或是建構模型, 麻煩你對組合語言程式設計或是先去了解一下 遊戲設計中 3D 模型的建構以及執行時期的差別, 再來做批評.


所有的時間均為GMT +8。 現在的時間是11:43 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。