PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   效能極限 (https://www.pcdvd.com.tw/forumdisplay.php?f=18)
-   -   關於Super PI與Prime95二三事 (https://www.pcdvd.com.tw/showthread.php?t=285681)

argentala 2003-12-31 04:20 PM

小弟的一點點粗淺觀察[用samurise系統監控程式]與感想.....

super pi 執行1m時 固定佔記憶體12mb
所執行的是一個要算出常數pi 到第 1 million 個小數點
共需19個疊代…
循序一直代到結果出來為止,所需時間約30秒∼2分鐘不等
超頻玩家大概都在1分鐘內∼∼

一執行起頭的16mb檔案應該只是先劃分出檔案空間,並非直接寫入那麼多
以系統監測程式觀察到的是 從執行到完成 磁碟一直在進行約250∼350kb/s
的寫入動作 沒有磁碟讀取動作。


prime 95 執行benchmark 占記憶體由9mb∼21mb (隨著fft length越大佔越多)
他不像super pi一樣,而是共執行了11個不一樣的算式( 以23.71版來說 )
並非是執行一個大型project計算的過程(經過)

分別是73次疊代(?) at 384k FFT length
一直到13次疊代 at 2048k FFT length

每次計算 從執行到完成的時間約都不到零點二秒(best time)

執行時每兩秒約有一次4kb/s的寫入 應該是在寫紀錄檔(猜測)
一樣沒有磁碟讀取的動作。

prime 95 說明檔關於benchmark的地方如下
The Benchmark choice times the program on several FFT lengths. You can
then compare your computer's speed to others list at
http://www.mersenne.org/bench.htm


FFT length是什麼 查google不太明白 這裡是比較像的相關網頁
究竟FFT是什麼常數呢? 2048k長度 =2m長度 但是可以在0.2秒內算出來??

觀察一下 可以發現
第一次 73疊代 at 384k 相乘 73*384=28032
第二次 63疊代 at 448k 63*448=28224
第三次 55疊代 at 512k 55*512=28160
∼∼
一直到 15 * 1792=26880
最後一次 13*2048 = 26624
感覺上好像是一直在算同一個數字(或結果),而以不一樣的FFT length來計算。

然後是計算結果寫的best time推斷應該是每次疊代中最短的那一次的時間,
不過若是疊代,像super pi的疊代每個疊代所需的時間都不太一樣(疊代的算式應該也不太一樣),
紀錄下哪次疊代花的時間最短,感覺上沒有什麼特殊意義………
所以prime95的有點不像疊代,有點像重複計算,即:第一次 計算75次 384k FFT length這個數字,時間最短的一次花了??秒那樣,所以上面的疊代才打了(?)

如果是這樣 那上面那個相乘起來的結果都是26xxx左右 就是為了控制測試的時間
把測試結果相乘一下就知道每個長度的計算大概都佔2秒多一點點。

猜測的結論:
super pi 是個經過很複雜的疊代過程算出來的一個超級長的小數數列的程式
prime 的benchmark 是較簡單的算式,可以測出電腦最快完成這個算式的時間。

未什麼p4跟k7/xp/barton的會差這麼多…………還是不知道,
不過我覺得跟記憶體頻寬有絕對的關係……不知道有沒有fx51來測測看:D


-----
以上純猜測∼:shy:

wiki 2003-12-31 04:37 PM

Super PI與Prime95....2個其實都值得參考系統效能及穩定度..
小弟不贊成捨誰取誰.這樣沒意義.也不用去推所謂的"標準範本"..
自然的若用P4要好看就取Prime95吧.若用AMD要好看就取Super PI吧.
如果您認為要測試基本的穩定度及調教出最快的效能.Super PI-32M不失是一個好選擇..
又如果您在意的是.您的電腦必須全功(100%)的工作好幾天.那當然Prime95一定要測..
但是要拿Prime95來取代當成測試成績的參考數據標準..這.........
很免強的說出口----我.沒.意.見.............大家自成一格高興就好!!!:D

petitdragon 2003-12-31 04:45 PM

弟剛再驗證如下:

290Mhzx14=4060Mhz (FSB/RAM=5/4, RAM@232Mhz@2-2-2-5)==>

Intel(R) Pentium(R) 4 CPU 2.80GHz
CPU speed: 4059.07 MHz
CPU features: RDTSC, CMOV, PREFETCH, MMX, SSE, SSE2
L1 cache size: 8 KB
L2 cache size: 512 KB
L1 cache line size: 64 bytes
L2 cache line size: 128 bytes
TLBS: 64
Prime95 version 23.8, RdtscTiming=1
Best time for 384K FFT length: 8.745 ms.
Best time for 448K FFT length: 10.389 ms.
Best time for 512K FFT length: 11.789 ms.
Best time for 640K FFT length: 14.183 ms.
Best time for 768K FFT length: 17.231 ms.
Best time for 896K FFT length: 20.476 ms.
Best time for 1024K FFT length: 22.943 ms.
Best time for 1280K FFT length: 30.037 ms.
Best time for 1536K FFT length: 37.023 ms.
Best time for 1792K FFT length: 43.965 ms.
Best time for 2048K FFT length: 49.644 ms.

290Mhzx14=4060Mhz (FSB/RAM=5/4, RAM@[email protected])==>

Intel(R) Pentium(R) 4 CPU 2.80GHz
CPU speed: 4059.06 MHz
CPU features: RDTSC, CMOV, PREFETCH, MMX, SSE, SSE2
L1 cache size: 8 KB
L2 cache size: 512 KB
L1 cache line size: 64 bytes
L2 cache line size: 128 bytes
TLBS: 64
Prime95 version 23.8, RdtscTiming=1
Best time for 384K FFT length: 8.879 ms.
Best time for 448K FFT length: 10.538 ms.
Best time for 512K FFT length: 11.972 ms.
Best time for 640K FFT length: 14.379 ms.
Best time for 768K FFT length: 17.514 ms.
Best time for 896K FFT length: 20.727 ms.
Best time for 1024K FFT length: 23.256 ms.
Best time for 1280K FFT length: 30.521 ms.
Best time for 1536K FFT length: 37.439 ms.
Best time for 1792K FFT length: 44.595 ms.
Best time for 2048K FFT length: 50.508 ms.

應有明顯差異. 謹供參考. :)

引用:
Originally posted by yonoko
為何prime95最佳化和沒最佳化 分數差不多?
凡而好像時脈決定一切(P4 2.4C)

Reich 唐 2003-12-31 05:21 PM

引用:
Originally posted by petitdragon
謝謝Reich兄的指教. 您所謂的P4全系列應是指FSB 533及800版的吧, 但無論是那一版本姑且不論其記憶體頻寬都優於AMD AthlonXP系列, 更重要的是兩者都支援SSE2. 大家應該都注意到AthlonXP只支援到SSE (即使它有3DNow!, 但Prime95仍採用較快的SSE).

謝謝petitdragon大的回應,不過連FSB 400的P4也能打敗FSB400的Athlon XP喔?!

以下是天昏地暗大的測試:
AMD Athlon(tm) XP
CPU speed: 2104.68 MHz
CPU features: RDTSC, CMOV, PREFETCH, MMX, SSE
L1 cache size: 64 KB
L2 cache size: 256 KB
L1 cache line size: 64 bytes
L2 cache line size: 64 bytes
L1 TLBS: 32
L2 TLBS: 256
Prime95 version 23.7, RdtscTiming=1
Best time for 384K FFT length: 27.001 ms.
Best time for 448K FFT length: 30.911 ms.
Best time for 512K FFT length: 33.238 ms.
Best time for 640K FFT length: 44.717 ms.
Best time for 768K FFT length: 53.248 ms.
Best time for 896K FFT length: 64.365 ms.
Best time for 1024K FFT length: 71.097 ms.
Best time for 1280K FFT length: 93.003 ms.
Best time for 1536K FFT length: 112.272 ms.
Best time for 1792K FFT length: 137.010 ms.
Best time for 2048K FFT length: 157.624 ms.

以下是blackmeat兄的測試:
Intel(R) Pentium(R) 4 CPU 1.80GHz
CPU speed: 1817.91 MHz
CPU features: RDTSC, CMOV, PREFETCH, MMX, SSE, SSE2
L1 cache size: 8 KB
L2 cache size: 512 KB
L1 cache line size: 64 bytes
L2 cache line size: 128 bytes
TLBS: 64
Prime95 version 23.7, RdtscTiming=1
Best time for 384K FFT length: 22.903 ms.
Best time for 448K FFT length: 27.195 ms.
Best time for 512K FFT length: 30.901 ms.
Best time for 640K FFT length: 37.076 ms.
Best time for 768K FFT length: 45.439 ms.
Best time for 896K FFT length: 54.980 ms.
Best time for 1024K FFT length: 59.383 ms.
Best time for 1280K FFT length: 80.692 ms.
Best time for 1536K FFT length: 108.931 ms.
Best time for 1792K FFT length: 133.692 ms.
Best time for 2048K FFT length: 146.539 ms.

這樣誇張的差距,弟覺得應該不止SSE2這一點有影響?但不是很了解就是了,希望您能抽空解答,謝謝。:)

petitdragon 2003-12-31 06:00 PM

SSE2確實是造成差異的"主要原因". 君不見http://www.mersenne.org/bench.htm
裡要特別將有無支援SSE2的數據分開列表?

如果Reich兄有其他的發現及心得, 還望不吝分享給大家喔. ;)

引用:
Originally posted by Reich 唐
謝謝petitdragon大的回應,不過連FSB 400的P4也能打敗FSB400的Athlon XP喔?!

以下是天昏地暗大的測試:
AMD Athlon(tm) XP
CPU speed: 2104.68 MHz
CPU features: RDTSC, CMOV, PREFETCH, MMX, SSE
L1 cache size: 64 KB
L2 cache size: 256 KB
L1 cache line size: 64 bytes
L2 cache line size: 64 bytes
L1 TLBS: 32
L2 TLBS: 256
Prime95 version 23.7, RdtscTiming=1
Best time for 384K FFT length: 27.001 ms.
Best time for 448K FFT length: 30.911 ms.
Best time for 512K FFT length: 33.238 ms.
Best time for 640K FFT length: 44.717 ms.
Best time for 768K FFT length: 53.248 ms.
Best time for 896K FFT length: 64.365 ms.
Best time for 1024K FFT length: 71.097 ms.
Best time for 1280K FFT length: 93.003 ms.
Best time for 1536K FFT length: 112.272 ms.
Best time for 1792K FFT length: 137.010 ms.
Best time for 2048K FFT length: 157.624 ms.

以下是blackmeat兄的測試:
Intel(R) Pentium(R) 4 CPU 1.80GHz
CPU speed: 1817.91 MHz
CPU features: RDTSC, CMOV, PREFETCH, MMX, SSE, SSE2
L1 cache size: 8 KB
L2 cache size: 512 KB
L1 cache line size: 64 bytes
L2 cache line size: 128 bytes
TLBS: 64
Prime95 version 23.7, RdtscTiming=1
Best time for 384K FFT length: 22.903 ms.
Best time for 448K FFT length: 27.195 ms.
Best time for 512K FFT length: 30.901 ms.
Best time for 640K FFT length: 37.076 ms.
Best time for 768K FFT length: 45.439 ms.
Best time for 896K FFT length: 54.980 ms.
Best time for 1024K FFT length: 59.383 ms.
Best time for 1280K FFT length: 80.692 ms.
Best time for 1536K FFT length: 108.931 ms.
Best time for 1792K FFT length: 133.692 ms.
Best time for 2048K FFT length: 146.539 ms.

這樣誇張的差距,弟覺得應該不止SSE2這一點有影響?但不是很了解就是了,希望您能抽空解答,謝謝。:)

Reich 唐 2003-12-31 06:15 PM

引用:
Originally posted by petitdragon
SSE2確實是造成差異的"主要原因". 君不見http://www.mersenne.org/bench.htm
裡要特別將有無支援SSE2的數據分開列表?

喔,原來是這樣!如果軟體能發揮SSE2的強大威力,那的確就算其他CPU把傳統的X87 FPU最佳化,還是只有在後面吃灰的份。立足點就不一樣了,果然是一個跑一個飛!;)

Radeon9 2003-12-31 06:43 PM

話是這麼說沒錯,但是以實際上來測試XP2000+ VS 533FSB P4 2G
並不會有天差地遠的差別,就算是特別對SSE2優化過的Divx等等轉檔軟體,
也不會出現1.5~2倍的時間差!
現在反過來連FSB400 256KB的P4都可以快電掉AthlonXP,實在是讓我質疑
它是不是以頻率為導向的測試軟體?!~~~

如果SuperPI可透過Raid硬碟和記憶體來改善時間,那代表說應該更注重環境影響
但是反過來說,Prime95在遇上P4 SSE2就誇張許多,這實在是對"一般用戶"的誤導!

不論在遊戲測試,壓縮測試,一般商務應用,3D繪圖,從來也沒見過FSB800 P4能拉開跟Barton差距如此多的測試~~ Barton3200+再不濟也有P4 3G的實力

Prime95實在不適合作為一個公正的標準效能評測!
頂多只能說是一個較嚴苛的環境罷了,如果能讓SuperPI連續運轉24Hr,
搞不好也能揪出某些不穩定因素!

alanzx 2003-12-31 08:47 PM

請問一下...
prime95要如何設定讓他連續跑1小時或更多呢?
是選test中的第一個選項嗎?
小弟的barton2500+不管有沒有超頻...
都跑不到一分鐘就死掉了...
不知道是哪裡出了問題說?

Reich 唐 2003-12-31 08:56 PM

引用:
Originally posted by alanzx
請問一下...
prime95要如何設定讓他連續跑1小時或更多呢?
是選test中的第一個選項嗎?
小弟的barton2500+不管有沒有超頻...
都跑不到一分鐘就死掉了...
不知道是哪裡出了問題說?

不用設定啊,預設值不就是一天跑24小時嗎?系統沒問題的話,會重複跑到地老天荒吧!

BorgMu 2003-12-31 10:09 PM

引用:
Originally posted by Radeon9
話是這麼說沒錯,但是以實際上來測試XP2000+ VS 533FSB P4 2G
並不會有天差地遠的差別,就算是特別對SSE2優化過的Divx等等轉檔軟體,
也不會出現1.5~2倍的時間差!
現在反過來連FSB400 256KB的P4都可以快電掉AthlonXP,實在是讓我質疑
它是不是以頻率為導向的測試軟體?!~~~

如果SuperPI可透過Raid硬碟和記憶體來改善時間,那代表說應該更注重環境影響
但是反過來說,Prime95在遇上P4 SSE2就誇張許多,這實在是對"一般用戶"的誤導!

不論在遊戲測試,壓縮測試,一般商務應用,3D繪圖,從來也沒見過FSB800 P4能拉開跟Barton差距如此多的測試~~ Barton3200+再不濟也有P4 3G的實力

Prime95實在不適合作為一個公正的標準效能評測!
頂多只能說是一個較嚴苛的環境罷了,如果能讓SuperPI連續運轉24Hr,
搞不好也能揪出某些不穩定因素!

3200+不到 P4 3G的實力...詳細測試您可以去TOM那裡翻翻資料便可知了...大約只有 P4 2.8G(不到)的實力:think:


所有的時間均為GMT +8。 現在的時間是07:49 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。