大家好像對 Skylake+DDR4與上一代Haswell+DDR3的比較有些誤解, 都認為Skylake有些低落. 問題其實都出測試平台的記憶體沒有選對, 不是同樣基準!
很多網站跑分的時候都是拿標準的DDR4-2133 CL15 對上較快的DDR3. 連大站如Anandtech在評比Skylake/Haswell 3GHz IPC時都有犯這個錯.
最近看到一個法國佬的硬體網站, 他們就很了解怎麼去評比 Skylake.
http://www.hardware.fr/articles/940...3-pratique.html
Lecture = 讀
Ecriture = 寫
Latence = 延遲
小弟截取了他們的記憶體測試圖, 光是看延遲這張圖就一目了然.
要評比CPU IPC時, 一定要盡量把記憶體的延遲因素做到靠近. 延遲幾乎是最重要的記憶體效能參數, 當初從 >20MHz CPU的時代開始有 L1 cache就是因為讀寫到DRAM太慢, CPU多數時間在空等. 後來隨著CPU越來越快才出現L2/L3/L4, 且越來越大, 目的都是為了防止CPU到RAM抽取資料, 降低延遲.
既然在比CPU IPC就應該要讓周邊的條件盡量一樣, 這樣才能確保測試程式被迫到RAM讀寫資料的時候有相同的等待時間, 而不是被掐住
小弟看網路上的測試結果, Skylake如果與Haswell跑同樣速度, 記憶體也有類似的延遲, 一般性IPC進步落在2∼15%, 有些特殊指令如 AVX2, FMA3 多到20∼30%
從另外一個角度想, IPC多10%的話, 4.4G Haswell等同4.0G Skylake, 這種進步是很可怕的, 因為速度卡在4G附件有10年了, 且短期內大概不會有改善. Single thread能夠進步10%是很嚇人的, single thread效率在這個年頭是黃金, 也是最難達成的.