引用:
Originally posted by MagicTester
因為K7架構的Athlon 與Athlon XP 全系列L2 cache的資料寬度只有64bit,但是
知道P3自coppermine核心開始後,P3/P4的L2頻寬是多少嗎?"256bit "
,足足寬了4倍。
這個例子還不明顯的話,以顯示卡VGA來說,同樣的核心,記憶體頻寬64bit跟
256bit,效能差多少,很明顯吧。
其實想想Duron只要64K的L2,就可以有不錯的效能,就知道增加Athlon XP的L2大
小對CPU的幫助不太大,以大部分的程式來說,同時脈的T-Bred 與Barton,T-bred
只要時脈增加75MHz左右,就可以抵銷Barton多的那256K L2,所以對AMD來說,
512K L2最大的功能是"行銷",因為跟P4同等級了,比較容易說服消費者。
|
其實這和頻寬沒有關係....
主要是因為CPU架構的差異....
P4的高依賴外頻及L2 cache主要是因為pipeline過長和分支預測的影響....
到L2 cache提取資料有命中率的問題....
但是如果命中率太低的話....Pipeline有20stage使的clear pipeline時間也會增加不少
進而造成效能不彰....
L2的命中率除了改善分支預測的演算法之外...就是加大L2 cache
L2 Hit Ratio越高...清 pipeline時間和次數減少...效能自然提昇....
這點在P4和celeron之間就可以了解其差異...
但是換成EV6的AMD XP系統....
由於pipeline只有12stage....加上L1 Cache就比P4大了數倍....
Cache 命中率自然就高了....就算沒有在L2之前hit到資料....
Clear Pipeline也不會花很多時間....
因此在L2只有64k的duron和L2有256k甚至是L2有512K的xp3者之間
並不會有太大的差異...