PCDVD數位科技討論區 - cache大還是頻率高比較好

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)

- 系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)

- - cache大還是頻率高比較好 (https://www.pcdvd.com.tw/showthread.php?t=702858)

引用:

作者Reich 唐

L2是什麼全名？他是什麼東西？答案是第二階快取"記憶體"

只要是記憶體，就有時脈x位元寬的頻寬，L2時脈與CPU相同，但是位元寬，Intel早從PIII時代開始，就是256bit，AMD同時期的K7呢？ 64bit :jolin:

AMD K7末期會被Northwood P4電的那麼慘，L2頻寬是其中一個關鍵。K8的L2位元寬終於提升到256bit....等等，是256bit的一半，128bit....。

雖然K8只是把K7的L2 位元寬提升一點，但是在很多不是記憶體密集的程式，也可以取得比K7大幅度的領先，加上K8的核心架構，其實沒比K7改進多少，所以合理的認知就是，K8還是會受記憶體頻寬的影響。

所以，明眼人都看的出，如果K8也改用256bit快取記憶體，校能還能夠大幅度成長，但是過了這麼多年都沒用，特別是知道有Conroe核心後，還不做，答案應該只有一個，做不出來。

我想請問一下...K8的L2真的是128bit嗎
下面這片說K8是64bit , K8L才是128bit, 還是我看錯了 :confused: ?(英文不算好, 或許keyword看錯)
原文: http://www.anandtech.com/printarticle.aspx?i=2939

同樣架構的CPU我會選cache大的...
反正頻率可以用超的
cache你怎麼超他都不會變大

引用:

作者beck90237

他講的是K8的SSE執行單元是64bit，而C2D的Conroe核心SSE執行單元是128bit....K8L要改這點，連內外通道都要改，連外通道改成128bit也是跟目前的C2D一樣而已。

講著講著，又講到目前K8的傷心處，針對SSE指令，現在下一道128bit的SSE指令，K8要兩時脈週期才能處理完，C2D只要一個時脈週期，何況C2D時脈還普遍的比A64快，結果就....

引用:

作者野口隆史

把這篇K 完
http://hotball.webhop.net/

否則你一有疑問就開個主題沒人可以回答的完...

是要K
http://www.csie.ntu.edu.tw/~r89004/...che/page_1.html
這一篇嗎@@?

引用:

作者maxkingzero

是要K
http://www.csie.ntu.edu.tw/~r89004/...che/page_1.html
這一篇嗎@@?

懂了不少
感謝大大們熱心教導

要看使用者較常用的程式
程式有支援或做最佳化的 CPU表現自然會比較好
( 不過今日評價效能用的程式跟一年後所用的可能又不同 )

在下比較不看性能數據 , 因為今日的超高效能往往代表高耗電.品質過剩
不代表今日的效能巨獸可以適應明年應用程式的需求
( HPC類的算是例外)

引用:

作者Reich 唐

這樣阿... :rolleyes:
瞭解了一些了^^ 謝謝指教

引用:

作者Reich 唐

訊息不明，你當我們都半仙喔 :jolin: 這樣就能猜出答案？

不過有點功力的，由這樣的訊息已經可以推敲，2.8G那顆是Prescott核心，3.2GHz那顆是Northwood核心，所以3.2GHz那顆會快一點。

不過3.2那顆也有可能是Cedar Mill-512核心的Celeron，那跟2.8那顆的效能可說是在伯仲之間。以上都是指不超頻的情況。

總之，頻率跟快取大小不等於效能，建議爬點文再來問吧。

若是P4 2.8G那顆是Prescott核心1M HT溫度較高類似噴火龍--朋友有一顆用GA-8I1000G 3.3約超到3.4G溫度近66度且效能不穩，會當機，P4 3.2GHz那顆是Northwood核心512K HT溫度較低應該比較好，小弟有一顆P4 3.0Northwood核心512K HT用GA-8I1000G 3.3，可超到3.75G且溫度最高約55度，平時約28-45度。

引用:

作者Reich 唐

這樣講好像很奇怪... :confused:
而且講的好像256bit就一定比較強

那為啥P3雖然是256bit,但還是輸給同時期K7呢?
更不要說Prescott輸給A64
直到C2D才贏過A64...

所以說P3,Northwood,Prescott,Core2Duo全都是256bit
K7 K8慢慢增加卻都還能贏過同時期的intel系列
這樣是不是表示,那只是intel太早把寬度做太寬?

那不是說明了瓶頸不是卡在128bit or 256bit的問題上,而是core本身的問題
到了位元寬度不夠的時候AMD自然會重新設計核心
那這樣跟做不做得出來有啥關係?

順帶提幾件事情
1.之前的P4從Northwood變成Prescott核心,L2加大了但是效能沒增加,部分效能還下降
2.AMD Opteron系列L2就比較大,這可以代表作得出來吧?

如果真要這麼說,那AMD的L1 cache比intel大太多了,L1 cache更貴,更重要,為啥intel不肯做大一點?在我的看法是intel受限FSB的問題,加大L2來降低對外DDR2 RAM的需求...

引用:

作者JLurker

說起快取記憶體，那長篇大論囉，不過您講的很多都.....，像最後一段，我可以直接先告訴你答案，Intel為了要保持L1的低遲延與多路檢索，所以不做那麼大的L1。

此外，考考古吧.....

PIII跟K7的輸贏，不是這麼簡單來看，Tualatin核心的P3-1GHz跟Thunderbird核心K7同級吧？在當時所有程式幾乎都是Tualatin大勝喔。
請看：全新出擊Intel Pentium III Tualatin重度實測

古代的P6微架構，靠著512KB 全速256bit 與低latency的L2 cache，就能再絕大多數的程式中，擊敗核心較為先進，但是僅有256KB 64bit L2的雷鳥。

那K7不會用512KB的L2？不是早早可以扳回劣勢？K7出現512KB L2看看已經是多久以後了....

當時Intel應該就看清楚一個原理了，核心架構再強，沒有足夠的資料給他算也沒用，或暫存器、L1、L2的遲延太高，都會嚴重讓CPU核心空轉，影響效能。

當然，AMD也有看到，前端匯流排改成HTT架構就是很大的進步，記憶體直接控制也是一例。不過快取記憶體位寬卻沒有同步擴展，大小也始終落後Intel一截，就是一個最大的問題，反正大家都知道，資料還是從L2存取比較快，程式設計師都會儘量不要去存取記憶體，latency差太多了。

遠的例子舉過了Tualatin靠高速大容量的L2就玩死同時代K7，進一點的例子，先不看Conroe，幾乎從P6直接搬過來，沒改啥的yonah，靠著2MB 8way 256bit的L2，就可以跟內建記憶體控制器的K8打的不相上下。

Conroe核心是4MB 16way 256bit的L2，存取速度是K8的2.5倍（電腦王雜誌2006/06 p.110），2.5倍在電腦來說，嗯....

說到L1是吧，K7/K8的L1，雖然是64KB+64KB，但都是2way相連檢索結構。Yonah開始，Core微架構的32KB+32KB L1，都是8way相連檢索結構。

AMD的快取在伺服器版本都還只是1MB，而且L2 latency、檢索路線、位元寬都差Intel很多....其實也不用講Intel的L2技術多精良，應該說，Intel的L2技術能夠讓Prescott那麼爛的架構，那麼深的管線，都還能跑出一定的水準，就可以看出來了。

至於誰贏誰？那都不是很重要，不過看看前面的很多例子，Intel可以在較爛的核心上，配上精良的L2快取，而常常取得優勢，換言之，AMD常常被Intel的快取攻勢玩死。舉例，Tualatin P3、Northwood P4、Northwood P4EE、更不用談核心改良過的Yonah跟Conroe了。

至於Prescott L2加大到1MB，效能還比512KB的差，是因為Prescott如果只有512KB L2，效能會更慘，簡單說，Prescott核心就是比Northwood核心爛，雖然他比較晚出，但核心、管線階層都不同了，拿這例子來類比，老實說，蠻爛的。

當然，快取不是越大越好，還有快取遲延、快取命中率，演算法、WB或WT寫入法等等因素，但位元寬絕對是越大越好。但綜合考量這些因素，可以看出Intel才能做出又大又高速的L2.....過去是為了救他的爛核心，目前配合上改過的Core2架構，就成了如虎添翼。

反正，K8L在改核心的同時，沒有同時強化L2的話，保證還是會卡住很多效能。AMD保證知道，如果還不弄，那除了做不出來外，沒有更好的解釋。