PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   cache大還是頻率高比較好 (https://www.pcdvd.com.tw/showthread.php?t=702858)

beck90237 2007-03-13 11:17 AM

引用:
作者Reich 唐
L2是什麼全名?他是什麼東西?答案是第二階快取"記憶體"

只要是記憶體,就有時脈x位元寬的頻寬,L2時脈與CPU相同,但是位元寬,Intel早從PIII時代開始,就是256bit,AMD同時期的K7呢? 64bit :jolin:

AMD K7末期會被Northwood P4電的那麼慘,L2頻寬是其中一個關鍵。K8的L2位元寬終於提升到256bit....等等,是256bit的一半,128bit....。

雖然K8只是把K7的L2 位元寬提升一點,但是在很多不是記憶體密集的程式,也可以取得比K7大幅度的領先,加上K8的核心架構,其實沒比K7改進多少,所以合理的認知就是,K8還是會受記憶體頻寬的影響。

所以,明眼人都看的出,如果K8也改用256bit快取記憶體,校能還能夠大幅度成長,但是過了這麼多年都沒用,特別是知道有Conroe核心後,還不做,答案應該只有一個,做不出來。


我想請問一下...K8的L2真的是128bit嗎
下面這片說K8是64bit , K8L才是128bit, 還是我看錯了 :confused: ?(英文不算好, 或許keyword看錯)
原文: http://www.anandtech.com/printarticle.aspx?i=2939

z751119 2007-03-13 11:19 AM

同樣架構的CPU我會選cache大的...
反正頻率可以用超的
cache你怎麼超他都不會變大

Reich 唐 2007-03-13 11:38 AM

引用:
作者beck90237
我想請問一下...K8的L2真的是128bit嗎
下面這片說K8是64bit , K8L才是128bit, 還是我看錯了 :confused: ?(英文不算好, 或許keyword看錯)
原文: http://www.anandtech.com/printarticle.aspx?i=2939

他講的是K8的SSE執行單元是64bit,而C2D的Conroe核心SSE執行單元是128bit....K8L要改這點,連內外通道都要改,連外通道改成128bit也是跟目前的C2D一樣而已。

講著講著,又講到目前K8的傷心處,針對SSE指令,現在下一道128bit的SSE指令,K8要兩時脈週期才能處理完,C2D只要一個時脈週期,何況C2D時脈還普遍的比A64快,結果就....

maxkingzero 2007-03-13 02:27 PM

引用:
作者野口隆史
把這篇K 完
http://hotball.webhop.net/

否則你一有疑問就開個主題沒人可以回答的完...


是要K
http://www.csie.ntu.edu.tw/~r89004/...che/page_1.html
這一篇嗎@@?

qqqaaa330 2007-03-13 03:53 PM

..........
 
引用:
作者maxkingzero


懂了不少
感謝大大們熱心教導

over55Stars 2007-03-13 06:08 PM

要看使用者較常用的程式
程式有支援或做最佳化的 CPU表現自然會比較好
( 不過今日評價效能用的程式跟一年後所用的可能又不同 )

在下比較不看性能數據 , 因為今日的超高效能往往代表高耗電.品質過剩
不代表今日的效能巨獸可以適應明年應用程式的需求
( HPC類的算是例外)

beck90237 2007-03-13 07:52 PM

引用:
作者Reich 唐
他講的是K8的SSE執行單元是64bit,而C2D的Conroe核心SSE執行單元是128bit....K8L要改這點,連內外通道都要改,連外通道改成128bit也是跟目前的C2D一樣而已。

講著講著,又講到目前K8的傷心處,針對SSE指令,現在下一道128bit的SSE指令,K8要兩時脈週期才能處理完,C2D只要一個時脈週期,何況C2D時脈還普遍的比A64快,結果就....


這樣阿... :rolleyes:
瞭解了一些了^^ 謝謝指教

tu72ch 2007-03-13 07:56 PM

引用:
作者Reich 唐
訊息不明,你當我們都半仙喔 :jolin: 這樣就能猜出答案?

不過有點功力的,由這樣的訊息已經可以推敲,2.8G那顆是Prescott核心,3.2GHz那顆是Northwood核心,所以3.2GHz那顆會快一點。

不過3.2那顆也有可能是Cedar Mill-512核心的Celeron,那跟2.8那顆的效能可說是在伯仲之間。以上都是指不超頻的情況。

總之,頻率跟快取大小不等於效能,建議爬點文再來問吧。


若是P4 2.8G那顆是Prescott核心1M HT溫度較高類似噴火龍--朋友有一顆用GA-8I1000G 3.3約超到3.4G溫度近66度且效能不穩,會當機,P4 3.2GHz那顆是Northwood核心512K HT溫度較低應該比較好,小弟有一顆P4 3.0Northwood核心512K HT用GA-8I1000G 3.3,可超到3.75G且溫度最高約55度,平時約28-45度。

JLurker 2007-03-13 09:27 PM

引用:
作者Reich 唐
L2是什麼全名?他是什麼東西?答案是第二階快取"記憶體"

只要是記憶體,就有時脈x位元寬的頻寬,L2時脈與CPU相同,但是位元寬,Intel早從PIII時代開始,就是256bit,AMD同時期的K7呢? 64bit :jolin:

AMD K7末期會被Northwood P4電的那麼慘,L2頻寬是其中一個關鍵。K8的L2位元寬終於提升到256bit....等等,是256bit的一半,128bit....。

雖然K8只是把K7的L2 位元寬提升一點,但是在很多不是記憶體密集的程式,也可以取得比K7大幅度的領先,加上K8的核心架構,其實沒比K7改進多少,所以合理的認知就是,K8還是會受記憶體頻寬的影響。

所以,明眼人都看的出,如果K8也改用256bit快取記憶體,校能還能夠大幅度成長,但是過了這麼多年都沒用,特別是知道有Conroe核心後,還不做,答案應該只有一個,做不出來。


這樣講好像很奇怪... :confused:
而且講的好像256bit就一定比較強

那為啥P3雖然是256bit,但還是輸給同時期K7呢?
更不要說Prescott輸給A64
直到C2D才贏過A64...

所以說P3,Northwood,Prescott,Core2Duo全都是256bit
K7 K8慢慢增加卻都還能贏過同時期的intel系列
這樣是不是表示,那只是intel太早把寬度做太寬?

那不是說明了瓶頸不是卡在128bit or 256bit的問題上,而是core本身的問題
到了位元寬度不夠的時候AMD自然會重新設計核心
那這樣跟做不做得出來有啥關係?

順帶提幾件事情
1.之前的P4從Northwood變成Prescott核心,L2加大了但是效能沒增加,部分效能還下降
2.AMD Opteron系列L2就比較大,這可以代表作得出來吧?

如果真要這麼說,那AMD的L1 cache比intel大太多了,L1 cache更貴,更重要,為啥intel不肯做大一點?在我的看法是intel受限FSB的問題,加大L2來降低對外DDR2 RAM的需求...

Reich 唐 2007-03-13 10:41 PM

引用:
作者JLurker
這樣講好像很奇怪... :confused:
而且講的好像256bit就一定比較強

那為啥P3雖然是256bit,但還是輸給同時期K7呢?
更不要說Prescott輸給A64
直到C2D才贏過A64...

所以說P3,Northwood,Prescott,Core2Duo全都是256bit
K7 K8慢慢增加卻都還能贏過同時期的intel系列
這樣是不是表示,那只是intel太早把寬度做太寬?

那不是說明了瓶頸不是卡在128bit or 256bit的問題上,而是core本身的問題
到了位元寬度不夠的時候AMD自然會重新設計核心
那這樣跟做不做得出來有啥關係?

順帶提幾件事情
1.之前的P4從Northwood變成Prescott核心,L2加大了但是效能沒增加,部分效能還下降
2.AMD Opteron系列L2就比較大,這可以代表作得出來吧?

如果真要這麼說,那AMD的L1 cache比intel大太多了,L1 cache更貴,更重要,為啥intel不肯做大一點?在我的看法是intel受限FSB的問題,加大L2來降低對外DDR2 RAM的需求...

說起快取記憶體,那長篇大論囉,不過您講的很多都.....,像最後一段,我可以直接先告訴你答案,Intel為了要保持L1的低遲延與多路檢索,所以不做那麼大的L1。

此外,考考古吧.....

PIII跟K7的輸贏,不是這麼簡單來看,Tualatin核心的P3-1GHz跟Thunderbird核心K7同級吧?在當時所有程式幾乎都是Tualatin大勝喔。
請看:全新出擊Intel Pentium III Tualatin重度實測

古代的P6微架構,靠著512KB 全速256bit 與低latency的L2 cache,就能再絕大多數的程式中,擊敗核心較為先進,但是僅有256KB 64bit L2的雷鳥。

那K7不會用512KB的L2?不是早早可以扳回劣勢?K7出現512KB L2看看已經是多久以後了....

當時Intel應該就看清楚一個原理了,核心架構再強,沒有足夠的資料給他算也沒用,或暫存器、L1、L2的遲延太高,都會嚴重讓CPU核心空轉,影響效能。

當然,AMD也有看到,前端匯流排改成HTT架構就是很大的進步,記憶體直接控制也是一例。不過快取記憶體位寬卻沒有同步擴展,大小也始終落後Intel一截,就是一個最大的問題,反正大家都知道,資料還是從L2存取比較快,程式設計師都會儘量不要去存取記憶體,latency差太多了。

遠的例子舉過了Tualatin靠高速大容量的L2就玩死同時代K7,進一點的例子,先不看Conroe,幾乎從P6直接搬過來,沒改啥的yonah,靠著2MB 8way 256bit的L2,就可以跟內建記憶體控制器的K8打的不相上下。

Conroe核心是4MB 16way 256bit的L2,存取速度是K8的2.5倍(電腦王雜誌2006/06 p.110),2.5倍在電腦來說,嗯....

說到L1是吧,K7/K8的L1,雖然是64KB+64KB,但都是2way相連檢索結構。Yonah開始,Core微架構的32KB+32KB L1,都是8way相連檢索結構。

AMD的快取在伺服器版本都還只是1MB,而且L2 latency、檢索路線、位元寬都差Intel很多....其實也不用講Intel的L2技術多精良,應該說,Intel的L2技術能夠讓Prescott那麼爛的架構,那麼深的管線,都還能跑出一定的水準,就可以看出來了。

至於誰贏誰?那都不是很重要,不過看看前面的很多例子,Intel可以在較爛的核心上,配上精良的L2快取,而常常取得優勢,換言之,AMD常常被Intel的快取攻勢玩死。舉例,Tualatin P3、Northwood P4、Northwood P4EE、更不用談核心改良過的Yonah跟Conroe了。

至於Prescott L2加大到1MB,效能還比512KB的差,是因為Prescott如果只有512KB L2,效能會更慘,簡單說,Prescott核心就是比Northwood核心爛,雖然他比較晚出,但核心、管線階層都不同了,拿這例子來類比,老實說,蠻爛的。

當然,快取不是越大越好,還有快取遲延、快取命中率,演算法、WB或WT寫入法等等因素,但位元寬絕對是越大越好。但綜合考量這些因素,可以看出Intel才能做出又大又高速的L2.....過去是為了救他的爛核心,目前配合上改過的Core2架構,就成了如虎添翼。

反正,K8L在改核心的同時,沒有同時強化L2的話,保證還是會卡住很多效能。AMD保證知道,如果還不弄,那除了做不出來外,沒有更好的解釋。


所有的時間均為GMT +8。 現在的時間是07:01 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2026。