![]() |
||
|
Master Member
![]() ![]() ![]() ![]() 加入日期: Aug 2002 您的住址: 台北跟中壢兩地最常出沒
文章: 1,955
|
[問題]突然想到以前Duron的L2 cache比L1還小...
期末考在唸書...
念到Memory Hierarchy.... 一般來說cache越接近CPU的速度越快,容量小 "上層的資料下層一定也有" (L1有的資料L2一定也有,Main Memory也一定會有) 但是像Duron這樣從Athlon改版而來的設計 造成L2 (64KB)比L1還小(I-L1 64KB + D-L1 64KB) 那這樣L2還有意義嗎? 這樣不是幾乎一直cache miss? 或者說,L1的64+64幾乎一直處於塞不滿狀態? 頂多I-L1很少只有1KB,然後D-L1幾乎滿滿的63KB?? == 其實是唸書念到一半找理由上PCDVD ![]() |
|||||||
|
|
|
Elite Member
![]() ![]() ![]() ![]() ![]() 加入日期: Jan 2002 您的住址: 閃亮亮的永和*~
文章: 6,096
|
就我以前的印象是,K7 L1有的資料L2就不會有了,所以Duron的快取可視為64+64+64=192KB,跟傳統的快取資料配置不一樣(畢竟L1有的話就不需要L2裡有相同的資料了)
__________________
歐洲輪胎滾動阻力&溼地煞車&噪音查詢 日本輪胎滾動阻力與溼地煞車查詢(歐洲阻力A=日本阻力AAA)(歐洲跳過D) 貧弱家庭兒童愛心早餐計畫 手機請勿使用台哥大700MHz 4G LTE頻道,以免干擾無線麥克風運作。 推薦網站 我不爽健保局 巴士大叔之部<-華航飛安不良的原因 國家的遠見 站內特別推薦連結 yahoo賣片被抓 由於著作權法第八十七條第四款的緣故 賣海外正版是違法的喔(刪除紀念) 又有人受害了 好書推薦:快樂為什麼不幸福? 本書不討論快樂更不討論幸福,講的是大腦如何理解世界。 好書推薦:大腦決策手冊 該用腦袋的哪個部分做決策? 了解自己與別人怎麼使用腦袋瓜(因被發現是抄襲的所以下架了喔) 好書推薦:販賣債務的銀行 了解銀行如何使一般人建立錯誤的借貸觀念,讓老百姓成為金融佃農,一輩子替銀行工作 好書推薦:企業的性格與命運 企業的本質是無道德的,企業努力的把自身成本轉嫁成社會成本,以大幅提高獲利。 DVD 好書推薦:沒有中國模式這回事! 雖然書名有中國,但其實是講近代全球經濟史,讓你從經濟學的角度理解歷史。 好書推薦:搶救35歲 十五張證照找不到好工作、四十歲結婚成家是常態、雙薪家庭也只敢生一胎、房貸要背到七十歲… |
||
|
|
|
*停權中*
加入日期: Oct 2004 您的住址: 台北
文章: 3,188
|
cache又不是越大越好,那些不懂得人在那邊宣揚L2越大越好的理論,無非是想噱錢罷了,L2還是有他的意義的,看cache不是只看大小,還有他的cache方式等等,L1是2-way 的64+64,那個L2是16way的64捏,還有miss不miss也不見得是重點,就算不miss你能確定它是正確時間提供你正確的資料?K7的L2的頻寬並不大,實際上K7的cache在到達128K左右之後,再來256K也許還有提升,但是在來512K的時候,根本實際上差異不大,若是真的仔細去算會發現這個因素再整體效能裡面根本不值一晒,當然越大是越好,可是大到一定程度,要再提升的效果真的有限,如果說差沒多少錢那不要緊,但是如果差很多的話,是不是要考慮一下?這種狀況現在還是存在,Opteron 就算了不起1M會比原本的939 512K的同時脈同外頻是會暴增多少效能?別傻了都是商業操作,cache只要一定程度大就好,向Sempron那樣大約256K大約就可以達到基本了。畢竟很多部份還是有K7的影子。
|
|
|
|
Master Member
![]() ![]() ![]() ![]() 加入日期: Aug 2002 您的住址: 台北跟中壢兩地最常出沒
文章: 1,955
|
沒錯~
Northwood雖然512KB L2 cache,但是效能強過Prescott的1MB cache~ 小弟知道不是越大越好拉~ 因為還有很多的N-way以及miss penalty的問題 我只是好奇以課本上說的"上層的資料下層一定也有"相當好奇罷了 前面已經有大大回答了 原來K7的設計L1有L2就不會有了 看來理論跟實做差異頗大~ 那想順便問一下的是, P4也有這樣設計嗎? |
|
|
|
Major Member
![]() 加入日期: Apr 2005
文章: 216
|
引用:
是這樣(L1有的資料L2一定也有,Main Memory也一定會有)沒錯, 所以L2大小通常是L1兩倍, 不過athlon L1 128K, L2 要256K, 比較昂貴, 所以athlon 允許例外, 也就是說不一定L1有的資料L2一定也有, 因此便宜的Duron L2只有 64K, 但 L1的64+64不會一直處於塞不滿狀態 |
|
|
|
|
Major Member
![]() 加入日期: Apr 2005
文章: 216
|
引用:
P4 L1很小(只有8K) 所以要符合"上層的資料下層一定也有"非常容易 |
|
|
|
|
Master Member
![]() ![]() ![]() ![]() 加入日期: Aug 2002 您的住址: 台北跟中壢兩地最常出沒
文章: 1,955
|
Intel vs. AMD
光是L1 L2 cache 設計上還真是迥異啊.... |
|
|
|
*停權中*
加入日期: Oct 2004 您的住址: 台北
文章: 3,188
|
Intel跟AMD的cache部分完全是不同的設計,prescott確實有提升一點點效能,但是真的不是差很多,主要是現今真的走到接近極限了,再上去要提升一點點效能要花費很多的代價,Prescott跟Northwood比起來除了記憶體控制部分比叫好一點,還有時脈得以繼續提升的優點,只是因為製造技術有瓶頸,卡在3.8左右上不去,基本上整個結構都差很多,cache也是完全新的概念,跟AMD比較傳統的作法不太一樣,這東西很明顯可以看出新的技術不見得會比舊的作法好多少,代表目前處理器遇到真正的瓶頸了,不論提升製程還是改變結構都不能有太大的改善。過去處理器其實也沒有多大進步,不過主要都是倚靠製程的轉換罷了。
|
|
|
|
Regular Member
![]() ![]() 加入日期: Dec 2000 您的住址: 新竹市
文章: 88
|
引用:
書上的東西不見得能寫盡實際產品的作法. K7的作法確實是如其它人說的, L1有的, L2一定沒有. 以往書上寫的作法是, data由memory進到cache時, 必須先經過L2才會到L1. 而K7其作法是: 1.L1 and L2 Cache Miss時, data直接由memory進到L1 (datapath不會經過L2). 2.L1 Miss but L2 Hit時, data由 L2進到L1, L1的victim則進L2. |
|
|
|
|
Master Member
![]() ![]() ![]() ![]() 加入日期: Aug 2002 您的住址: 台北跟中壢兩地最常出沒
文章: 1,955
|
感謝大大的說明~
AMD這種設計感覺也頗有效率的 難怪很久以前看過Athlon的****寫384KB cache,原來是因為這樣... (那時候覺得,那P3為啥不把兩個加起來寫,雖然P3 P4的L1都不大) 不過大大您說miss的時候L1的victim進L2 那如果有大量資料都只需運算一次的話 那這樣L2大小其實影響有限嘛(難怪Duron效能沒輸Athlon太多就是因為這樣...) 另外如果L2速度比L1慢的話(好像在Duron裡L1 L2速度差不多? SlotA版的Athlon才有非同步速度?) 那豈不更拖慢速度? |
|
|