PCDVD數位科技討論區 - 完全整合繪圖及北橋功能的單晶片處理器 Intel 32nm Sandy Bridge 已流片 :shock:

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)

- 系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)

引用:

作者visionary_pcdvd

從頭到尾我都沒說快取只能比大小或只能比速度，你是眼X還是腦X :flash:

比演算法沒人能證明誰比誰強，比多層式快取架構你連你自己貼的文都看不懂，還比個鳥啊 :jolin:
　
　

你惱羞成怒亂打一段,
但是事實仍然是光 wiki 上這一小段 cache 的說明,
應該就夠解釋要真的要比較, 不是只有大小跟速度而已.

引用:

作者visionary_pcdvd

才8M也叫大？Q9550的快取總數還更大呢 :jolin:

不過 Intel 做的 L3 速度很快喔，例如 i7 的 L3 大約比 K8 的 L2 還快一倍，其快取技術遠非 AMD 能望其項背
　
　

這句話不是樓主你自己說的嗎？

引用:

作者Cudacke-Dees

你惱羞成怒亂打一段,
但是事實仍然是光 wiki 上這一小段 cache 的說明,
應該就夠解釋要真的要比較, 不是只有大小跟速度而已.

好好跟你講道理講多少次！結果你始終不理不採，只會一招機器人回覆，不然就是罵別人講廢言。索性對你講重話看你有何反應，現在終於確定你的真正目的不是在比較快取，而是專程來找碴的 :tu: 好，你要當機器人就盡量當吧，以後看到你的其它發言我也用你這招來搗你的蛋
　
　

最近一開工就沒時間休息
所以現在才來從頭回到尾
========================== 回覆區 ===========================
to 57樓的
恩....似乎有人幫我說出我想說的
不過我也不排除是我資料看的不夠仔細
可以的話請指出http://kernel.org/關於CPU快取的資料

to 60 61樓
兩者都在講關聯度
關聯度這種東西是越大命中率會越好(因為減少碰撞失誤)
但是會造成線路的複雜化(我下面舉個例子)
今天假如各位要去停車而停車場有100個車位
停車場規定大家要照身分證後2碼停在相對應的車位上
此時尾碼00的尾碼01的尾碼99的都只有一個車位可停(直接對映法)
今天你車子進來可能明明還有車位但是你不能停因為號碼不對(碰撞失誤)
但是你要找車很方便你只要查一個車位就知道你的車是否在停車場裡

相反的全關聯度就是讓你100的車位都能停
雖然不會出現碰撞失誤(就是明明有車位但是不讓你停)
但是你要找車子在不在停車場裡需要的時間很長(要找過全部的100個車位)
所以在電腦上假如要實作全關聯度很累人
因為需要加入硬體線路去做平行搜尋(不佳的話延遲時間會夭獸長抵銷掉增加命中率的好處)

這兩者算是極端
在直接對映(每筆資料只有某特定一個可以放)和全關聯度(每筆資料都可以放在任何位置)中
還可以根據可以放的位置多寡分成N關聯度
N的關連度代表一筆資料可以放在特定N個位置裡
隨著N越大碰撞失誤越少但要判定一筆資料在不在快取裡所需搜尋的區塊數越多

關聯度增加除了影響到單純的搜尋速度外
還影響到所使用的替換演算法
今天絕大多數的公司都使用LRU
LRU代表當快取滿(該桶滿)時替換掉該桶最久沒用過的資料
但是要記錄該桶中哪個資料最久沒人用就是個問題了
當N = 2的時候真實LRU基本上可以輕易做出
但是當N = 8 或 N = 16+時要做出個真實LRU會死人
這時候大家都來近似LRU 但近似的如何....很難說
近似LRU比真實LRU在命中率上減損多少也很難說(這部份會抵消增加關聯度所提高之命中)

上面的這一長串可以不看或看不懂
但是至少要知道[快取關聯度和快取大小不大相關)
==========================================================
今天假設兩公司技術能力相等
兩方的快取大小不同時也會造成速度上差異
兩方快取大小相等時也會因為關聯度不同而造成命中率差異
就算關聯度相同快取大小也相同也可能因為LRU近似法不同而產生命中率差異
又有如我之前提過的那篇PDF中所述
K10某些階的管線處理能力永遠也不可能被滿載
所以我從一開始回文到最後面我想說的一直只有一件事
只用部分可以獲得的資訊想去推測整體是不智的

引用:

作者dynamo

這句話不是樓主你自己說的嗎？

所以呢？光這樣你就要硬拗快取只能比大小或只能比速度？？？還是你的中文程度就只會曲解他人的文意？？？
　
　

回84樓：

一、有關「快取關聯度和快取大小不大相關」，可否請你以K8為例，分析一下為何L1(64K)只有2路關聯，但L2(512K)卻有16路關聯，若不大相關為何要如此設計？

二、「只用部分可以獲得的資訊想去推測整體是不智的」-> 是，但我69樓也說過「AMD及Intel都只會把快取越做越快及越做越大」，所以至少在片面性能的推測上是有跡可尋的，如果我之前的發言讓你認為我是在推測整體，很抱歉我也只能在此稍加澄清了 :stupefy:
　
　

怎麼這種問題每年都有一篇啊?

我覺得....
想要請別人教授我們不懂的知識
情緒性的字眼最好還是別放上來比較適合

對了，事先講好
我對Intel & AMD 的分支預測完全不熟
我的專長只有Power management的部份
所以了解的大概就DeepVoice講的那套 :shy:

廢話太多回正題吧
去年年初就有人問過類似的問題
當時我也丟了wikipedia的資料出來
不過因為沒翻譯好像也沒幾個人有反應

我也順便整理一下wikipedia 有關Cache原理及使用狀況的連結
wikipedia - CISC
wikipedia - CPU
wikipedia - CPU Cache

另外，我雖然不能提出證明
但AMD及Intel在Cache分支預測上就我所知的概念已經南轅北轍
(當然 VIA 也是)
如果visionary_pcdvd你有空看一下CPU cache那裡的Discussion就知道
之前也為了Verifiability(可供查證)產生一些討論

所以
與其去比較"快取技術誰比較強?"這種較為抽象的概念

倒不如說是預測分支的演算法比較合適
畢竟如果你對演算法熟悉的話
就會知道
沒有一種演算法是 "絕對" 比較強這類的話

在不同的演算法下，不同的空間下會有不同的效率
(繞口令?)

況且這是公司內部Intellectual property的一部份
你想在PCDVD上找到答案我想

很難

感謝DeepVoice真是佛心來的
舉的例子很簡單明暸
就算沒摸過最基礎的計概大概也懂
像我就沒那麼多力氣去解釋了 :D

另外
我想給visionary幾句話
都有人給了
魚餌、魚竿及說明手冊
釣不釣魚我想還是待看你自己

雖然我也沒資格說別人就是 :jolin:

最後送給各位一些東西

Now as touching things offered unto idols, we know that we all have knowledge.
Knowledge puffeth up, but charity edifieth.

~ First Epistle to the Corinthians Chapter 8

回路過大：

情緒性的字眼好像不是我先開始用的(如果您是指我的話)，有些發言態度很差的總不能怪我也相同的態度彈回去吧

快取進階知識有DeepVoice的細說及您提供的連結相信對大家都有幫助。但怪的是有心人為何不自己主動發一篇專文來分享，反而要以我的發言為開端來借題發揮，當中的心態其實是值得玩味的

雖然快取相關知識我懂的遠不及您跟DeepVoice，但也還不至於膚淺到只知道容量及速度，正因為誰的快取演算法比較強無法證明或比較，所以當我在比較時才會不考慮那類變數，一堆人不明究理就自以為是的批哩啪啦的開火實在是不可理喻
　
　

cache不能單獨比

還要配合整體架構和適合的演算法

說AMD cache比Intel會很奇怪

直接說AMD cpu比較弱還比較合理

加大cache帶來的好處(增加命中率)和壞處(速度降低,成本)

兩家會去做trade off

看一家拼命加大可能代表了

成本沒增加很多

好處>壞處

數字遊戲

總之cpu應該還是比實際應用

板上應該也沒多少人真的懂實際的技術

學的理論也可能和實際的有差異

最後就淪為大家嘴砲囉, 誰也不知道誰在講啥

引用:

作者以月為影

cache不能單獨比
還要配合整體架構和適合的演算法
說AMD cache比Intel會很奇怪
直接說AMD cpu比較弱還比較合理
加大cache帶來的好處(增加命中率)和壞處(速度降低,成本)
兩家會去做trade off
看一家拼命加大可能代表了
成本沒增加很多
好處>壞處
數字遊戲
總之cpu應該還是比實際應用
板上應該也沒多少人真的懂實際的技術
學的理論也可能和實際的有差異
最後就淪為大家嘴砲囉, 誰也不知道誰在講啥

說真的整個言論方向被大家導向到只剩下快取的話題實在太離譜

Sandy Bridge 或是整個 Intel CPU 架構應該還有很多值得討論的地方

但大家幾乎只把焦點集中在技術相對次要的快取子系統上真的是很無言 :jolin: