PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   AMD Fusion第二波:CPU/GPU 2015年徹底融合 (https://www.pcdvd.com.tw/showthread.php?t=894507)

airitter 2010-05-15 12:16 PM

引用:
作者orakim
現在AMD,intel的作法不同處在
AMD將核心單純化
intel則是核心複雜化


到後面兩家無聊的時候不知道會不會變成

一半的晶片面積單純化,另一半的晶片面積複雜化,來互補

DeepVoice 2010-05-15 12:30 PM

假設有看過http://www.agner.org/optimize/的這篇PDF
The microarchitecture of Intel, AMD and VIA CPUs

當然 作者有說單純是個人研究 可能未必準確
但是我們看到了在AMD的Bottleneck部份表示
作者認為amd的執行單元相較於可能利用到的運算能量明顯過多(用much larger這個字)
畢竟整數管線除了乘法有限定alu0才能做之外
其他的運算都可以由任意的三條管線之一來做
和Intel的架構(管線的專一性 該這樣稱呼媽 比較大)不大好比
但至少可以推測縮減一整條管線對效能衝擊應該不大

而且依據文中所述 amd在拆μop的時候比Intel來的懶
也就是每個μop比起Intel的μop相對能完成的事比較多(好或不好難說)
所以單比幾個μop也很難做評論依據
而且沒有規定說每代的產品μop要拆的一樣大(怎麼拆不影響外顯特性)

所以還是老話一句 要出來才知道

對了 我手邊的是他去年8月左右的版本
今年2月左右他又更新了資料
但是我想細節上變動應該不大
假如有發現和我敘述有偏差的部分歡迎指正

DeepVoice 2010-05-15 03:04 PM

回的有點晚了不能改 只能再加一篇

其實我想說的是所謂短版法則
今天假設執行單元數量是amd比較長的那塊木板
那把它變短點不影響整個木桶所能裝的水

還有就是前面一些敘述上的問題
直接拿wiki的mutithread來說比較快
http://en.wikipedia.org/wiki/Multithreading
mutithread的實作方式可以有多種
而Intel的HT只是SMT的一種實作產物罷了
用HT稱呼SMT或是整個mutithread似乎不大恰當

況且說實在假如amd很閑的話要搞個Fine-grained multithreading還不簡單
單核16thread都有可能(當然可以推估每個thread都會夭獸慢)
而且總體產量會最高歐(假設真有16thread跑 這樣真的想來可以忽略所有hazard)
做不做這種東西通常考慮的不是所謂的技術力
而是加入了這個東西是否真能對效能有幫助
雖然對執行單元過多的泛K8架構來說多數個thread來使用管線似乎不錯
但是實際上沒有加入這類技術的理由就不得而知了
單純以沒有資助某個SMT的研究來做理由似乎有點牽強

還是老話一句 個人是A FAN 言語之中有所偏頗也是很合理的 科科

playgamefun 2010-05-15 05:47 PM

John Fruehe說四核心的bulldozer整數效能相比同頻率四核心K10提升10%~35%,所以整數部分不可能是2ALU+2AGU
http://www.amdzone.com/phpbb3/viewt...p?f=52&t=137216

physx 2010-05-15 06:35 PM

引用:
作者playgamefun
John Fruehe說四核心的bulldozer整數效能相比同頻率四核心K10提升10%~35%,所以整數部分不可能是2ALU+2AGU
http://www.amdzone.com/phpbb3/viewt...p?f=52&t=137216


請問一下,這裡的四核心是指雙模塊的推土機嗎?

我記得推土機這個架構是核心數越多性能提升也會越來越多

而現在的CPU是核心數越多性能提升會越來越少

假設現在的CPU是雙核(100%)>四核(150%)>六核(180%)>八核(200%)

那推土機架構就可能是雙核(100%)>四核(150%)>六核(250%)>八核(450%)

我這樣的推測正確嗎 :confused:

polominokimo 2010-05-15 08:37 PM

引用:
作者playgamefun
John Fruehe說四核心的bulldozer整數效能相比同頻率四核心K10提升10%~35%,所以整數部分不可能是2ALU+2AGU
http://www.amdzone.com/phpbb3/viewt...p?f=52&t=137216


但是目前看起來似乎就是2ALU+2AGU

就算只有2ALI+2AGU也不見得效能會比較低
因為在精簡這麼多電晶體的狀態下,時脈也許會拉高不少

physx 2010-05-15 08:51 PM

引用:
作者polominokimo
但是目前看起來似乎就是2ALU+2AGU

就算只有2ALI+2AGU也不見得效能會比較低
因為在精簡這麼多電晶體的狀態下,時脈也許會拉高不少


有時脈3.0Ghz(Turbo 4.0Ghz)的可能嗎 :flash:

polominokimo 2010-05-15 09:11 PM

引用:
作者physx
有時脈3.0Ghz(Turbo 4.0Ghz)的可能嗎 :flash:


在別的地方看到的
這裡
以現有的K10.5 3G來看
推土機預計會有4Ghz(以上!,應該不是Turbo)
這只是推測
基本上45nm都可以做到6Core 3G了
32nm要拉高時脈應該沒有很大的問題(只不過Module數量就不清楚了)

physx 2010-05-15 09:50 PM

引用:
作者polominokimo
在別的地方看到的
這裡 (https://www.blogger.com/comment.g?b...752573503040158)
以現有的K10.5 3G來看
推土機預計會有4Ghz(以上!,應該不是Turbo)
這只是推測
基本上45nm都可以做到6Core 3G了
32nm要拉高時脈應該沒有很大的問題(只不過Module數量就不清楚了)


時脈4.0Ghz起跳,那Turbo不就5.X :shock:

推土機有八顆核心所以是四模塊吧

這裡我又有問題了,既然一個模塊的大小只跟sandy橋差不多

為何sandy橋可以有八核心,推土機做不到八模塊呢 :confused:

polominokimo 2010-05-15 10:26 PM

引用:
作者physx
時脈4.0Ghz起跳,那Turbo不就5.X :shock:

推土機有八顆核心所以是四模塊吧

這裡我又有問題了,既然一個模塊的大小只跟sandy橋差不多

為何sandy橋可以有八核心,推土機做不到八模塊呢 :confused:


你去看Sandy Bridge 8Core有沒有GPU
那個8Core不是用在桌上型的
有GPU的應該只有4Core(初期)

至於推土機8Module
不知道是不是這個 Interlagos
http://hothardware.com/News/AMD-Pla...-CPUs-For-2011/
Server用的


所有的時間均為GMT +8。 現在的時間是01:29 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2026。