PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   AMD公佈推土機、山貓新架構大量細節 (https://www.pcdvd.com.tw/showthread.php?t=903189)

airitter 2010-08-24 06:34 PM

AMD公佈推土機、山貓新架構大量細節
 
轉貼:http://news.mydrivers.com/1/173/173020.htm

美國加州帕洛阿爾托�**|行的第22屆Hot Chips高性能芯片大會上,AMD如約公佈了「推土機」(Bulldozer)、「山貓」(Bobcat)兩款全新處理器架構的更多技術細節。AMD院士兼推土機總設計師Mike Butler、AMD院士兼山貓總設計師Brad Burgess均出席會議並分別發表了相關演講。


推土機架構主攻性能和擴展性,面向主流客戶端和服務器領域,山貓架構的重點則是靈活性、低功耗和小尺寸,將用於低功耗設備、小型設備、雲客戶端。


推土機將採用新的模塊化設計,每個模塊擁有兩個四管線核心,彼此共享一個浮點調度器和兩個128位乘法累加單元(FMAC)。兩個核心都擁有自己的整數調度器、一級數據緩存,並預取、解碼單元和二級緩存。 新架構還將有全新的x86指令集支持,包括SSE4.1、SSE4.2、AVX、XOP。

推土機微架構示意圖
K10 Phenom II微架構示意圖

因為除了高性能計算領域之外浮點運算量並不多,這種浮點調度器共享設計能大大節省晶體管、核心面積、功耗,降低成本;兩個FMAC單元既可以被每個核心單獨使用,也可以合併組成一個256位FMAC單元,當然這需要程序代碼做相應改變。為了獲得最大程度的性能功耗比,推土機架構還會在共享、專用單元之間動態切換。

AMD宣稱,這種共享模塊化設計的多線程執行效率要大大優於同步多線程(SMT)和芯片多處理(CMP)。SMT最典型的實例就是Intel的超線程技術,它強制兩個線程進入一個核心,線程之間會爭奪資源,影響效率;CMP則是一個線程對應多個專用核心,浪費資源。



推土機的模塊可以通過HyperTransport高速點對點總線多個累加在一起,組成更多核心產品,比如代號英特拉格斯的Opteron 6200系列服務器處理器就有6-8個模塊、12-16個核心,代號巴倫西亞的Opteron 4200系列則有3-4個模塊、6-8個核心,它們會分別取代現有的8-12核心Opteron 6100系列、4-6核心的Opteron 4100系列,均採用GlobalFoundries 32nm SOI工藝製造。

AMD表示,模塊化設計能夠加速芯片開發、提高產品靈活性,同時對硬件、操作系統、應用軟件來說都是透明的。


此外推土機還是一個非常強調效能的架構,支持更先進的電源管理技術。因為浮點單元上的共享,每個模塊內第二個整數核心所需要的電路只佔總核心面積的12%,從芯片級別上講這只會給整個內核增加5%的電路。更多的核心、更少的空間,這顯然有利於提高單位功耗、單位成本的性能。


簡單地說,推土機是AMD徹底重新設計的核心,將成為AMD下一代高性能處理器技術,用於客戶端和服務器領域,相比於Opteron 6100系列會增加33%的核心、大約50%的性能。


再來看山貓,這是一種小尺寸、高效能、低功耗的x86核心,同時具有出色的性能,可在不同設計、製造工藝上輕鬆移植。


山貓核心使用的是亂序執行引擎(Atom是順序執行),集成兩個x86解碼器、高級分支預測期、完整亂序指令執行、完整亂序載入與存儲引擎、高性能浮點單元、32KB一級緩存、512KB二級緩存,完整支持ISA、SSE1/2/3、SSSE3指令集和虛擬化技術,單個核心功耗可降至1W以下,估計能以不到一半的核心面積達到當今主流性能的90%。



山貓微架構示意圖

Atom微架構示意圖

山貓架構管線

Atom架構管線

山貓架構的首款產品是即將於今年底明年初發佈、面向輕薄本和上網本的第一款Fusion APU加速處理器「安大略湖」(Ontario),確切地說是其中的CPU部分。Ontario APU之內除了山貓CPU引擎之外,還有SIMD引擎陣列(GPU圖形核心)、UVD解碼單元、高性能總線和內存控制器、系統接口,將採用台積電40nm工藝製造。



airitter 2010-08-24 06:37 PM

看起來只是廣告而已 :stupefy:

physx 2010-08-24 07:04 PM

之前說是16核心產品效能比12核心提高了50%
不知道明年8核心是不是也比現有6核心多50%

比1090T多50%性能,同時TDP小於95W
不做到這樣是沒辦法抗衡明年intel的SNB的

polominokimo 2010-08-24 07:43 PM

這個Decode是四個複雜嗎還是?

airitter 2010-08-24 07:51 PM

引用:
作者physx
之前說是16核心產品效能比12核心提高了50%
不知道明年8核心是不是也比現有6核心多50%

比1090T多50%性能,同時TDP小於95W
不做到這樣是沒辦法抗衡明年intel的SNB的

以多核心下去推算是多50%

前新聞有看到 推土機單核效能只多12.5%
不過核心簡化頻率可以更高吧?

用以前的製成和面積和最近的資料可以推算出
32nm 8核心(四模塊)+L3 8M 晶片面積約在240mm2左右

240mm2的面積 因該不用懷疑 剛出來一定是125W的
註:45nm-Phenom II X4 L3:6MB DIE面積:258mm2 125W

而到2012年沒意外也一樣會出 12核心(六模塊)
到時8核心(四模塊) 就變 95W了

physx 2010-08-24 08:52 PM

引用:
作者airitter
以多核心下去推算是多50%

前新聞有看到 推土機單核效能只多12.5%
不過核心簡化頻率可以更高吧?

用以前的製成和面積和最近的資料可以推算出
32nm 8核心(四模塊)+L3 8M 晶片面積約在240mm2左右

240mm2的面積 因該不用懷疑 剛出來一定是125W的
註:45nm-Phenom II X4 L3:6MB DIE面積:258mm2 125W

而到2012年沒意外也一樣會出 12核心(六模塊)
到時8核心(四模塊) 就變 95W了


原來8C推土機晶片大小跟現在X4飛龍二差不多
2012能12核心:confused: 這可真是一件好事

過去3年高階都是四核心的天下
今年變6C,明年變8C,後年又變12C
如果真是這樣的話要好好感謝AMD帶動整個CPU產業的進步

現在AMD被多數人挖苦CPU單核心效能不足,6C的功耗又太高 ,整體不如i7
如果明年8C推土機還贏不了4C8T的i7那就真的沒救了

dabochi 2010-08-24 09:27 PM

引用:
作者physx
原來8C推土機晶片大小跟現在X4飛龍二差不多
2012能12核心:confused: 這可真是一件好事

過去3年高階都是四核心的天下
今年變6C,明年變8C,後年又變12C
如果真是這樣的話要好好感謝AMD帶動整個CPU產業的進步

現在AMD被多數人挖苦CPU單核心效能不足,6C的功耗又太高 ,整體不如i7
如果明年8C推土機還贏不了4C8T的i7那就真的沒救了


推土機的想法跟SPARC T1一樣 名義上的一個核心不是一個完整的核心
所以推土機的8C實務上只能視為加強版的4C8T
單核心效能上是否能與Westmere匹敵還是很大的未知數(在下是不看好)
但是這麼做的優點是晶片面積小 成本低
加上每個1T的體質比HT好 如果狀況好 在Multi-Threading的環境下應該會比Westmere快

魚骨頭 2010-08-24 09:31 PM

講的很好聽~實際上之後應該也是被打假的

主打整數運算是很好啦

但是需要浮點運算的時候他們要如何處理

不是每個人都只是上上網、打打報告、看看X片這麼簡單吧

AMD常常說的跟做出來的都是兩回事

airitter 2010-08-24 09:52 PM

引用:
作者physx
原來8C推土機晶片大小跟現在X4飛龍二差不多
2012能12核心:confused: 這可真是一件好事

過去3年高階都是四核心的天下
今年變6C,明年變8C,後年又變12C
如果真是這樣的話要好好感謝AMD帶動整個CPU產業的進步

現在AMD被多數人挖苦CPU單核心效能不足,6C的功耗又太高 ,整體不如i7
如果明年8C推土機還贏不了4C8T的i7那就真的沒救了


覺得能打平就不錯了

還是覺得Fusion比較重 畢竟是新東西
不知道現在裡面的GPU是只有顯示功能,還是還可以幫CPU運算 能幫CPU運算就有趣了
山貓微架構不是很懂 希望有人可以幫解讀一下

toyakoyo99 2010-08-25 12:54 AM

現在的GPU市場已經算是良性競爭很不錯的發展
CPU市場仍舊一面倒的...INTEL還是主宰著此領域...
9K價位在20個月以前叫做I7-920
現在是I7-930...
過了大概600天...中高階端的效能領域提昇只有5%...
6K的價位帶也只從I5-750變成760..有長進跟沒長進差不多
四核心到現在都過了幾年了
還有9K的雙核心再賣..i5-670
證明市場的失調真是嚴重


所有的時間均為GMT +8。 現在的時間是06:08 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。