![]() |
||
Master Member
![]() ![]() ![]() ![]() 加入日期: Sep 2003
文章: 2,102
|
AMD公佈推土機、山貓新架構大量細節
轉貼:http://news.mydrivers.com/1/173/173020.htm
美國加州帕洛阿爾托�**|行的第22屆Hot Chips高性能芯片大會上,AMD如約公佈了「推土機」(Bulldozer)、「山貓」(Bobcat)兩款全新處理器架構的更多技術細節。AMD院士兼推土機總設計師Mike Butler、AMD院士兼山貓總設計師Brad Burgess均出席會議並分別發表了相關演講。 ![]() 推土機架構主攻性能和擴展性,面向主流客戶端和服務器領域,山貓架構的重點則是靈活性、低功耗和小尺寸,將用於低功耗設備、小型設備、雲客戶端。 ![]() 推土機將採用新的模塊化設計,每個模塊擁有兩個四管線核心,彼此共享一個浮點調度器和兩個128位乘法累加單元(FMAC)。兩個核心都擁有自己的整數調度器、一級數據緩存,並預取、解碼單元和二級緩存。 新架構還將有全新的x86指令集支持,包括SSE4.1、SSE4.2、AVX、XOP。 ![]() ![]() ![]() 因為除了高性能計算領域之外浮點運算量並不多,這種浮點調度器共享設計能大大節省晶體管、核心面積、功耗,降低成本;兩個FMAC單元既可以被每個核心單獨使用,也可以合併組成一個256位FMAC單元,當然這需要程序代碼做相應改變。為了獲得最大程度的性能功耗比,推土機架構還會在共享、專用單元之間動態切換。 ![]() ![]() ![]() 推土機的模塊可以通過HyperTransport高速點對點總線多個累加在一起,組成更多核心產品,比如代號英特拉格斯的Opteron 6200系列服務器處理器就有6-8個模塊、12-16個核心,代號巴倫西亞的Opteron 4200系列則有3-4個模塊、6-8個核心,它們會分別取代現有的8-12核心Opteron 6100系列、4-6核心的Opteron 4100系列,均採用GlobalFoundries 32nm SOI工藝製造。 AMD表示,模塊化設計能夠加速芯片開發、提高產品靈活性,同時對硬件、操作系統、應用軟件來說都是透明的。 ![]() 此外推土機還是一個非常強調效能的架構,支持更先進的電源管理技術。因為浮點單元上的共享,每個模塊內第二個整數核心所需要的電路只佔總核心面積的12%,從芯片級別上講這只會給整個內核增加5%的電路。更多的核心、更少的空間,這顯然有利於提高單位功耗、單位成本的性能。 ![]() 簡單地說,推土機是AMD徹底重新設計的核心,將成為AMD下一代高性能處理器技術,用於客戶端和服務器領域,相比於Opteron 6100系列會增加33%的核心、大約50%的性能。 ![]() 再來看山貓,這是一種小尺寸、高效能、低功耗的x86核心,同時具有出色的性能,可在不同設計、製造工藝上輕鬆移植。 ![]() 山貓核心使用的是亂序執行引擎(Atom是順序執行),集成兩個x86解碼器、高級分支預測期、完整亂序指令執行、完整亂序載入與存儲引擎、高性能浮點單元、32KB一級緩存、512KB二級緩存,完整支持ISA、SSE1/2/3、SSSE3指令集和虛擬化技術,單個核心功耗可降至1W以下,估計能以不到一半的核心面積達到當今主流性能的90%。 ![]() ![]() ![]() ![]() ![]() ![]() 山貓架構的首款產品是即將於今年底明年初發佈、面向輕薄本和上網本的第一款Fusion APU加速處理器「安大略湖」(Ontario),確切地說是其中的CPU部分。Ontario APU之內除了山貓CPU引擎之外,還有SIMD引擎陣列(GPU圖形核心)、UVD解碼單元、高性能總線和內存控制器、系統接口,將採用台積電40nm工藝製造。 ![]() ![]()
__________________
[ExtremeTech]VGAMaster |
|||||||
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Sep 2003
文章: 2,102
|
看起來只是廣告而已
![]()
__________________
[ExtremeTech]VGAMaster |
||
![]() |
![]() |
Senior Member
![]() ![]() ![]() 加入日期: Apr 2010
文章: 1,048
|
之前說是16核心產品效能比12核心提高了50%
不知道明年8核心是不是也比現有6核心多50% 比1090T多50%性能,同時TDP小於95W 不做到這樣是沒辦法抗衡明年intel的SNB的 |
![]() |
![]() |
Major Member
![]() 加入日期: Jan 2009
文章: 222
|
這個Decode是四個複雜嗎還是?
__________________
2009 ![]() |
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Sep 2003
文章: 2,102
|
引用:
以多核心下去推算是多50% 前新聞有看到 推土機單核效能只多12.5% 不過核心簡化頻率可以更高吧? 用以前的製成和面積和最近的資料可以推算出 32nm 8核心(四模塊)+L3 8M 晶片面積約在240mm2左右 240mm2的面積 因該不用懷疑 剛出來一定是125W的 註:45nm-Phenom II X4 L3:6MB DIE面積:258mm2 125W 而到2012年沒意外也一樣會出 12核心(六模塊) 到時8核心(四模塊) 就變 95W了
__________________
[ExtremeTech]VGAMaster 此文章於 2010-08-24 08:00 PM 被 airitter 編輯. |
|
![]() |
![]() |
Senior Member
![]() ![]() ![]() 加入日期: Apr 2010
文章: 1,048
|
引用:
原來8C推土機晶片大小跟現在X4飛龍二差不多 2012能12核心 ![]() 過去3年高階都是四核心的天下 今年變6C,明年變8C,後年又變12C 如果真是這樣的話要好好感謝AMD帶動整個CPU產業的進步 現在AMD被多數人挖苦CPU單核心效能不足,6C的功耗又太高 ,整體不如i7 如果明年8C推土機還贏不了4C8T的i7那就真的沒救了 此文章於 2010-08-24 08:58 PM 被 physx 編輯. |
|
![]() |
![]() |
*停權中*
加入日期: Nov 2002 您的住址: 東湖
文章: 1,688
|
引用:
推土機的想法跟SPARC T1一樣 名義上的一個核心不是一個完整的核心 所以推土機的8C實務上只能視為加強版的4C8T 單核心效能上是否能與Westmere匹敵還是很大的未知數(在下是不看好) 但是這麼做的優點是晶片面積小 成本低 加上每個1T的體質比HT好 如果狀況好 在Multi-Threading的環境下應該會比Westmere快 |
|
![]() |
![]() |
Junior Member
![]() ![]() ![]() 加入日期: Jun 2010
文章: 803
|
講的很好聽~實際上之後應該也是被打假的
主打整數運算是很好啦 但是需要浮點運算的時候他們要如何處理 不是每個人都只是上上網、打打報告、看看X片這麼簡單吧 AMD常常說的跟做出來的都是兩回事
__________________
良興卡號:13214833 |
![]() |
![]() |
Master Member
![]() ![]() ![]() ![]() 加入日期: Sep 2003
文章: 2,102
|
引用:
覺得能打平就不錯了 還是覺得Fusion比較重 畢竟是新東西 不知道現在裡面的GPU是只有顯示功能,還是還可以幫CPU運算 能幫CPU運算就有趣了 山貓微架構不是很懂 希望有人可以幫解讀一下
__________________
[ExtremeTech]VGAMaster |
|
![]() |
![]() |
*停權中*
加入日期: Aug 2005
文章: 3,050
|
現在的GPU市場已經算是良性競爭很不錯的發展
CPU市場仍舊一面倒的...INTEL還是主宰著此領域... 9K價位在20個月以前叫做I7-920 現在是I7-930... 過了大概600天...中高階端的效能領域提昇只有5%... 6K的價位帶也只從I5-750變成760..有長進跟沒長進差不多 四核心到現在都過了幾年了 還有9K的雙核心再賣..i5-670 證明市場的失調真是嚴重 |
![]() |
![]() |