PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 系統組件
帳戶
密碼
 

  回應
 
主題工具
visionary_pcdvd
*停權中*
 

加入日期: Jan 2008
文章: 1,281
引用:
作者firmware
反正HT就是那些神級電資博士發明的就對了(基本上計算機的東西都是神級才能搞得), 然後intel當然就挖角買專利請對方把HT給用進P4就對了, 在我看來跟只出錢沒啥兩樣, 不過這不是重點(另外驗證相對來說是小事情).

基本上intel家大業大, 他旗下養了一海票實驗室, 從各式各樣的IC Design到OS/compiler到純軟體都有, 我研二的時候老師有請了一個做intel IA64 compiler的頭來我們學校演講, 完全聽不懂.....

如果驗證是小事,那 AMD 為何連複雜度相對單純很多的 L3 都會出錯???

當今隨便一顆主流晶片就能用掉數億顆電晶體,而且很快就會超過十億顆,驗證當真是小事???

更不要說 HT 是二個執行緒共用一樣的解碼單元及執行單元...等,只要隨便一個環節的設計沒考慮清楚,不小心讓 B執行緒 的資料蓋掉 A執行緒 的資料,那就是天大的災難!你還認為驗證是小事!!!
 


題外話,K7~K10 也不是 AMD 原本的團隊所設計,套用你的邏輯這些產品都跟 AMD 沒關係,真是太扯了

但有一點你說對了,Intel 家大業大...,總之其龐大的研發經費足以支撐各種架構或各種技術的開發,一時敗陣或一時犯錯都沒關係,只要下一代產品吸取經驗就能大幅贏回來,這才是 Intel 最可怕的地方
 
 
     
      
舊 2010-05-15, 12:57 AM #41
回應時引用此文章
visionary_pcdvd離線中  
orakim
Master Member
 

加入日期: Sep 2003
文章: 1,810
這是回#37的
看圖片比較快

一個完整推土機最小完整單位是模組
如果稱一個最小完整單位為1 core,那推土機就是1M=1C2T
不過推土機比較接近於實體2core勝過於intel 的HT
所以一般人還是會直接說推土機是1M≒2C2T

這個推土機的1M跟K10的2C2T比起來效能低了一些 面積也小了一點
效能低的部位會出現在整數運算單元(K10有三個,推土機1M有四個->1核心兩個)
AMD認為 CPU有三個整數單元有點矯枉過正
三個整數單元比起兩個來說 電晶體增加很多,效能只增加一些

現在AMD,intel的作法不同處在

AMD將核心單純化,可提昇使用效率、降低耗電(時脈可能因此受惠可以拉高一些)
單純化的結果是單執行緒會慢一些,把Performance/Watt 提高 多執行緒程式是它的優勢

intel則是核心複雜化,單執行緒、多執行緒都想要吃下來
耗電量增大 時脈可能拉不高 (在製程能力優於AMD的前提下,這些缺點可能不是問題)
 

此文章於 2010-05-15 02:18 AM 被 orakim 編輯. 原因: 這是回#37的
舊 2010-05-15, 02:10 AM #42
回應時引用此文章
orakim離線中  
florance
Golden Member
 
florance的大頭照
 

加入日期: Dec 2003
文章: 3,688
引用:
作者orakim
如果稱一個最小完整單位為1 core,那推土機就是1M=1C2T
不過推土機比較接近於實體2core勝過於intel 的HT
所以一般人還是會直接說推土機是1M≒2C2T
...


如果,稍微修改一下說法;

一個完整的區塊為 1 Block,那推土機就是 1B = 2C2T
兩顆整數處理核心 + 兩條執行緒 + 共用的浮點運算單元

問題在於推土機架構,
當資料一進來時就會分成兩條執行緒,進入兩個分開的整數核心內運算。
若有浮點運算需求,就會啟用核心共用的浮點運算功能。

這部分跟 Intel 的 HT 概念與實作又有所差異。
__________________

報導者 疫苗進行式:COVID-19全球疫苗接種即時追蹤

真的珍惜自己帳號的人: 停權帳號 申請復帳方式。
台灣事實查核中心 為IFCN國際事實查核聯盟合作夥伴, 為台灣打擊錯誤訊息
滑坡謬誤 (Slippery slope) 是一種非形式謬誤,使用連串的因果推論,卻誇大了每個環節的因果強度,而得到不合理的結論

LGBT人物列表 世界會因為不同的崎見而多樣化, 卻會因為歧視而步向對立。
美研究壓倒性共識:同性戀家庭與異性戀養育的子女並無差異, 發明癌症試紙的同志男孩

[分享]Asrock 939Dual-SATA2 與 BBA X800XL 相容性問題!!

使用 Microsoft TweakUI 關閉 Autorun.inf
死雞 11 SMART BAD 請注意
手上有 死雞 12 的朋友請注意!! 屎雞 韌體更新!! 上映中 Barracuda 7200.12 Firmware Update "CC3E"
Amazfit 米動手錶青春版 錶面更換步驟 & 錶面下載
舊 2010-05-15, 02:24 AM #43
回應時引用此文章
florance離線中  
Axel_K
Elite Member
 
Axel_K的大頭照
 

加入日期: Sep 2006
您的住址: 人群中
文章: 4,214
引用:
作者firmware
反正HT就是那些神級電資博士發明的就對了(基本上計算機的東西都是神級才能搞得), 然後intel當然就挖角買專利請對方把HT給用進P4就對了, 在我看來跟只出錢沒啥兩樣, 不過這不是重點(另外驗證相對來說是小事情).

基本上intel家大業大, 他旗下養了一海票實驗室, 從各式各樣的IC Design到OS/compiler到純軟體都有, 我研二的時候老師有請了一個做intel IA64 compiler的頭來我們學校演講, 完全聽不懂.....

人之常情,一般是強者恆強 ...如果強者沒犯什麼錯誤的話
如果你是電機博士或博士後,AI兩家同時看上,一般人選I社的比例還是會比較多
更不用說如果是挖角,I社能給的利益也會比較大
舊 2010-05-15, 02:25 AM #44
回應時引用此文章
Axel_K離線中  
airitter
Master Member
 
airitter的大頭照
 

加入日期: Sep 2003
文章: 2,102
你們講得都好深奧

那舉個例子------假設[推土機增加50%的面積 最高提升80%] 原始的CINEBENCH R10 1X分數為3800分 推土機架構1X為?
1. 3800 x 1.8 = 6840分
2. 3800 x 1.2 = 4560分

哪一個?
__________________
[ExtremeTech]VGAMaster
舊 2010-05-15, 02:49 AM #45
回應時引用此文章
airitter離線中  
orakim
Master Member
 

加入日期: Sep 2003
文章: 1,810
引用:
作者florance
如果,稍微修改一下說法;

一個完整的區塊為 1 Block,那推土機就是 1B = 2C2T
兩顆整數處理核心 + 兩條執行緒 + 共用的浮點運算單元

這邊錯了,一個完整區塊就是一個模組(module) 不需要特別命名
一個模組有兩個整數核心,這兩個整數核心內各有兩個整數運算單元
1M≒2C2T,1C≒ 2 Integer Pipe + share L2 +share FPU

還是來個推土機跟K10的比對圖 比較快
草綠+藍綠為一個整數運算(Integer Pipe)


引用:
問題在於推土機架構,
當資料一進來時就會分成兩條執行緒,進入兩個分開的整數核心內運算。

要看進來的執行緒是一個還是兩個,一個核心只會對應一個執行緒

引用:
作者airtter
你們講得都好深奧
那舉個例子------假設[推土機增加50%的面積 最高提升80%] 原始的CINEBENCH R10 1X分數為3800分 推土機架構1X為?


要看產品才知道實際效應,如果要大略估計的話
那1模組的推土機架構依AMD的簡報提到效能為1.8倍的 K10 (單核心)
但應該要更保守一點估計為 1.6∼1.8倍 的K10
因為還要看該程式運算會不會很偏重整數部份 及 核心單純化後的時脈可以提高多少

此文章於 2010-05-15 05:25 AM 被 orakim 編輯.
舊 2010-05-15, 05:15 AM #46
回應時引用此文章
orakim離線中  
polominokimo
Major Member
 
polominokimo的大頭照
 

加入日期: Jan 2009
文章: 222
所以推土機1Core到底是1cycle/4 MicroOP 還是2 MircoOP
2MircoOP的話那單核整數性能真的是倒退嚕了

為什麼我看到很多地方都是寫4 MicroOP
__________________
2009
舊 2010-05-15, 07:14 AM #47
回應時引用此文章
polominokimo離線中  
visionary_pcdvd
*停權中*
 

加入日期: Jan 2008
文章: 1,281
引用:
作者polominokimo
所以推土機1Core到底是1cycle/4 MicroOP 還是2 MircoOP
2MircoOP的話那單核整數性能真的是倒退嚕了
為什麼我看到很多地方都是寫4 MicroOP

推土機架構圖中有關微指令的部分都是打問號,所以還是等真正的架構圖定案再說吧

但可確定的是每個整數核心中只有兩條整數管線,比前代少了一條

對不支援多執行緒的程式來說同時脈下的效能是一定會降低一些的
 
 
舊 2010-05-15, 07:43 AM #48
回應時引用此文章
visionary_pcdvd離線中  
orakim
Master Member
 

加入日期: Sep 2003
文章: 1,810
引用:
作者polominokimo
所以推土機1Core到底是1cycle/4 MicroOP 還是2 MircoOP
2MircoOP的話那單核整數性能真的是倒退嚕了
為什麼我看到很多地方都是寫4 MicroOP

http://pc.watch.impress.co.jp/docs/...205_346902.html
因為K10是6個MicroOP(K7、K8也都是6個),推土機就算有4個 整數運算也已經是倒退了
這也是上一篇回覆我預估1.6倍的原因(1+2/3)
不過估錯了 整數運算最低應該估1.3倍才對 (2/3+2/3)

推土機單核心整數運算的架構類似於K6世代
未來筆電上的山貓、現在intel的atom 也都是這樣
不太一樣的是 Atom是in-order,AMD的是out-of-order
(效能應該不會像Atom那樣離譜)
舊 2010-05-15, 09:36 AM #49
回應時引用此文章
orakim離線中  
polominokimo
Major Member
 
polominokimo的大頭照
 

加入日期: Jan 2009
文章: 222
主要是在看K7/K8/K10雖然是6 MicroOP(uOPs)
但是它上面的Instruction Decode Unit(指令解碼單元)
K7/8/10-3Way (3-6-3)
Bulldozer-4Way (4-4-2)
以Throughput峰值來說3way應該還是小於4way
所以我想整數應該還不至於會退化到K6-3 (2-4-2)
__________________
2009
舊 2010-05-15, 12:13 PM #50
回應時引用此文章
polominokimo離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是06:56 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2026。