嚴格來講是分享化+簡化 (FPU共享大概是Bulldozer最像HT的地方)
分享共有的原因是FPU很少用到
"一個模組只跑一個執行緒的FPU"效能理論上應該些微超過"1個K10 FPU的效能"
但是一個模組塞兩個執行緒去跑FPU
就單一執行緒FPU效能來看應該會是1個K10 FPU的一半(or 稍低於一半)
綜合以上Bulldozer 跑8執行緒的FPU總效能應該略慢於K10 4cores的FPU總效能
如果可以設定只跑4執行緒(且分別在4模組上執行)那Bulldozer 的FPU總效能應該略高於K10 4cores的FPU總效能
如果Wprime是測FPU,那很明顯的不用考慮這個分數了 (Bulldozer設計就是會犧牲掉FPU)
要看實際使用情形才能判斷FPU到底是不是像AMD推測一樣是很少用到
(如果真的是很少用到,去測很少用到的部份分數高也沒什麼用)
引用:
作者ccyew
AMD推土機的浮點數運算這麼弱,是因為已經打算讓下一代的APU內部的GPU接手嗎?
|
就規劃上來說不是,因為GPU是連整數運算都想接手
(只要可平行化的部份AMD都想讓GPU接手)
GPU能接手的程度到底如何就要看接下來AMD推出的GCN可以處理到什麼程度