PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   系統組件 (https://www.pcdvd.com.tw/forumdisplay.php?f=19)
-   -   [情報] 土耳其網站放出推土機測試成績 (https://www.pcdvd.com.tw/showthread.php?t=935579)

unrealt535i 2011-07-28 10:21 AM

引用:
作者kqalea
真正的Fusion是想把x86指令用GPU的運算unit去執行,因該說把GPU的執行單位當作
通用運算單位來使用,CPU則是專職decode 分支預測 resource manage CISC 指令集最佳化,不只AMD要這樣做,Nvidia不約而同也是朝同樣的方向,還有ARM



我對這點非常有興趣,如果真的做到這樣的話那效能已經不是只提高個30%的級別了,只是還得等明後年以外也要看這些廠商能否真的做的到.....

只是拖到明後年也許Intel的Haswell就會COPY這樣的模式來運作了,當初就是因為FSB架構遇到瓶頸才COPY AMD把記憶體控制器跟HTT內建的架構造就了Core i在性能上的提升與高價!

近期看到HTC併S3的新聞,那天搞不好看到Intel併高通或是德州儀器或Power SGX來改變架構也不意外 :think:

德田新之助 2011-07-28 10:34 AM

被質疑推土機效能,所以出售ES?

:laugh: :laugh: :laugh: :laugh: :laugh:

Axel_K 2011-07-28 11:41 AM

我是很好奇
正式產品上市前,能夠這樣大咧咧的販售ES?
有公司可以不需要簽NDA嗎就能拿到ES?

kqalea 2011-07-28 11:42 AM

引用:
作者unrealt535i
我對這點非常有興趣,如果真的做到這樣的話那效能已經不是只提高個30%的級別了,只是還得等明後年以外也要看這些廠商能否真的做的到.....

只是拖到明後年也許Intel的Haswell就會COPY這樣的模式來運作了,當初就是因為FSB架構遇到瓶頸才COPY AMD把記憶體控制器跟HTT內建的架構造就了Core i在性能上的提升與高價!

近期看到HTC併S3的新聞,那天搞不好看到Intel併高通或是德州儀器或Power SGX來改變架構也不意外 :think:


我想這是趨勢,最只要的原因是single thread的執行速度已經是接近物理極限了
也就是說,就算有完美的執行周期,完美的分支預測,完美的快取命中,對於執行效率的
提升也是相當有限,除非有全新的IC設計(光IC ...etc)

最簡單的方式要提升效率就增加執行單位,從過去的core數量之戰,到現在GPU UNIT之戰
有興趣的話其實可以google openCL

拿個最近很紅的bitcoin mining來說


GPU 用openCL下
同價位的 HD6950 比 i7 2600 4.8Ghz 快80倍

reference
https://en.bitcoin.it/wiki/Why_a_GP...ster_than_a_CPU
https://en.bitcoin.it/wiki/Mining_hardware_comparison
http://hardocp.com/article/2011/07/...ce_comparison/1
http://en.wikipedia.org/wiki/OpenCL

Beagle2 2011-07-28 03:07 PM

引用:
作者ultraPC
只要腦袋還是正常的,基本上幻燈片跟不能玩是一樣的意思...
intel的IGP談到開DX11?
先執行8年前的FAR CRY DX9特效全開能跑順再來談

比喻成幻燈片是誇張了點,是我沒表達好。

某些遊戲特效少開點,解析度調低點,還是在可以玩的範疇啦~
或者本身內顯就可以順順跑,但就是要支援較高的DX版本才可以執行。

想表達的就是這樣... :ase

misman 2011-07-28 03:38 PM

引用:
作者ultraPC
只要腦袋還是正常的,基本上幻燈片跟不能玩是一樣的意思...

intel的IGP談到開DX11?

先執行8年前的FAR CRY DX9特效全開能跑順再來談


其實很多user跟想法....跟各位大大的想法是天差地遠的.....
:jolin: :jolin: :jolin:

以前我還在玩wow(60級年代)時,我的室友是用hp evo n620c在玩...= =
我是用桌機在玩,每次看他玩的畫面都慘不忍賭....他也是撐完60年代...
(就只是因為不想多花錢買PC。NB是公司配的....免錢)
後來因為他因為要幫家中後輩買NB,所以先買了ASUS F6V來試用(應該沒記錯... :flash: :flash: )
打WOW的黑龍公主時,他才發現...原來黑龍公主吐息時,地上會冒出火焰...(那他之前RAID是....用心眼開特效嗎..... :jolin: :jolin: )
試用完....他繼續用公司配的NB玩WOW...(此時公司已換成HP ZT3000.......
:unbelief: :unbelief: )

同樣對比我當時用的桌機的畫面特效....我還是覺得...... :jolin: :jolin: :jolin:

orakim 2011-07-28 04:10 PM

引用:
作者kqalea
GPU 用openCL下
同價位的 HD6950 比 i7 2600 4.8Ghz 快80倍

用GPU去看fusion 有可能會誤導,因為fusion也是有極限
fusion是cpu+gpu的綜合運算,假設GPU效能是CPU的無限多倍
fusion的極限就會落在CPU有多強、有幾個 (不過在極限之前他就已經遙遙領先無fusion的CPU)

由於目前無fusion程式,把硬解當作Fusion來舉例:
E-350硬解影片 CPU loading 是15% (此時GPU loading為6%),純軟解CPU loading 是51%
換算出硬解時 CPU:GPU 運算比例約是30:70
套入アムダールの法則:1/((1-P)+P/N)
參數:P是可平行化佔的比例,N是平行化的核心(在這裡是指與GPU效能相當的CPU個數)
1/((1-0.7)+(0.7/無限大))=3.33
畫成圖的話是這樣(下圖是我用上述條件 用程式畫的)


以下是解釋
GPU效能是CPU的無限多倍的時候 可以增加CPU單執行緒效能至3.33倍
(註:GPU不管再怎麼強都不可能會讓CPU效能增益超過3.33倍)
由GPU loading 不到7% 這一點來看,在硬解上GPU效能的確蠻像CPU的無限多倍
(即便GPU效能只有CPU的40倍或80倍 增益的倍數也離3.33倍不遠)

把硬解(30:70的fusion程式)當作一個假想fusion範例:
一個小小的E-350 APU (2個bobcat+1個GPU) 總和效能就相當於6.66個bobcat的效能
fusion 運算法改革帶來的效能增益就是這麼誇張
(尤其是他可以用在單執行緒程式這一點很吸引人)

idleic2 2011-07-28 04:46 PM

引用:
作者ultraPC
只要腦袋還是正常的,基本上幻燈片跟不能玩是一樣的意思...

intel的IGP談到開DX11?

先執行8年前的FAR CRY DX9特效全開能跑順再來談


那我是不正常的腦袋 !

我不會要求 內顯 要特效全開, 還要跑的順 !

那是 中高階卡 的要求 !

如果 內顯 要特效全開, 還要跑的順, 那 獨立顯卡也不用賣了 !

對於內顯, 跑的順 及 跑的完(穩定) 就 OK 了 !
讓我可以玩, 不會當機 就很 OK 阿 !

idleic2 2011-07-28 05:04 PM

引用:
作者kqalea
...
順便補充一下Fusion
把GPU整進去CPU裡面只是第一步而以

真正的Fusion是想把x86指令用GPU的運算unit去執行,因該說把GPU的執行單位當作
通用運算單位來使用,CPU則是專職decode 分支預測 resource manage CISC 指令集最佳化,不只AMD要這樣做,Nvidia不約而同也是朝同樣的方向,還有ARM

這樣做有非常多的好處,第一個好處就是可以把x86這個先天不足後天失調的架構虛擬化
不再被x86架構限制住CPU的發展,第二就是強化每個執行cycle的效率,以ARM為例子
...


就算是 AMD 的 FSA 架構 (Fusion的進化方向) 也不是讓 GPU 跑 x86指令集

而是 讓 Computer Language C & C++ 經由 compiler 成 GPU 的指令集

且 OS 可以管理 GPU 的 運算unit, 也就是OS 可以分配 task 給 GPU 運算unit
(這裡的 task 是 GPU 可以執行的task)

可以參考
為架構優化持續發展至2014年
AMD Fusion APU 架構將不斷進化
http://www.hkepc.com/6645

图形、计算齐头并进:AMD全新架构详解
http://news.mydrivers.com/1/196/196751.htm

orakim 2011-07-28 05:09 PM

引用:
作者physx
1.記憶體控制器跟北橋整合進CPU之後,由於靠的近,訊息傳的快,效率就有所提高
在SNB裡CPU&GPU是用L3溝通,那fusion用外部記憶體的做法效率會不會降低?

你誤解了
系統記憶體是GPU自己在使用,GPU跟CPU溝通是經過memory contoller
雖然CPU自己也會用到系統記憶體,但這跟GPU無排斥及優先緒關係
除了一個特別的利用方向外 中間應該不會用到L1 L2 L3 (這個特殊用途就是Fusion)
引用:
2.現在的APU到底是不是fusion? 除了整合兩種晶片外目前有其他功能嗎?

fusion的實驗品,可以算Fusion但是功能不完全 且有缺陷
目前無任何Fusion程式、支援fusion的OS,所以即便是屬於fusion也 但也沒有東西可以用
引用:
3.接續2 現在的APU跟未來的fusion差別在哪,未來的fusion會有專屬的指令集嗎?

CPU及GPU memory controller...幾乎全部都有差
指令集?這應該不會是指令集就能改搞定的事
我是覺得這個架構應該要改名字 (AMD之前有個AMD64 架構後來也被稱為x86_64 雖然他還是指令集的存在)
引用:
4.所謂支援fusion的軟體/演算法/指令集,可不可以用純CPU+獨立GPU下去跑?

需與CPU緊密結合,要不然絕大部分運算時間會浪費在傳輸上
引用:
5.fusion是類似AVX指令集,必須要軟體支援才能運作,否則就只是單純整合CPU&GPU?

需要軟體支援,至於像不像指令集 這很難講
個人是覺得這已經脫離指令集的程度,而是另一個架個的處理器(可相容x86)

引用:
再來是"Bulldozer"
從目前的推算來看,Bulldozer要用sandy bridge 150%的Die才能跟對手有同等效能
怎麼看都是非常敷衍的產品
以明年的Trinity來說 核心數從8>4 移除L3 ,同樣是32nm 4C,效能大概也就26K的一半
加上GPU整體的Die大概也會跟26K差不多,功耗也是

功耗會維持跟現在Llano一樣的水準
效能嘛應該跟比現在Llano略高(只高一點),跟現在的Llano層級極度類似
可以預期這三年(去年今年明年),就純CPU角度來看效能沒有太大變化

引用:
很明顯的AMD到2015年為止的戰術就是

2013年就完成了,2015是AMD希望軟體跟上的底限
引用:
CPU只要對手一半效能,GPU效能2倍,價格是對手的一半,用低價打通整個市場通路
等市占率夠高後自然會有人對自己的產品優化,"fusion"就是優化的額外功能

我覺得你似乎搞錯fusion重點,重點不在把強力GPU跟CPU綁在一起行銷
而是讓GPU介入CPU運算,增加整體效能(不只圖形上的效能,連運算也要)
fusion比較像是誘惑人去優化而不是靠市占率來讓人優化
(運算法的改革帶來的增益是在很暴力)
fusion不算是額外功能,反倒是APU的核心功能
不像過去一堆人的假設(含我)以為只是替代FPU而已,AMD打算讓他大量介入通用運算(不需要透過OpenCL)
要這樣作 軟體必須要支援Fusion
但不管採用OpenCL或者Fusion 軟體都一樣要重寫
這兩者不同處在 難度跟可適用的範圍 (Fusion遠遠優於OpenCL)
引用:
這戰術要成功大概要有以下幾個必備條件
1.對手在GPU技術上完全沒有突破
2.對手也不會研發自己的fusion

AMD就只有前面幾年(其他對手來不及推出對應產品)能保證獨家(就像x86_64)
其他部份還要繼續努力,intel 很可能隨後跟著推出fusion
(intel 之前想把CPU給GPU化產生的Larrabee 應該蠻適合用在Fusion)
fusion 是個公開的架構,基本上AMD是鼓勵 intel 開發相容的Fusion
(如果intel 來個不相容的版本,那大家就慘了)
引用:
3.如果自己的CPU效能只有對手的一半,fusion的效能要保證能把另外一半追回來

這一點我上面用硬解舉例那段就可以回覆大部分了
單執行緒 fusion可以追回來2.33倍效能(在CPU:GPU=30:70 的fusion程式上)
只差一半不成問題


所有的時間均為GMT +8。 現在的時間是06:09 PM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。