瀏覽單個文章
kqalea
Major Member
 

加入日期: Dec 2004
文章: 131
引用:
作者idleic2
這邊說的 decode 是指 Video decode 嗎 ?
假設是,

如下圖所示
http://www.cdrinfo.com/images/uploaded/AMD_UVD3.jpg

有些 hardware decode 並不完全 !
像 UVD 不支援 mpeg2 hardware decode
UVD2 支援 mpeg2 部分hardware decode
到 UVD3 才 完全hardware decode

另外 像IBM Cell
可以將 video decode 交給 SPE
or 未來可許可以 將 video decode 交給 GPGPU 的 SP

因為 Cell SPE 及 GPGPU 一樣需要 Software Program 才能運算解碼 ?
這樣算 hardware decode or software decode ?


Cell是Software Decode喔
部分硬解還是算軟解,因為bottleneck還是在CPU(演算法以及CPU運算能力)
如同你的理解,加上我的解釋"CPU 不參予解碼動作的才是Hardware decode"
這就是答案

引用:
作者idleic2
我知道 軟體上的 thread & process 的區別 ?

請教一下, 硬體上的 thread & process 是 ?
可有文章介紹 or google 的 keyword 是 ?
是 IntelR Hyper-Threading or SMT (Simultaneous multithreading) 嗎?
區別 是 ?


請問 這個video decode 的例子, 解釋 哪個觀念阿 ?


先引用一下閣下之前的文章

引用:
作者idleic2
以下是解釋
GPU效能是CPU的無限多倍的時候 可以增加CPU單執行緒效能至3.33倍
(註:GPU不管再怎麼強都不可能會讓CPU效能增益超過3.33倍)
由GPU loading 不到7% 這一點來看,在硬解上GPU效能的確蠻像CPU的無限多倍
(即便GPU效能只有CPU的40倍或80倍 增益的倍數也離3.33倍不遠)

把硬解(30:70的fusion程式)當作一個假想fusion範例:
一個小小的E-350 APU (2個bobcat+1個GPU) 總和效能就相當於6.66個bobcat的效能
fusion 運算法改革帶來的效能增益就是這麼誇張
(尤其是他可以用在單執行緒程式這一點很吸引人)


我只是想說,其實CPU"執行緒"的效能其實沒變
變的是cpu loading
不能這樣計算系統效能,因為目前openCL的部份可以完全由GPU執行
沒有道理會有人故意留個瓶頸擺在CPU脫慢系統效能
所以一般而言 如果GPU透過openCL執行某樣工作是CPU的數倍
那APU實作開GPU理當達成同樣的效能,而不會被CPU卡住
其實你可以看之前貼的bitcoin那篇,就可知道CPU效能在並不構成
GPU執行的瓶頸,除非CPU需要參予該工作,則該工作的效能瓶頸才會受CPU引響
而這就不是openCL的本意了

非常感謝
舊 2011-07-29, 11:06 PM #153
回應時引用此文章
kqalea離線中