Master Member
|
> 非同步運算引擎ace並不是必要的...只要能實現非同步運算(不管硬體控制或驅動實現)
非同步ACE只是排程的部份
NV出問題的地方是他的架構每次不可分割的運算量太大
怎麼排也插不進去這不可分割的運算(NV的架構上不允許)
當初NV就是因為DX11特化的不可分割圖形運算佔到便宜
在DX12因為這特化的不可分割圖形運算吃了虧
問題的根本關鍵就在於
一個不可排程的架構 塞個排程的機制下去有用嗎...還不是塞不進去
硬是塞進去運算 不可分割的運算會整整delay一個運算循環,可能就這樣吃掉20~50%的效能
就這麼簡單,以DX11來看NV這顆新GPU依舊是不錯的GPU
還是可以買 應該是DX11下表現最好的GPU (但是提到DX12就傷心了)
> 看一下CPU現在每一代只進步個5%~10%就推出來,GPU每代進步幅度算不錯了
CPU跟GPU狀況不同,我不會混在一起談
CPU的狀況是即便製程精細到10nm 或者7nm
他的效率就是那樣不會大幅度增長(時脈or IPC都是一樣)
最佳化的架構就是頂就是類似現在這樣
GPU運算效能是直接疊加起來的,先不論架構改善情形
基本上給多少製程就有對應的效能出來,很大一部份是製程的關係
製程卡住效能就卡住,製程改善效能就會改善
而目前至少最大的幾家晶圓生產廠都瞄準7nm這塊 顯然製程還沒到頂 (對GPU來說還有很大的成長空間在)
只是生產環境因素要克服的問題太多而已,不是物理上的極限
不像是CPU製程越好頂多只能把die size縮的越小越省電 效能不會有太大變化
製程縮的越小 線路間距離越小 作頻率高造成電磁效應越大
很不利於高時脈運算的CPU
GPU工作時脈一直遠低於CPU,高時脈造成的物理上缺陷在GPU上看不太到
CPU工作頻率造成的電磁阻抗問題最早在P4就碰到了
那時候intel 是直接捨棄高時脈架構弄架構改良提高IPC降低時脈,稍低的時脈+高IPC的組合讓效能整體提高
後來是靠材質改良才把時脈稍微推進一些,之後又靠3D架構改良再推進一下
然後呢 沒有然後了;CPU就這樣卡了好幾年
不把"可平行化部份弄成GPU那樣低時脈多核心","不可平行化部份保持CPU這種高時脈運算架構"
進行軟硬體的架構改革的話 傳統電子計算就沒有然後了
--
有個方法或許有應用的空間
就是每條線路都用金屬罩起來徹底隔絕掉電磁效應
這樣Die會多大就不要問了(少說是現在的十倍大起跳)
製程精細根本沒有用處因為絕大部分空間被外面的金屬罩消耗掉了
|