引用:
作者flatmode
基本上要增加單緒效能得從以下著手
increase architectural register naming or larger general purpose register(像arm64, mips and power一樣 因為x86很缺 register naming)
more instruction decoder/ integer pipeline/issue port(i社採用4+1+1+1已經過時了 , 更多條管線與更多decoder也會增加ipc)
增強scheduler的亂緒resource分配(基本上instruction decode 會更有效率)
branch prediction
cache hit rate miss and latency(i社32kb instruction + 32kb data用了8年了 是時候要改了)
more register renaming + enhance out of order(基本上如果front end餵不飽是沒用的)
more ALU/AGU (同上)
new instruction set (對常用的legacy code 沒幫助)
increase clock speed (要拉時脈必然要加深管線 管線變深效率變低功耗變高 一種惡性循環)
|
基本上這些我大三上修完CO就知道了....難不成AMD那邊的神人會不知道嗎 ?
工程類 (不只電資類) 很多東西都是 :
大家都知道, 連落後國家都知道, 但實作不出來, 或是實作出來很不理想...
要去實作的時候, 才會發現會需要更多的周邊知識/背景知識...一個小小的例子 : CPU clock這麼快, 快到都可以看成 distributed circuit 了, 這時候又變成電磁學了....Orz
ps : 題外話, 以前我還是大學生的時候, 也對A/I的CPU運作超有興趣, 超愛在論壇上閱讀/談論這些內容...
後來碩班修了一些VLSI相關的課程後, 才發現自己連
"教科書的課後習題" 都寫得很辛苦了, 那更別說要去實作這種 :
全地球只有5間公司能做出來的東西了...
, 自此認清這是神人領域, 凡人庸才根本不可能觸及...