*停權中*
|
基本上要增加單緒效能得從以下著手
increase architectural register naming or larger general purpose register(像arm64, mips and power一樣 因為x86很缺 register naming)
more instruction decoder/ integer pipeline/issue port(i社採用4+1+1+1已經過時了 , 更多條管線與更多decoder也會增加ipc)
增強scheduler的亂緒resource分配(基本上instruction decode 會更有效率)
branch prediction
cache hit rate miss and latency(i社32kb instruction + 32kb data用了8年了 是時候要改了)
more register renaming + enhance out of order(基本上如果front end餵不飽是沒用的)
more ALU/AGU (同上)
new instruction set (對常用的legacy code 沒幫助)
increase clock speed (要拉時脈必然要加深管線 管線變深效率變低功耗變高 一種惡性循環)
|