引用:
作者everspiral
Pentium4以前的效能指標是IPS
|
P4的FP ALU本身其實不弱
真正問題是在front-end
P4的問題在於一旦發生trace cache miss或branch prediction miss
前者是被逼到只能叫x86 decoder再去cache/memory fetch新的指令
(這個有點忘了,不過印象中P4這時會發生從multi-issue降到類似single issue的情況)
後者更慘,要花時間清空管線+等待x86 decoder issue+新指令的operand ready能送到OoOE buffer的時間