小弟自N年前買45nm bloomfield CPU+X58後就沒有碰太多超頻相關研究. 最近開始公佈自己超頻Skylake的過程後發現很多大大們都說我設的電壓非常高, 心臟很大. 這個勾起小弟興趣, 決定研究Intel 14nm CPU到底給多少電壓才是合理的.
網路上對電壓設多少基本上是眾說紛紜. 多數說法完全沒有研究依據, 都是憑感覺, 或者自己系統的極限, 或者聽別人說的. 最真實取樣點是有些同好把電壓設太高, CPU掛了, 報出臨死前的電壓, 但很多時候也說不清楚, 或者過程模糊. 更有人用 22nm的猜測去做 14nm的預測, 變成是猜兩次.
小弟秉持著用科學手法來研究這個問題, 發現其實有一堆專業人士專門在研究微電子相關的可靠度. 還有類似年會, 如IRPS,
http://www.irps.org/
今年的IRPS年會上 (4/21/2015), Intel發了一篇炫耀paper, 說他們的14nm 2代FinFET有多厲害, 可靠度有多好. 炫耀歸炫耀, 但這篇提供的數據基本上可以拿來做 14nm在實際應用上的參考, 而且Intel還拿他們的22nm 1代FinFET做比較, 真是太好了
Paper全名是 Transistor Aging and Reliability in 14nm Tri-Gate Technology. 小弟也決定提供附件, 供有興趣的大大來自行解讀. Paper本身不算艱澀, 但沒有電機/微機電/半導體或者相關可靠度統計背景的大大可能看起來會有點吃力.
小弟節錄出重點
1. 14nm/22nm最弱的結構都是 NMOS, CPU能不能動就看NMOS是否能動.
2. Paper中都是用很高的 Vds (基本上等同Vcore) 去測試Time to Failure (TTF).
3. Paper中雖然沒有用一般會用的電壓, 但可以證實電壓與NMOS TTF是呈現linear-log 關係.
從這些結果, 小弟稍微加油添醋了一些, 把paper的趨勢線延長, 然後將觀察畫在圖表上. 先聲明, paper是在分析 SRAM, 類似 L1 cache的東西, 所以不見得能完全代表CPU, 但除非Intel再發paper, 小弟看不出有更接近CPU的真實數據. 另外的是數據應該是從統計手段產出, 既然是統計數據就一定會有機率是東西提前掛掉. 總而言之, 要超還是要小心, 上緊螺絲還是要慢慢來,東西若真的壞了不要來找我
從小弟附件的圖表來看
1. 22nm承受電壓的能力比 14nm差很多, 在同樣的TTF條件下, 14nm可以承受更高的電壓.
2. 趨勢線與317.1年線交錯的地方, 往下拉有個電壓, 電壓只要設低於這個就等同是永恆壽命, 不會壞. 若是要順順超, 也同時在散熱足夠的條件下可以考慮以 22nm <= 1.314V, 14nm <= 1.480V做設定
3. 若是有點冒險精神, 或者也不是那麼在乎CPU壽命, 可以設定 22nm < 1.384V, 14nm < 1.539V.
4. 若要拼世界記錄的, 可以看趨勢線與 22.77小時線交錯的地方, 然後設一個超過的電壓
這篇paper來得正是時候, 手上有任何Haswell/Haswell-E/Haswell Xeon, Broadwell/Broadwell-E/Broadwell Xeon, Skylake/Skylake-E/Skylake Xeon CPU的大大們都可以參考, 應該可以涵蓋到未來所有在 10nm Cannonlake出來前的CPU.