引用:
作者via
有用Manager介面做了consistency check,但也沒啥錯誤。
patrol read要用什麼做呢?magacli??
之前因為會出現硬碟reset的錯誤,後來發現是模組化的那條排線接觸不良老化了。
其實我這一組WD FALS1001月初才四顆一起RMA回來,後來仔細檢查錯誤訊息,
才抓到power排線sata供電的問題,power剛換成850W。該硬碟因不正常離線,
才recover PD0的第一顆。
月初RMA回來看看CDI還有HDTune都良好,真煩惱啊。
|
consistency check的目的是做parity的一致性(可以選擇fix或著單純check..)...
這主要是針對parity RAID mode而設計的...
patrol read是一種media scan的方式...
一般來說consistency check和media scan是要定期排程執行(1個月一次或著兩周一次...)...
patrol read用MSM就可以做了...
LSI RAID Controller在MegaRAID產品系列使用一種SMART Pooling的設計...
default的trigger timer是300sec會將HDD的SMART資訊回傳給RAID controller...
SMART Pooling在MegaRAID產品系列可以調整timer..
不過H700的Pre-Boot BIOS無法調整...
可以使用megacli adpallinfo -aall去查看timer的數值...
如果真的PD有問題...
MSM中的Media Error Count和Pre Fail Count應該可以找到蛛絲馬跡...
現在大多RAID產品都有自家的media scan算法...
當然LSI的MegaRAID具備了Auto Pre-Failure Detection機制(透過SMART Pooling達成...)...
所以你應該不用煩惱bad sector問題..
如果有問題...
Media Error Count和Pre Fail Count不會為0...
LSI MegaRAID不像Adaptec或著HighPoint具備SMART GUI(SHI)的可視化設計...
這是比較麻煩一點..