PCDVD數位科技討論區

PCDVD數位科技討論區 (https://www.pcdvd.com.tw/index.php)
-   儲存媒體討論區 (https://www.pcdvd.com.tw/forumdisplay.php?f=20)
-   -   RAID5 缺一顆硬碟時,資料會出錯嗎? (https://www.pcdvd.com.tw/showthread.php?t=1008060)

jacks.wei 2013-04-18 10:11 AM

Properties :
==========

----------------------------------------------------------------------------
EID State Slots PD PS Fans TSs Alms SIM Port# ProdID VendorSpecific
----------------------------------------------------------------------------
58 OK 36 8 0 0 0 0 0 Port 0 - 3 RES2CV360 x36-254.13.0.0
----------------------------------------------------------------------------

EID-Enclosure Device ID |PD-Physical drive count |PS-Power Supply count|
TSs-Temperature sensor count |Alms-Alarm count |SIM-SIM Count

很久前 已更新到最ph13
R5的 Port 0 - 3:1:28會出現這,SEQUENCE NUMBER = 59140
TIME = 17-04-2013 19:12:40
LOCALIZED MESSAGE = Controller ID: 0 Unexpected sense: PD = Port 0 - 3:1:28Power on, reset, or bus device reset occurred, CDB = 0x2a 0x00 0x00 0x1f 0x33 0x90 0x00 0x00 0x08 0x00 , Sense = 0x70 0x00 0x06 0x00 0x00 0x00 0x00 0x0a 0x00 0x00 0x00 0x00 0x29 0x00 0x00 0x00 0x00 0x00

ID = 268
SEQUENCE NUMBER = 59139
TIME = 17-04-2013 19:12:39
LOCALIZED MESSAGE = Controller ID: 0 PD Reset: PD = Port 0 - 3:1:28, Critical = 3, Path = 0x5001E6734F531FE2
我知道這顆快掛了 hdsentinel說壞軐 53 。反正這是BT碟。但LSI 的MEDIA FAIL 都是0 想說還不會離線就 不換了。

mixmaster 2013-04-19 09:46 AM

目前用群暉的NAS..
請問NAS 也有你們說的Consistency Check?
還是有其他檢查方式可以設排程定時檢查?

謝謝 :)

chaotommy 2013-04-19 10:21 AM

引用:
作者mixmaster
目前用群暉的NAS..
請問NAS 也有你們說的Consistency Check?
還是有其他檢查方式可以設排程定時檢查?

謝謝 :)

有 CC 可以設定
可以定時跑

mixmaster 2013-04-19 10:54 AM

1個附加檔案
引用:
作者chaotommy
有 CC 可以設定
可以定時跑

剛去官網知識庫沒看到有講相關的
請問是不是這個?

npc 2013-04-19 01:08 PM

引用:
作者mixmaster
目前用群暉的NAS..
請問NAS 也有你們說的Consistency Check?
還是有其他檢查方式可以設排程定時檢查?

謝謝 :)


有,Synology NAS有這功能,也可下指令自己排程做~

我是在 crontab 設定每個月做一次。

茶壺 2013-04-21 02:58 PM

引用:
作者Irvinson
Raid 5在重建前,最好不要再寫入,否則會產生錯誤。

舉例:

在1月時離線一顆硬碟,中間保持不斷寫入刪除,及至6月再插回硬碟,此時這顆硬碟只有1月時的回憶,此時若重建,也喚不回1~6月新增部分。



其中檢核(cc)也有寫入作用(像是標記壞軌之類),因此,多不建議在補硬碟前對陣列作檢核。

重建最好在線上熱插拔,若一定要重開機,很可能會出現初始化或其他寫入,對陣列寫得愈多,救回的機會愈少。


不好意思有一些問題想請教一下

RAID5的部分針對長時間不間斷儲存跟刪除的環境譬如說像監控系統

在其中一顆硬碟故障後也是持續的儲存跟刪除

在這情況下我如果發現故障做重建的間隔越久代表它這段時間儲存的資料會缺越多?

例如系統在1月時故障我在2月時發現後重建,重建後1~2月之間的資料其實是不完全的

是這樣解釋?

Irvinson 2013-04-21 04:10 PM

有二種狀況,不太一樣。

一、1月故障後原來陣列不變,若只錯一顆硬碟並不抽出,繼續使用到2月,抽換後並使用新硬碟,還有機會完整重建。

二、1月故障後,在缺抽一顆硬碟下持續寫入刪除,此時陣列已無容錯功能,2月時又打算將1月所抽硬碟回插予以重建,此時資料縱使救回,也不完全。

因為raid5本將資料依規則寫入各碟碟,設計上可以容錯一顆,XOR仍可計算出聯集,所以閉路保全影帶縱使故障時間再長,大部分仍可救回。但是raid5若故障二顆硬碟,那就沒辦法,有的故障還是人為,比如說拔錯硬碟(把正常硬碟抽離),或是在缺硬碟下繼續,此時若再出錯,形同二顆硬碟出錯。

茶壺 2013-04-21 06:03 PM

引用:
作者Irvinson
有二種狀況,不太一樣。

一、1月故障後原來陣列不變,若只錯一顆硬碟並不抽出,繼續使用到2月,抽換後並使用新硬碟,還有機會完整重建。

二、1月故障後,在缺抽一顆硬碟下持續寫入刪除,此時陣列已無容錯功能,2月時又打算將1月所抽硬碟回插予以重建,此時資料縱使救回,也不完全。

因為raid5本將資料依規則寫入各碟碟,設計上可以容錯一顆,XOR仍可計算出聯集,所以閉路保全影帶縱使故障時間再長,大部分仍可救回。但是raid5若故障二顆硬碟,那就沒辦法,有的故障還是人為,比如說拔錯硬碟(把正常硬碟抽離),或是在缺硬碟下繼續,此時若再出錯,形同二顆硬碟出錯。


這樣來說的話

像單純的硬碟壞軌之類的問題只要不抽掉的話間隔久一點還是可以完整重建

但是像硬碟直接升天連抓的抓不到的這種是否就判定為第二種情況?

間隔越久資料完整重建機率越低,期間再壞一顆RAID5就崩潰?

Irvinson 2013-04-21 07:25 PM

那是因為Raid5只容許一顆硬碟損壞,其他像raid卡有問題、sata線材傳輸錯誤及硬碟無法順利讀取等都不在救援範圍。Raid以容錯保護,而非備份功能,若要容納二顆錯誤,則可選擇Raid6。如果運氣好的話,硬碟升天與資料有錯都在同一顆硬碟,還在Raid5容許範圍內,仍有機會重建。

組Raid5的唯一功能,就是利用一顆新硬碟救回資料,功能在於取代那顆壞硬碟。

其實這已經很不錯了,其他像ssd若組raid,任何有誤則直接掛機,沒有救援的機會,只有機械式硬碟才有機會救回。當然raid0也沒機會救回,不過那是另一件事。至於機率上有間隔越久愈亦有誤,不管是平均五十萬分之一或是計算同時壞二顆的機率等。

GXroots 2013-04-21 08:26 PM

引用:
作者Irvinson
那是因為Raid5只容許一顆硬碟損壞,其他像raid卡有問題、sata線材傳輸錯誤及硬碟無法順利讀取等都不在救援範圍。Raid以容錯保護,而非備份功能,若要容納二顆錯誤,則可選擇Raid6。如果運氣好的話,硬碟升天與資料有錯都在同一顆硬碟,還在Raid5容許範圍內,仍有機會重建。

組Raid5的唯一功能,就是利用一顆新硬碟救回資料,功能在於取代那顆壞硬碟。

其實這已經很不錯了,其他像ssd若組raid,任何有誤則直接掛機,沒有救援的機會,只有機械式硬碟才有機會救回。當然raid0也沒機會救回,不過那是另一件事。至於機率上有間隔越久愈亦有誤,不管是平均五十萬分之一或是計算同時壞二顆的機率等。


是這樣嗎? 應該組了RAID5/6 的SSD也可以依照XOR計算救回資料不是嗎?

不然難道那些使用LSI / DELL 陣列卡+SSD的USER只是為了使用RAID 0衝傳輸量?


所有的時間均為GMT +8。 現在的時間是03:32 AM.

vBulletin Version 3.0.1
powered_by_vbulletin 2025。