Junior Member
加入日期: Jan 2002
文章: 857
|
引用:
post 給您看的 ttylog 是被動過手腳的 5.10P1。 不過我有別張沒有被動過手腳的 5.10P1 也是這樣(每五分鐘報錯 supercap),所以這應該是 5.10P1 的 bug。我別張板子再更新為 5.11 之後就沒有這個現象了 。 我們買了多張同樣的板子,其中有兩張無論使用什麼版本的 LSI 韌體都很穩定,剩下的無論使用什麼版本的韌體都不穩定,直到使用了這個特製版就穩定了。(雖然目前的樣本數只有一張板子,但是原廠蠻肯定的..)。所以很好奇原廠到底改了什麼呢,感覺是某些硬體例如 raid cpu 還是 cache memory 之類的不耐操,所以調降參數來讓它穩定。但不知道到底調降了什麼參數... |
||||||||
2014-10-09, 10:03 PM
#21
|
Elite Member
加入日期: May 2002 您的住址: 地球的上面..
文章: 5,854
|
引用:
可否storcli比對一下reversion?? |
|||
2014-10-10, 08:45 AM
#22
|
Junior Member
加入日期: Jan 2002
文章: 857
|
引用:
reversion 似乎是一樣的。都看到 266=Board Revision 提供另外兩張板子的 log 供您參考一下: 這張用過 firmware 5.10 和 5.10P1, 目前停在 5.10 P1, 無論什麼版本都工作穩定。目前工作繁重穩定運作中: http://pastebin.com/25L6CK5t 這張用過 5.10, 5.10P1, 5.11, 目前停在 5.11, 無論什麼版本都不穩定。目前工作輕鬆,但依然不穩定運作中: http://pastebin.com/Ma7SGAv3 |
|
2014-10-10, 11:10 AM
#23
|
Basic Member
加入日期: Sep 2012
文章: 21
|
引用:
你的MB是哪一塊,HW rev各是什麼? |
|
2014-10-10, 07:58 PM
#24
|
Elite Member
加入日期: May 2002 您的住址: 地球的上面..
文章: 5,854
|
你有做過回到原廠預設值嗎?..
我不知道你為什麼會打開這個項目... enableCacheOffload=1 沒有SuperCap和CVPM模組.. 這個不應該被打開.. 提供一下你主機板型號.. 我查看看是長怎樣.. 此文章於 2014-10-10 08:10 PM 被 vxr 編輯. |
2014-10-10, 08:09 PM
#25
|
Junior Member
加入日期: Jan 2002
文章: 857
|
引用:
試過回復預設值多次,不過穩定的板子還是穩定,不穩定的板子還是不穩定。 板子除了做 raid 之外,就沒有設定額外的東西了,所以那個參數應該不是我開的。 板子的型號是 supermicro X9DRH-7F。所有的板子都是同一批,所以 revision 什麼的也都相同,實際上也看不出穩定的跟不穩定的板子有什麼差別。原廠也有回查是否生產的工廠有所不同,不過也證實沒有關聯。 我想原廠應該是知道什麼地方出了問題,所以用特製的 firmware 就好了。不過他們不想透露給使用者就是了... |
|
2014-10-11, 07:47 PM
#26
|
Junior Member
加入日期: Jan 2002
文章: 857
|
引用:
現在真是陷入羅生門了。原廠本來說是特殊韌體不會給我們。後來又說這次修改是調整了四個參數,而這些修改會回到 LSI 公版韌體之中,以後新的公版韌體就會 "調整" 這些參數了。從這些片段的資訊和我手上的板子,似乎可以看到兩件事: 1. 應該不只我遇到這個問題,不然為何參數調整要回到公版韌體之中。 2. 應該不是所有 2208 都會遇到這個問題,至少我手上有 50% 的板子都沒有問題。所以推測看來是某些 2208 無法負荷韌體的操作。比較可惜的是我手上所有的板子都是一拿到就直接升級到 5.10 版之後了,所以不知道早期版本是否都可以穩定運作無誤的.. |
|
2014-10-15, 03:40 PM
#27
|
Elite Member
加入日期: May 2002 您的住址: 地球的上面..
文章: 5,854
|
老實講..
我最近也遇到這個垃圾問題了... 問題是我有接SuperCap... 01/15/15 16:47:27: I2Chandle obtained for TFM 11 01/15/15 16:47:27: I2Chandle obtained for GPIO expander in TFM 12 01/15/15 16:47:27: I2Chandle obtained for EEprom in expander in TFM 13 01/15/15 16:47:27: I2Chandle obtained for TempSensor On SuperCap 14 01/15/15 16:47:27: I2Chandle obtained for TempSensor On SuperCap 15 01/15/15 16:47:27: I2Chandle obtained for Mux in TMMB 16 01/15/15 16:47:27: tfmInitMonitor: Mux 1 retry 01/15/15 16:47:27: tfmInitMonitor: Mux 2 retry 01/15/15 16:47:27: tfmInitMonitor: Mux 3 retry 01/15/15 16:47:27: tfmInitMonitor: Mux 4 retry 01/15/15 16:47:27: tfmInitMonitor: Mux 5 retry 01/15/15 16:47:27: tfmInitMonitor:I2C Mux not present on controller 01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1 01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1 01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1 01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1 01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1 01/15/15 16:47:27: Errors detected while Communicating to SuperCap....5 01/15/15 16:47:27: SuperCap not Present 01/15/15 16:47:27: SuperCap is not Present 01/15/15 16:47:27: SuperCap has Errors 我以為SuperCap掛了.. 我去掏寶掏了一顆全新的SuperCap來裝(不含TMMB).. 問題依舊... it's fucking bullshit annoying.................... now I have a fucking super bullshit cap loss issue....... thanks, LSI...... for your crap f/w.... 此文章於 2015-01-15 06:19 PM 被 vxr 編輯. |
2015-01-15, 06:14 PM
#28
|
Major Member
加入日期: Dec 2006
文章: 194
|
淘寶的SuperCap很多是有問題的,我猜是QC沒過打下來的東西
買了三顆只有一顆能用 |
2015-01-16, 11:58 AM
#29
|
Junior Member
加入日期: Jan 2002
文章: 857
|
去年的問題一直到今年還是無法解決。狀況就是 raid card 偶爾就會 reset。果然就是和 lsi 八字不合。不過剛剛發現原來這個問題去年各大廠就已經發佈消息召回了.. 準備要去和 supermicro 爭公道,應該不需要再讓使用者自我證明,找出問題了..
大廠的網頁如下,不過發生問題的原因看不懂。我的 log 有 "Pmu Msg Fault!!! faultcode 00002656" http://www.cisco.com/c/en/us/suppor...37/fn63732.html https://www-947.ibm.com/support/ent...id=migr-5094459 有沒有人可以解釋一下這個到底是啥原因造成的啊? 此文章於 2015-12-16 01:44 AM 被 tbsky 編輯. |
2015-12-16, 01:43 AM
#30
|