PCDVD數位科技討論區
PCDVD數位科技討論區   註冊 常見問題 標記討論區為已讀

回到   PCDVD數位科技討論區 > 電腦硬體討論群組 > 儲存媒體討論區
帳戶
密碼
 

  回應
 
主題工具
tbsky
Junior Member
 

加入日期: Jan 2002
文章: 857
引用:
作者vxr
這看起來是一個bug...
你的5.10P1有被Supermicro另外動過手腳??...

"對了,原廠說調整了某些參數,不知道看 TTY LOG 可以看出來嘛?"
不確定, 應該是可以..
但需要花點時間看..


post 給您看的 ttylog 是被動過手腳的 5.10P1。
不過我有別張沒有被動過手腳的 5.10P1 也是這樣(每五分鐘報錯 supercap),所以這應該是 5.10P1 的 bug。我別張板子再更新為 5.11 之後就沒有這個現象了 。

我們買了多張同樣的板子,其中有兩張無論使用什麼版本的 LSI 韌體都很穩定,剩下的無論使用什麼版本的韌體都不穩定,直到使用了這個特製版就穩定了。(雖然目前的樣本數只有一張板子,但是原廠蠻肯定的..)。所以很好奇原廠到底改了什麼呢,感覺是某些硬體例如 raid cpu 還是 cache memory 之類的不耐操,所以調降參數來讓它穩定。但不知道到底調降了什麼參數...
     
      
舊 2014-10-09, 10:03 PM #21
回應時引用此文章
tbsky離線中  
vxr
Elite Member
 
vxr的大頭照
 

加入日期: May 2002
您的住址: 地球的上面..
文章: 5,854
Exclamation

引用:
作者tbsky
post 給您看的 ttylog 是被動過手腳的 5.10P1。
不過我有別張沒有被動過手腳的 5.10P1 也是這樣(每五分鐘報錯 supercap),所以這應該是 5.10P1 的 bug。我別張板子再更新為 5.11 之後就沒有這個現象了 。

我們買了多張同樣的板子,其中有兩張無論使用什麼版本的 LSI 韌體都很穩定,剩下的無論使用什麼版本的韌體都不穩定,直到使用了這個特製版就穩定了。(雖然目前的樣本數只有一張板子,但是原廠蠻肯定的..)。所以很好奇原廠到底改了什麼呢,感覺是某些硬體例如 raid cpu 還是 cache memory 之類的不耐操,所以調降參數來讓它穩定。但不知道到底調降了什麼參數...

可否storcli比對一下reversion??
 
舊 2014-10-10, 08:45 AM #22
回應時引用此文章
vxr離線中  
tbsky
Junior Member
 

加入日期: Jan 2002
文章: 857
引用:
作者vxr
可否storcli比對一下reversion??


reversion 似乎是一樣的。都看到 266=Board Revision
提供另外兩張板子的 log 供您參考一下:

這張用過 firmware 5.10 和 5.10P1, 目前停在 5.10 P1, 無論什麼版本都工作穩定。目前工作繁重穩定運作中:
http://pastebin.com/25L6CK5t

這張用過 5.10, 5.10P1, 5.11, 目前停在 5.11, 無論什麼版本都不穩定。目前工作輕鬆,但依然不穩定運作中:
http://pastebin.com/Ma7SGAv3
舊 2014-10-10, 11:10 AM #23
回應時引用此文章
tbsky離線中  
thatoneuser
Basic Member
 

加入日期: Sep 2012
文章: 21
引用:
作者tbsky
reversion 似乎是一樣的。都看到 266=Board Revision
提供另外兩張板子的 log 供您參考一下:

這張用過 firmware 5.10 和 5.10P1, 目前停在 5.10 P1, 無論什麼版本都工作穩定。目前工作繁重穩定運作中:
http://pastebin.com/25L6CK5t

這張用過 5.10, 5.10P1, 5.11, 目前停在 5.11, 無論什麼版本都不穩定。目前工作輕鬆,但依然不穩定運作中:
http://pastebin.com/Ma7SGAv3


你的MB是哪一塊,HW rev各是什麼?
舊 2014-10-10, 07:58 PM #24
回應時引用此文章
thatoneuser離線中  
vxr
Elite Member
 
vxr的大頭照
 

加入日期: May 2002
您的住址: 地球的上面..
文章: 5,854
Exclamation

你有做過回到原廠預設值嗎?..

我不知道你為什麼會打開這個項目...
enableCacheOffload=1
沒有SuperCap和CVPM模組..
這個不應該被打開..

提供一下你主機板型號..
我查看看是長怎樣..

此文章於 2014-10-10 08:10 PM 被 vxr 編輯.
舊 2014-10-10, 08:09 PM #25
回應時引用此文章
vxr離線中  
tbsky
Junior Member
 

加入日期: Jan 2002
文章: 857
引用:
作者vxr
你有做過回到原廠預設值嗎?..

我不知道你為什麼會打開這個項目...
enableCacheOffload=1
沒有SuperCap和CVPM模組..
這個不應該被打開..

提供一下你主機板型號..
我查看看是長怎樣..


試過回復預設值多次,不過穩定的板子還是穩定,不穩定的板子還是不穩定。
板子除了做 raid 之外,就沒有設定額外的東西了,所以那個參數應該不是我開的。
板子的型號是 supermicro X9DRH-7F。所有的板子都是同一批,所以 revision 什麼的也都相同,實際上也看不出穩定的跟不穩定的板子有什麼差別。原廠也有回查是否生產的工廠有所不同,不過也證實沒有關聯。 我想原廠應該是知道什麼地方出了問題,所以用特製的 firmware 就好了。不過他們不想透露給使用者就是了...
舊 2014-10-11, 07:47 PM #26
回應時引用此文章
tbsky離線中  
tbsky
Junior Member
 

加入日期: Jan 2002
文章: 857
引用:
作者tbsky
試過回復預設值多次,不過穩定的板子還是穩定,不穩定的板子還是不穩定。
板子除了做 raid 之外,就沒有設定額外的東西了,所以那個參數應該不是我開的。
板子的型號是 supermicro X9DRH-7F。所有的板子都是同一批,所以 revision 什麼的也都相同,實際上也看不出穩定的跟不穩定的板子有什麼差別。原廠也有回查是否生產的工廠有所不同,不過也證實沒有關聯。 我想原廠應該是知道什麼地方出了問題,所以用特製的 firmware 就好了。不過他們不想透露給使用者就是了...


現在真是陷入羅生門了。原廠本來說是特殊韌體不會給我們。後來又說這次修改是調整了四個參數,而這些修改會回到 LSI 公版韌體之中,以後新的公版韌體就會 "調整" 這些參數了。從這些片段的資訊和我手上的板子,似乎可以看到兩件事:

1. 應該不只我遇到這個問題,不然為何參數調整要回到公版韌體之中。
2. 應該不是所有 2208 都會遇到這個問題,至少我手上有 50% 的板子都沒有問題。所以推測看來是某些 2208 無法負荷韌體的操作。比較可惜的是我手上所有的板子都是一拿到就直接升級到 5.10 版之後了,所以不知道早期版本是否都可以穩定運作無誤的..
舊 2014-10-15, 03:40 PM #27
回應時引用此文章
tbsky離線中  
vxr
Elite Member
 
vxr的大頭照
 

加入日期: May 2002
您的住址: 地球的上面..
文章: 5,854
Exclamation

老實講..
我最近也遇到這個垃圾問題了...
問題是我有接SuperCap...
01/15/15 16:47:27: I2Chandle obtained for TFM 11
01/15/15 16:47:27: I2Chandle obtained for GPIO expander in TFM 12
01/15/15 16:47:27: I2Chandle obtained for EEprom in expander in TFM 13
01/15/15 16:47:27: I2Chandle obtained for TempSensor On SuperCap 14
01/15/15 16:47:27: I2Chandle obtained for TempSensor On SuperCap 15
01/15/15 16:47:27: I2Chandle obtained for Mux in TMMB 16
01/15/15 16:47:27: tfmInitMonitor: Mux 1 retry
01/15/15 16:47:27: tfmInitMonitor: Mux 2 retry
01/15/15 16:47:27: tfmInitMonitor: Mux 3 retry
01/15/15 16:47:27: tfmInitMonitor: Mux 4 retry
01/15/15 16:47:27: tfmInitMonitor: Mux 5 retry
01/15/15 16:47:27: tfmInitMonitor:I2C Mux not present on controller
01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1
01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1
01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1
01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1
01/15/15 16:47:27: isSuperCapPresent: Error reading the Temp in SupeCap, err = 0x1
01/15/15 16:47:27: Errors detected while Communicating to SuperCap....5
01/15/15 16:47:27: SuperCap not Present
01/15/15 16:47:27: SuperCap is not Present
01/15/15 16:47:27: SuperCap has Errors
我以為SuperCap掛了..
我去掏寶掏了一顆全新的SuperCap來裝(不含TMMB)..
問題依舊...

it's fucking bullshit annoying....................
now I have a fucking super bullshit cap loss issue.......
thanks, LSI......
for your crap f/w....

此文章於 2015-01-15 06:19 PM 被 vxr 編輯.
舊 2015-01-15, 06:14 PM #28
回應時引用此文章
vxr離線中  
Cantabile
Major Member
 

加入日期: Dec 2006
文章: 194
淘寶的SuperCap很多是有問題的,我猜是QC沒過打下來的東西

買了三顆只有一顆能用
舊 2015-01-16, 11:58 AM #29
回應時引用此文章
Cantabile離線中  
tbsky
Junior Member
 

加入日期: Jan 2002
文章: 857
去年的問題一直到今年還是無法解決。狀況就是 raid card 偶爾就會 reset。果然就是和 lsi 八字不合。不過剛剛發現原來這個問題去年各大廠就已經發佈消息召回了.. 準備要去和 supermicro 爭公道,應該不需要再讓使用者自我證明,找出問題了..

大廠的網頁如下,不過發生問題的原因看不懂。我的 log 有 "Pmu Msg Fault!!! faultcode 00002656"

http://www.cisco.com/c/en/us/suppor...37/fn63732.html

https://www-947.ibm.com/support/ent...id=migr-5094459

有沒有人可以解釋一下這個到底是啥原因造成的啊?

此文章於 2015-12-16 01:44 AM 被 tbsky 編輯.
舊 2015-12-16, 01:43 AM #30
回應時引用此文章
tbsky離線中  


    回應


POPIN
主題工具

發表文章規則
不可以發起新主題
不可以回應主題
不可以上傳附加檔案
不可以編輯您的文章

vB 代碼打開
[IMG]代碼打開
HTML代碼關閉



所有的時間均為GMT +8。 現在的時間是10:00 PM.


vBulletin Version 3.0.1
powered_by_vbulletin 2024。