引用:
作者foxtm
別只著眼於自己想看的物理及數學定律..
統計是充滿的陷阱的學問.."平均"正是常見的陷阱..
|
foxtm兄所言的確引人深思,不過有個地方個人覺得有點疑問
首先:
萬轉硬碟整顆碟片平均access time 在7.9ms
一般7200轉硬碟整顆碟片平均acess time 在13.0ms
您據此指出,平均數是統計裡的一個常見的陷阱,不能只單看帳面上的
13-7.9=5.1 之差距。
接著:
因為萬轉碟片其實較一般7200轉來的小,因此我們可以將7200轉的硬碟取外圈
部分,約相當小暴龍36G大小的容量做C:
最後您指出,
"則 7200轉硬碟..其平均數會因為靠近外圈..有機會降到到 10+ms 的 Average Access time..相對萬轉硬碟..因為 32G的分割橫跨了磁碟中外圈..Average Access time 可能僅能降到7+ms左右.."
導出的結論是
"當然 7+ms 還是比 10+ms 的時間來的短..但其間的差異就沒有之前的 7.9ms VS 13ms 來的驚人.."
首先您用了平均值差來表示萬轉搜尋時間勝過7200轉5.1ms,其差異是顯著的。
但您接著用了碟片外圈平均搜尋時間較短的特性推論出萬轉與7200轉的搜尋時間差僅剩
3ms。
您質疑平均數的代表性,卻又以測試圖上的外圈搜尋時間之平均數差異較整片碟片
來的小做結論。
再者,撇開數字,我們仔細看兩張HDTune的測試圖
1.萬轉硬碟的access time呈現正斜率的分佈圖
2.7200轉硬碟的acess time雖然同樣呈現正斜率的分佈,唯,可以看到其斜率角度較萬轉硬碟來的大。甚者,其每個隨機存取點所得的搜尋時間之「離差」也較暴龍來的更大。
[離差(dispersion) 是統計中以平均數為準對於其個別數值分散程度的測度。可以視做搜尋時間的測試圖帶寬]
如此,同樣在外圈,7200轉的硬碟搜尋時間是有機會能達到10m+沒錯,但機會多大?
發生的頻率高嗎?
同樣以暴龍來看,我們是不是也可以說,它在外圈與內圈中,其搜尋時間有機會皆落在10ms+以下?(因為可以10ms為一條直線同時穿過外圈與內圈的測試點)
但以7200轉的測試圖來看,我們似乎無法找出一條直線可以同時穿過外圈與內圈的測試點
(因為其正斜率角度大)
綜合上述,拙者認為,在物理與數學上的推論,
假設:
在萬轉或是7200轉硬碟中,無論我們擷取碟片何部份做系統分割區。
萬轉硬碟的效能(其指標由各項參數構成)應優於7200轉的效能無誤。
是成立的。
以上,純討論
