2007年8月2日木曜日

暑中お見舞い申し上げます ~ ハードディスクはお元気でしょうか

以前、「単に見てみたいから」というだけの理由で作った、ハードディスクのSMARTの属性値を記録して、グラフにプロットするスクリプトがありました。

smartmontoolsでHDDのSMART属性を記録してrrdtoolでグラフ化するperlスクリプト(仮)

これを動かし始めて、約1年。はじめて、おもしろいものが見られました。



20070801



Reallocated Sector Ctっていう値、ぐんぐんと増加していってます。



おそらくは、不良ブロックが見つかって予備のブロックへ置き換えられていて、その置き換えられたブロックの個数なんじゃないかと思います。



しかし!



このグラフだけを見てると、まだ大丈夫かな? そろそろヤバイかな? みたいなことを思ったりするかもしれませんが、これ、OSにFreeBSDを動かしていているのですけど、実際には、カーネルが、ディスクエラー関係のエラーログを、毎日たくさん出してきているし、smartmontoolsもメールで通知してくるしで、もう今すぐにもダメっぽい、というよりも、もうすでにダメ、ってかんじです
だいたい、このマシンを使ってて、ときどき、もたもたっとするので、今、不良セクタをアクセスしてるっぽい?!と、体感でわかっちゃうくらい(笑)。



それと、ドライブによっては、Reallocated Sector Ctという属性値が読み出せないものもあります。なんとなく、最近のドライブでは、読めないものが多い気がしていますが、気のせいかもしれません。





というわけで、個人的な結論としては、SMARTで検出されるのは、

ハードディスク故障の予兆

ではなくて、

さあ、ハードディスクが壊れ始めましたよ!

ってことになりました。



これって、いろんな観測データから地震予知するよりも、地震が発生したことをすぐに周囲へ伝える、緊急地震速報に似てる気がしません?



壊れ始めのときに気がついて、すぐにバックアップをとりはじめるのでも、そこそこ救われるとは思います。でも、やっぱり、本当に重要なところだけは、毎日バックアップが基本ですね。


(2007/8/6)



セクタ0が読めなくなりました。ゲームオーバー。







■ 参考





0 件のコメント:

コメントを投稿