以前、「単に見てみたいから」というだけの理由で作った、ハードディスクのSMARTの属性値を記録して、グラフにプロットするスクリプトがありました。
これを動かし始めて、約1年。はじめて、おもしろいものが見られました。
Reallocated Sector Ctっていう値、ぐんぐんと増加していってます。
おそらくは、不良ブロックが見つかって予備のブロックへ置き換えられていて、その置き換えられたブロックの個数なんじゃないかと思います。
しかし!
このグラフだけを見てると、まだ大丈夫かな? そろそろヤバイかな? みたいなことを思ったりするかもしれませんが、これ、OSにFreeBSDを動かしていているのですけど、実際には、カーネルが、ディスクエラー関係のエラーログを、毎日たくさん出してきているし、smartmontoolsもメールで通知してくるしで、もう今すぐにもダメっぽい、というよりも、もうすでにダメ、ってかんじです
だいたい、このマシンを使ってて、ときどき、もたもたっとするので、今、不良セクタをアクセスしてるっぽい?!と、体感でわかっちゃうくらい(笑)。
それと、ドライブによっては、Reallocated Sector Ctという属性値が読み出せないものもあります。なんとなく、最近のドライブでは、読めないものが多い気がしていますが、気のせいかもしれません。
☆
というわけで、個人的な結論としては、SMARTで検出されるのは、
ハードディスク故障の予兆
ではなくて、
さあ、ハードディスクが壊れ始めましたよ!
ってことになりました。
これって、いろんな観測データから地震予知するよりも、地震が発生したことをすぐに周囲へ伝える、緊急地震速報に似てる気がしません?
壊れ始めのときに気がついて、すぐにバックアップをとりはじめるのでも、そこそこ救われるとは思います。でも、やっぱり、本当に重要なところだけは、毎日バックアップが基本ですね。
(2007/8/6)
セクタ0が読めなくなりました。ゲームオーバー。
■ 参考
- smartmontoolsでハードディスクの致命的エラー発生を事前に察知
- smartmontoolsをちゃんと活用したいな
- (FreeBSD) smartctlコマンドで表示される属性(Attribute)について
- smartmontoolsでHDDのSMART属性を記録してrrdtoolでグラフ化するperlスクリプト(仮)
0 件のコメント:
コメントを投稿