データ飛ぶ

データ飛ぶ。
ハードウェアではなく、誤消去。inode切れだけれど救えるデータもあると考える。
大事なデータだったので復旧を試みる。

まず旧ディスクを保護。システム用のディスクとは別だったので上書きしないように触れないところに置く。
レスキュー用新ディスク増設。
http://gigazine.net/index.php?/news/comments/20070720_photorec/
にて旧ディスクのセクターを全部洗ってみる。
250Gで5時間ぐらいで完了。
吸い出し後の容量は170G。誤消去直後だったのだけれど救えなかったバイナリとかもあったのだろう。

救出されたデータは「recup_dir.563」のような小さなディレクトリに分散されて保存されている。ファイル名は救えない。セクター+拡張子になっている。(f425507176.txtみたいな感じ。多分photorecの自動判別だと思う。)そこでレスキューされたデータを拡張子ごとに集めてみる。
[root@dev resc3]# find /mnt/raid/rescue_dir/ -name *.txt -exec cp {} /mnt/raid/target/txt/ \;
上記コマンドで/mnt/raid/target/の拡張子txtの中にtxtファイルがゴッポリたまる。(|のxargsの方が良いかもしれない。)拡張子ごとに集めたファイルをwindows 端末に持ってくる。
msiとかexeとかはあきらめる。doc,xls,jpg,png,pdf,txtだけ取ってくる。

まずサムネイルでざっとわかるものから見てみる。
jpg、pdf、pngこれらはOKそうだ。(古いのから直近のまであるので多分まともだろう。ちょっと欠落しているかもしれないけど(よくわからない)、ゼロよりはずいぶんましなはずだ。)
doc、ずいぶん見れないファイルがある。多分photorecの拡張子自動判別が上手く使えてないのだろう。
正しいファイル名にする。
http://www.55555.to/what/gm.htm
「極窓」の拡張子判別を使用してみる。
うんうん、xls・docフォルダの中の拡張子誤変換を修正して行けている。
最後に拡張子が判別できないもの(「?」になるもの。)これらはごっぽし捨てることに。
xls 200個、doc 500個、これぐらいなら目で見るか。
(それでもずいぶんな量だなあ。ついでにファイルの整理術や全文検索の活用法でも勉強するのも良いかもしれない。)

元のファイル数30万に比べればずいぶん絞ったはずだろう。
XFSでも基本に忠実にinodeをたどることでずいぶん誤消去ファイルも救えるものだなあ、という勉強と反省。