「RAID 1」のよくある勘違い:バックアップの為ではない。

「RAID 1」と聞くと「HDDのバックアップ用のテクニック」という印象を受けるし、そういう認識でRAID 1を覚えている人もいると思う。実際、ぼく自身も「HDDの故障に備えるならRAID 1 だよね。」という漠然とした認識でした。

しかし真実は…RAID 1はバックアップのために存在するわけではないのです。

Sponsored Link

RAID 1の仕組み

すでにRAID 1がどういう仕組みで機能しているのか理解している人もいると思うが、念のため「RAID 1ってなんだろう…」という人のために解説しておきます。

RAID 1は別名「ミラーリング」(鏡写し)とも呼ばれており、その呼び名の通りデータを2つのHDDに同時に書き込む仕組み。全く同じ状態で2つのHDDに保存する様が鏡写しのようなので、ミラーリングと言われている。

一見すると、このRAID 1という技術は同じデータを2つのHDDに保存しているので、バックアップとして有用かのように見えてしまう。しかし実際のところRAID 1は冗長化のための技術に過ぎません…。

RAID 1最大のメリットは「冗長化」

じゃあ「冗長化」とはいったい何か。バックアップとどう違うのか。という話になります。

仮にRAID 1を構成しているHDDの内、1枚がPC稼働中に壊れてしまったとする。RAID 1のスゴイところはまさにこの部分で、片方がぶっ壊れても問題なくシステムの稼働が可能なんです。

普通なら、HDDが故障すると認識できなくなったり、中のデータを見れなくなるし、システムドライブならWindowsの起動が出来なくなる。しかしRAID 1を組んでいれば、片方壊れても普通に使えます。

「システムが安定稼働している状態をどれだけ長く持続できるのか。」これが冗長性と呼ばれるもので、RAID 1のメリットである冗長化とは「冗長性を得ること」という意味になる。

ホットスペアとホットスワップ

なお、RAID 1を組んでいると片方が壊れてもシステムを稼働し続けられるが、故障したHDDを交換したい場合はシステムをシャットダウンする必要がある。

これではせっかく冗長性を得たのになんだか無意味に感じてしまう。解決策が「ホットスワップ」。通電した状態でもHDDの交換に対応できる技術です(ホットスワップ対応のマウントベイが必要だが…)

もう一つがホットスペア。これは最初から予備のHDDを通電状態にしておき、故障が起こった時にその予備のHDDを使って自動的にアレイを組み直す機能のこと。

なお、BIOSやWindowsから設定できるRAIDはソフトウェアコントローラなので、ホットスペアに対応していないことが多い。基本的には、ホットスペア対応を謳うハードウェアRAIDコントローラ(RAIDカード)が必要になる。

RAID 1がバックアップとしてダメな理由

実際にやらかした話をします。その方がなぜRAID 1がバックアップの為に存在するものではないのか、分かりやすいから。

初心者もち
データ大事にしたいな。ググるとRAID 1が良いらしい。

(半年後…)

初心者もち
上書きしちゃった、どうしよう。大事なデータを上書きしちゃったよ。過去のデータのコピー取ってないよ~….(沈没)。

RAID 1は、システムからストレージへ送り込まれたデータをほぼ同時に2つのHDDに書き込みます。ここが盲点です。誤ってデータを破損したり、上書きして紛失した場合、取り返しの付かないことになる。

削除したくらいなら復元ソフトでカンタンに取り返せますが、データの改変や修正、そして上書きした場合はまず取り返しが付きません。

RAID 1は愚直に2つのHDDにデータを書き込むけれど、そこには誤った操作も含めてすべて同時反映されるという恐ろしい意味も含まれる。ぼくはこの事件以来、RAID 1をやめ、複数ストレージへの分散で対処しています。

このように、複数のポータブルHDDに同じデータを保存しています。これなら1枚のHDDで何かをマズイことをやらかしても、他の予備データから復元が可能。

そしてこのアナログな方法はHDDの数が多いほど有利になる。ぼくはSATA HDDも含めて4台に、重要データをコピペしている。仮に故障率が1%だった場合、4台になるとデータが完全に喪失する確率は「0.000001%」(1%^4)です。

定期的に一番古いHDDを交換するなどを繰り返せば、実質的にデータが喪失する確率はほぼゼロといえる。

天変地異が起こって4台とも物理的に破壊されるようなことでも無い限り、まずデータを失うことはない。
追記:自動バックアップも同様の注意が必要

コメントで指摘されたので追記します。ぼくはHDD4台に1週間くらいの時差をつけて、手動でコピペをするというアナログなことをやっている。だからこの注意点に気づかなかった。

バックアップの即時性を重視して、自動で高頻度のバックアップを行っていると…RAID 1と同様に誤った操作が反映されるまでのタイムリミットが速いことを意味するので、速すぎてもリスクが高い。

逆に頻度が遅いと、それだけパソコンに不調が起こった時に「今、作業中のデータを失う」リスクが付きまとう。このあたりは各自、許容できる範囲で調整するしか無いと思います。

SSDのRAID 1は仕組み上、少し怖い

RAID 1といえばHDDですが、SSDにも使うことができます。しかし、SSDには「書き込み耐性」(TBW)と言う構造上の寿命が存在するため、RAID 1の同時書き込みという仕組みと相性が悪すぎる。

同時に書き込むということは、例えばTBWが100TBのSSDでRAID 1を組むとする。この場合、TBWを使い切る頃には2台同時に寿命が訪れる可能性が高いという意味。同時に壊れたらアレイは完全崩壊、冗長性とはいずこへ…。

TBWを使い切ってもすぐには壊れない

補足しておきますが、書き込み耐性がなくなったからと言ってSSDが即壊れることは無い。おそらく、多くの場合はそのまま認識可能ですが、書き込みエラーの頻発やビット化けの確率が上昇します。

一応寿命が切れたSSDでも、米国のJEDEC(半導体技術協会)が「気温30度の環境で、52週間以上はデータを保持できること」を条件にしているので、すぐにデータが破損するわけではありません。

TBWを使い切ったらすぐにデータを他のストレージへコピーして対処すれば良い。NANDフラッシュの仕組み上、書き込みはできなくなっても読み出しは可能ですから。

その他、RAID 1のデメリット

RAID 1がバックアップに適さないという話は以上です。ここではRAID 1の基礎知識として「デメリット」について、少し解説しておく。

  • 読み出しは速くなるが、書き込みは遅くなる
  • 使用できる容量が50%になる(容量単価が2倍)

読み込みが速いのは、すでに保存済みのデータを2本のHDDから同時に取り出せることがあるからです。ちょうどRAID 0に近い状態ですね。

HDDの速度比較(MB/s)

  • RAID 1 – Read
    232.2
  • RAID 1 – Write
    132.5
  • HDD x1 – Read
    203.7
  • HDD x1 – Write
    203.9
  • RAID 1 – 4KRead
    0.92
  • RAID 1 – 4KWrite
    1.10
  • HDD x1 – 4KRead
    0.71
  • HDD x1 – 4KWrite
    0.96

逆に書き込みは遅くなる。2本のHDDに同時書き込みをするので、遅くなるのは自然なこと。そして、2本に全く同じデータを入れるわけですから、使える容量も当然50%(半分)になります。

たとえば、4TB HDDを2個使って合計8TBにしても、RAID 1を組むと実際に使えるのは4TBだけ。

Sponsored Link

まとめ:「RAID 1 = バックアップ」は誤り

RAID 1はもっとも安価に、システムの冗長性(耐障害性)を高める有用な手段ですが、データのバックアップのためにRAID 1を使うのは誤りです。ぼくが紹介した失敗談で、よく理解できたかと。

初心者もち
もしかして、パソコンをこまめに消す人には無用なのかな?
自作歴22台のやかもち
その通りですね。24時間データを記録し続けるとか、特殊な用途が無いなら使う必要性がない。

最後に、RAID 1とHDD単体、そして複数ストレージによるバックアップの違いを表にまとめて終わります。

想定されるトラブルHDD単体RAID 1バックアップ備考
誤って削除削除される削除される他のHDDから復元「削除」ならデータ復元ソフトで高確率の回収が可能。
誤って改変・上書き改変・上書きされる改変・上書きされる他のHDDから復元データ復元ソフトでも復旧は困難。
HDDが故障停止稼働し続ける他のHDDがデータ保持ホットスワップ対応なら、PCを起動したままHDDの交換が可能。

データを守りたいというだけなら、複数ストレージを使ったバックアップで十分ですね。RAID 1はNASのようなサーバーストレージを構築したいなど、冗長性が重要な場面で使えばいい。

以上「RAID 1のよくある勘違い:バックアップの為ではない。」でした。

Sponsored Link

8 件のコメント

  • 要するにRAID1はHDDの突発的死でデータが失われるのを防ぐ、以外の効果は無いということですかね
    ところでオンボードじゃないハードウェアRAIDってオンボードとどう違うんでしょうか?

    • < ハードウェアRAIDってオンボードとどう違うんでしょうか?

      これはRAIDカードによりますね。RAIDカードに載っているチップの種類によって、RAIDを構築した時のパフォーマンスが違ったり、ホットスワップ対応だったり、ソフトウェアRAIDでは構成できない「RAID 6」を構築できたり。特にAreca製のRAIDカードはトップクラスのスピードらしく、冗長性と速度を両立したい…という、ごく一部のエンスージアストから支持があります。

  • バックアップは
    ”即時性が無い”
    と言う事は書いておいた方が良いのでは無いでしょうか?
    これはメリットでもありデメリットでもあるので
    (バックアップソフトなどを使って即時にしていたらRAIDと同じように上書きミスでデータ消えます)
    5分や10分刻みや手動でバックアップをしていればその間にパソコンに不具合があればバックアップはとれていませんし
     
    最後の表のバックアップで他のHDDから復元可能と書いていますが
    変更→もう一度変更(これがミス!)だった場合復元できませんよね?
    変更→バックアップ→もう一度変更(これがミス!)だったら復元できますが

  • 記事内のホットスペアの説明ですが、「通電した状態でもHDDの交換に対応できる技術」と言う文面だとホットスワップに近い説明になっているので、もう少ししっかりと説明した方が良いと思います。

  • バックアップはバックアップなのですけど、こいつら(RAID)は基本的にHDDの動作保証に対してであって、HDDのデータに対してでは無いんですよね…。

  • 1つ懸念されるのが、HDD書き込み中のトラブルですね。

    先日、何の前触れもなくマシンがフリーズし、
    CPUファンフル回転(ファンコントロールが効いていない状態になっている)、
    電源ボタン長押しによるシャットダウン不可、それどころかリセットボタンも利かない、
    マザボ上の電源ボタンもダメ、となると電源コードを抜くしかないという最悪の事態に。
    HDDアクセスランプが付きっぱなしだったので、もう祈りながら電源コードを抜いたのですが、
    幸いHDDのクラッシュには至りませんでした。

    恐らくこうなると、いくらRAID1でもHDDアクセス中の状態でいきなり電源が落ちれば、
    2台ともダメになる可能性は十分ありますし、バックアップと違って常時アクセスしている
    状態であれば尚更でしょう(いきなり停電とか起きる事も考えられますし)。

  • SSDでも、耐性問題をクリアできるんだよ。

    貴方は「2台同時に寿命が訪れる可能性が高い」と言ってるけど、
    この問題は、簡単にクリアできる。

    2台とも同じ製品を使うとして、一方だけ先に数ヶ月使用したものを使う。
    そうすれば、同時には寿命は訪れない。

    そうして、スペアを含め3台用意すれば完璧だ。

  • コメントを残す

    メールアドレスが公開されることはありません。