RAID崩壊とは? 原因と対処法について解説


RAID崩壊の原因と対処法

情報化社会の広がりにより、今やパソコンは1人1台の時代。データの重要性はますます高まっており、個人から企業まで、失われてはならないデータの量は膨大です。そんな重要なデータを、安全な状態で管理するために導入する技術が「RAID」です。
しかし、RAIDも完璧ではありません。致命的な故障により、データが復旧不可能になる「RAID崩壊」が起こることもあるのです。ここでは、RAIDの種類から崩壊の原因、崩壊したときのおすすめの対処法をご紹介します。

RAIDとは?

RAID(Redundant Arrays of Inexpensive Disks)は、複数のHDD(ハードディスク)やSSDを組み合わせて1つのドライブとして認識させる技術のことです。
RAIDの種類によっては、1つのHDDが故障し、そこに保存してあったデータが失われたとしても、残りのHDDに残したデータから元のデータが復旧できます。このように、複数のHDDを使用してデータの安全性を高めることを「冗長化」、または「冗長性を高める」といった言い方をします。
さらにRAIDは、1つのデータを分割して複数のHDDに保存することで、データへのアクセスの高速化を可能にします。

RAIDの種類とその違い

RAIDにはしくみの違いにより、いくつかのレベルがあります。現在、おもに使用されているRAIDは、RAID 1とRAID 5です。ここではRAID 1、RAID 5に加え、RAIDの高速化技術の基本となるRAID 0についてご紹介します。

RAID 0

RAID 0は、別名「ストライピング」といいます。
1つのデータを複数に分割して複数のHDDに保存することで、データへのアクセスを高速化したシステムです。例えば、100のデータを1つのHDDに保存するよりも、50と50に分けて2つのHDDに保存したほうが、保存にかかる時間が短くなるというしくみです。使用するHDDの数が増えるほど、データへのアクセスの高速化を図れますが、このシステムには冗長性がないため、1つのHDDが故障してしまうと、すべてのデータにアクセスできなくなってしまう点がデメリットです。

RAID 1

RAID 1は、別名「ミラーリング」といいます。
複数のHDDに同じデータを書き込むことにより、冗長化させるものです。1つのHDDに障害が生じたとしても、そのほかのHDDに同じデータが存在しているため、システムは稼動し続けることができます。HDDの数が増えるほど冗長性は高くなりますが、複数のHDDを使用しているにもかかわらず、それぞれに同じ内容を書き込むため、台数分容量が増えているわけではないという点がデメリットです。

RAID 5

RAID 5は、別名「分散データガーディング」といいます。
最低3台のHDDを使用し、データをRAID 0と同様に分割して保存。さらに、「パリティ」と呼ばれる冗長コードを、それぞれのHDDに書き込むことが特徴です。このパリティは、HDDに障害が生じて失われたデータを修復するコードで、パリティを元に失われたデータを復元することができます。パリティを使って、システムを元の正常な状態に戻すことを「リビルド」といいます。

RAID崩壊の原因

一般的にHDDの寿命は4~5年程度といわれており、いつかは必ず故障します。ほこりやたばこなどの微細な粒子がHDDの磁気ディスクを傷付けてしまうことがあり、それもHDDの故障の原因になります。 また、熱の影響で障害が発生することもありますので、猛暑日などはRAID機器の故障のリスクが高いようです 。

リビルドの注意点や、不具合が生じた際にしてしまいがちなミス

HDDの故障が、RAIDの冗長性の範囲内であれば、リビルドすることでデータの復旧は可能となります。しかし、リビルドはやり方を誤ると、RAID崩壊してしまうというリスクがあります。
そのため、取扱説明書などによって、その方法を熟知してから慎重に行う必要があります。以下に、リビルド時の注意点や、HDDに不具合が生じた際にしてしまいがちなミスをご紹介します。

リビルドの際に、別のHDDに不具合が生じてしまう

故障したHDDを交換している際に、別のHDDに不具合が生じで故障してしまい、RAID崩壊してしまうという例が少なくありません。これは、ある電化製品に4本の電池を同時に入れて使用開始したとして、1本が電池切れになったときには、残りの3本も電池切れが近づいているのと同じことです。
HDDも同時期に生産された物を使用していることが多く、それを同時に使用開始しているため、寿命も同時期に訪れると考えられるのです。

HDDを取り外し、確認しようとして壊してしまう

不具合が生じた際に自分でHDDを取り外して確認を行い、戻したときに順番を間違ってRAID崩壊させてしまうというケースもあります。これは、本のページをバラバラにしてしまったら、内容がわからなくなってしまうのと同じです。
また、取り外したHDDを個別にパソコンに接続してデータを確認しようとした際に、誤ってHDDをフォーマットしてしまい、データを消してしまうというミスもあるようです。

管理画面での操作ミス

動作に問題が生じた際に管理画面を操作し、誤ってRAIDレベルを違うレベルに変更してしまったり、HDDを初期化してしまったりということもあります。こうした操作ミスによっても、RAIDは崩壊してしまうので注意が必要です。

RAIDを崩壊させないためには

RAIDは、冗長性の範囲内の故障であればシステムはそのまま稼働しますが、その状態を続けることは次の故障を引き起こす原因となり、データを損失するリスクも大きくなります。1つのHDDが故障したら、速やかにリビルドを行い、対処したほうがいいでしょう。そのためには、交換用のHDDをストックしておくのもひとつの手です。
ただし、前述したように、リビルドにはリスクが付き物です。もし、説明書を読んでもよくわからなかったら、シャットダウンを行い、復旧業者に依頼しましょう。素人判断で復旧を試みると、上記でご紹介したような取り返しのつかない事態に陥ってしまうことがあります。

もしもRAIDが崩壊したら…

RAIDが崩壊してしまい、データへのアクセスが完全にできなくなってしまった…。そんなときは、A1データにご相談ください。
A1データのデータ復旧サービスは、20年以上の経験と全世界で復旧作業を行っている200人以上のエンジニアが持つノウハウを活用しており、複雑なRAIDシステムに対しても高い復旧率を誇っています。

RAIDを使用する上でHDDの故障は避けられません。素人判断で復旧を試みようとするのではなく、少しでもわからない点があったら、データ復旧会社にご依頼ください。それが、事態を悪化させずに、大切なデータを取り戻す最良の手段といえるでしょう。

関連する項目

関連するデータ復旧事例

データ復旧サービスについて