RAID5が「必要」なのはなぜですか?

小さいが、 どうしてRAID-5が「マスティ」なのかというトピックに対する正当な回答を希望します。
以下では、RAID10とRAID5の信頼性の簡単な計算を行い、それらの特性を比較し、RAID1とRAID10の基本的な欠点のいくつかを指摘します。


小さな紹介:


4つのディスクのRAID10と3つのディスクのRAID5の最も単純なケースを検討します。 システム内のすべてのディスクを同じように受け入れます。
記事の元のバージョンでは、RAID10の代わりにRAID0 + 1が言及されましたが、これにより不必要な混乱が生じます。 もちろん、正しい名前はRAID10です。頭にほこりをかけます。

nを1つのディスクの障害の確率とします。

だから-RAID10:


アレイ内のディスクの数-4;
アレイの価格は、4つのディスクのコストに等しくなります。
アレイの容量は、使用するディスクの容量の2倍(1つのディスク)に等しくなります。
データを読み取る最大速度は、1つのディスクの速度の2倍です。
最適な場合のアレイ障害の確率(コントローラーがRAID1 + 0を単一のマトリックスとして実装し、ドライブを任意に結合できる場合):
1つのディスクの障害の確率:P1 = n(1-n)^ 3;
2つのディスクの障害の確率:P2 =(n ^ 2)*(1-n)^ 2;
3つのディスクの故障確率:P3 =(n ^ 3)*(1-n);
4つのディスクの障害の確率:P4 = n ^ 4;
故障確率:P0 =(1-n)^ 4;
完全な確率:4 * P1 + 6 * P2 + 4 * P3 + P4 + P0 = 1;
アレイの故障確率:P(RAID10)= 2 * P2 + 4 * P3 + P4;
*最初の期間では、2つの場合(同じデータを持つドライブが破損した場合)にしかアレイを復元できないため、6ではなく2の費用がかかります。

それとは別に、ほとんどのコントローラーはドライブの結合方法を知らないことに注意してください。つまり、2つのドライブの故障はデータの損失につながり、アレイ全体の信頼性ははるかに低くなります。

RAID5:


アレイ内のディスクの数-3;
アレイの価格は、3つのディスクのコストに等しくなります。
アレイの容量は、2つのディスクの容量に等しくなります。
最大読み取り速度は、1つのディスクの1.5読み取り速度に等しくなります。
アレイの障害の確率は、その中の2つのディスクの障害の確率と同じです。
1つのディスクの障害の確率:P1 = n(1-n)^ 2;
2つのディスクの障害の確率:P2 =(n ^ 2)*(1-n);
3つのディスクの故障確率:P3 = n ^ 3;
故障確率:P0 =(1-n)^ 3;
完全な確率:3 * P1 + 3 * P2 + P3 + P0 = 1;
アレイの故障確率:P(RAID5)= 3 * P2 + P3;

結論:


もちろん、失敗の確率から始めましょう-RAID10の失敗の確率からRAID5の失敗の確率を引きます:
P(RAID10)-P(RAID5)= 2n ^ 2 *(n-1)^ 2-n ^ 3 + n ^ 4 + 3 * n ^ 2 *(n-1)-4 * n ^ 3 *(n -1)
n-> 0 P(RAID10)-P(RAID5)<0の場合、つまり RAID5の信頼性RAID10の信頼性以下。 違いは非常に小さいですが、RAID10が有利です。
ドライブを任意に組み合わせることができないと仮定した場合、RAID5はより信頼性が高くなります。
価格の適正さ:RAID5 1.333倍安価。
速度比:RAID5はRAID10の1.333倍の速度ですが、単一のドライブの1.5倍の速度です。
どちらのオプションの方が良いですか? 少し高速ですが、より高価で信頼性の低いもの。 または、より安価で信頼性の高いものですか?
個人的には、より信頼性が高く安価なRAID5に傾いている私の意見はどこにも傾いていません。

追加:
コメントでは、評判の良いトラックは、場合によってはRAID-5がRAID1よりもはるかに遅いことがあると合理的に指摘しました。 私の謙虚な意見では、これらは非常に特定のケースであるべきですが、念頭に置いてください。

あらゆる種類のコメント:



回復時間:

RAID10リカバリは、データボリューム全体をコピーするのにかかる時間と理想的に同じです。
RAID5の場合、訂正コードによるデータリカバリが必要なため、状況はより複雑です。
ソフトウェアの実装では、RAID5の復旧時間はプロセッサの速度によって決まります。
ハードウェア実装では、RAID5の回復時間はRAID10の回復時間と同じです。
最新のプロセッサが約100MB / sのデータストリーム(最新のドライブのピーク読み取り速度にほぼ等しい)に問題なく対応していることを考えると、正しく実装された場合、ソフトウェアRAID5はRAID10よりも遅くはないと主張できます。
回復中の信頼性について。 この場合、それについて話す必要はまったくありません。バックアップコピーを作成する必要があります。 一般的なケースでは、復旧時にRAID10のディスクの数がRAID5よりも多いことを考慮する必要があります。これは、障害が発生する確率が高いことを意味し、RAID10が復旧時間に対して一意に信頼性が高いとは言えません。

追加:
RAID-5EEが使用されている場合、最初の障害が発生すると、RAID-5に「縮小」し、非常に長い時間がかかる場合があります。 ただし、結果は、単一の障害に耐える本格的なRAID-5であることに留意する必要があります。 実際、(特定の制限の下で)システムは2つの障害が連続して生き残ることができます。

CPU使用率:

RAID5のソフトウェア実装により、プロセッサがロードされます。 最近のプロセッサでは、これは通常重要ではありませんが、高速ドライブでは、ドライブが高速になるほどプロセッサの負荷が大きくなることに注意する必要があります。

また、信頼性はreliabilityの蓋の最後の釘です。

何らかの理由で、RAID10、特にRAID1について話すとき、誰もが1つの非常に重要な点を見落としています。
はい、ドライブの物理的な障害が発生した場合、コピーからのデータ回復が保証されますが、ドライブが異なるデータを返すとどうなりますか? 実際、RAID1では、どのデータが正しいかを知る方法はありません! その内容によってデータの信頼性を判断することはできますが、これは手作業でのみ実行できる簡単な作業ではなく、常に実行できるわけではありません。
このため、ここではRAID1をまったく考慮していません。データ信頼性を制御するメカニズムを提供していません。 また、一般的なRAID10も同様です。
RAID5(6?)一般的な場合、非常に多くのことが提供されます-3つのドライブのうちの1つが誤ったデータを返す場合、それらが信頼できないことが明らかになります。
これ(データの不正確さ)はどのように発生しますか?
ドライブの過熱に関する問題。 問題を食べる。 ファームウェアドライブの問題。 たくさんのオプション! コンピューターの電源の障害の結果として、電子機器が完全に焼損するまで。 この場合、同様のデバイスからボードをインストールしてドライブを復活させることができますが、ドライブ上のすべてのデータが信頼できるという保証はありません。
また、別のカーネーションもあります。 それがすべて始まったトピックでは、BER(ビットエラーレート)について多くが書かれていました。 詳細には触れませんが、まず、ハードドライブの場合、MTBF(平均故障間隔)について詳しく説明することが一般的であることに注意してください。第三に、RAID5を支持する議論になります-ドライブが歪んだデータ(すべての修正手順を経て)を返す場合、どのドライブを信じるべきかをどのように知るのですか?

追加:
ウィキはその反対を言います-回復情報は、ドライブの1つが失敗するまで使用されません。 しかし、人生の経験は違った言い方をしますが、それはかなり前のことであり、どのコントローラーも覚えていません(非標準のRAIDレベルの1つだったかもしれません)。 したがって、ZFS / RAID-6のみのデータの信頼性について明確に話すことができます。

評決:


判定は簡単です-特別な問題をすぐに必要としない場合、RAID1またはRAID0 + 1をブロックする必要はありません-RAID5、5E、6、ZFSに目を向ける必要があります
「純粋な」RAID5に関する評決は一意ではありません:)

更新日:
確率の計算を修正-結論は変わっていません。 「RAID0 + 1」を「RAID10」に修正しました。 この場合、「RAID0 + 1」は「RAID1 + 0」と同じです。 ただし、正しい名前はもちろん「RAID10」です。

Udpate2:
それはとても簡単で複雑ではありません。反対ではないにしても、記事の意味は確実に劇的に変わりました。

Source: https://habr.com/ru/post/J78348/


All Articles