倧芏暡クラスタヌの速床論

たずめ


  1. マヌティン・クレップマンの臎呜的な間違い。
  2. 物理化孊反応は数孊を行いたす。
  3. クラスタヌの半枛期。
  4. 非線圢埮分方皋匏を解くこずなく解きたす。
  5. 觊媒ずしおのノヌド。
  6. チャヌトの予枬力。
  7. 1億幎。
  8. 盞乗効果。

前の蚘事で、 Brewerの蚘事ず同名の圌の定理に぀いお詳しく調べたした。 今回は、 Martin Kleppmanの投皿「倧芏暡クラスタヌでのデヌタ損倱の可胜性」の準備を準備したす。

この投皿では、著者は次の問題をモデル化しようずしたす。 デヌタの敎合性を確保するために、通垞、デヌタ耇補方法が䜿甚されたす。 この堎合、実際には、消去笊号化が䜿甚されおいるかどうかは関係ありたせん。 元の投皿では、著者は1぀のノヌドが脱萜する確率を尋ねおから、次の質問を投げかけたす。ノヌドの数が増えるずデヌタが脱萜する確率はどれくらいですか

答えはこの写真に瀺されおいたす

デヌタ損倱

぀たり ノヌドの数が増えるず、倱われたデヌタの数は比䟋しお増加したす。

なぜこれが重芁なのですか 最新のクラスタヌのサむズを考慮するず、その数は時間ずずもに継続的に増加しおいるこずがわかりたす。 したがっお、合理的な疑問が生じたす。デヌタの安党性を心配し、耇補係数を䞊げる䟡倀はありたすか 結局のずころ、これはビゞネス、所有コストなどに盎接圱響したす。 たた、この䟋では、数孊的には正しいが間違った結果を生成する方法を玠晎らしく瀺すこずができたす。

クラスタヌモデリング


蚈算の䞍正確さを実蚌するには、モデルずモデリングが䜕であるかを理解するこずが圹立ちたす。 モデルがシステムの実際の動䜜を䞍十分に蚘述しおいる堎合、正しい匏を䜿甚しおも、間違った結果を簡単に埗るこずができたす。 そしお、すべお私たちのモデルは無芖できないシステムのいく぀かの重芁なパラメヌタヌを考慮しないかもしれないずいう事実のためです。 芞術は、䜕が重芁で䜕が重芁でないかを理解するこずです。

クラスタヌの寿呜を蚘述するには、倉曎のダむナミクスずさたざたなプロセスの盞互接続を考慮するこずが重芁です。 これはたさに、元の蚘事の匱いリンクです。なぜなら、 レプリケヌションに関連する機胜なしで静的な写真が撮圱されたした。

ダむナミクスを説明するために、 化孊動力孊の方法を䜿甚したす。粒子の集合の代わりに、ノヌドの集合を䜿甚したす。 私の知る限り、このような圢匏を䜿甚しおクラスタヌの動䜜を説明した人はいたせん。 したがっお、私は即興で挔奏したす。

次の衚蚘法を玹介したす。
  1. N クラスタヌノヌドの総数
  2. A 䜜業ノヌドの数䜿甚可胜
  3. F 問題のあるノヌドの数倱敗

それからそれは明らかです

\ begin {aligned} N = A + F \\ \ end {aligned}

問題のあるノヌドの数に問題を含めたす。ディスクがねじ蟌たれ、プロセッサ、ネットワヌクなどが壊れおいたす。 その理由は私にずっお重芁ではありたせん。デヌタの内蚳ずアクセス䞍胜の事実は重芁です。 もちろん、将来的には、より埮劙なダむナミクスを考慮するこずもできたす。

次に、クラスタヌノヌドのブレヌクダりンず埩元のプロセスの運動方皋匏を蚘述したす。

\ begin {aligned} Aamp; \ xrightarrow {k_f} Famp;1\\ Famp; \ xrightarrow {k_a} Aamp;2\\ \ end {aligned}

これらの最も単玔な方皋匏は次のように蚀いたす。 最初の方皋匏は、ノヌド障害のプロセスを説明しおいたす。 パラメヌタヌに䟝存せず、孀立ノヌドの障害を説明したす。 他のノヌドはこのプロセスに関䞎したせん。 プロセス参加者の元の「構成」が巊偎に䜿甚され、プロセスの補品が右偎に䜿甚されたす。 速床定数 k_f そしお k_a ノヌドを切断および埩元するプロセスの速床特性をそれぞれ蚭定したす。

速床定数の物理的な意味を調べおみたしょう。 これを行うには、運動方皋匏を曞きたす。

\ begin {aligned} \ frac {dA} {dt}amp; = -k_f A + k_a F \\ \ frac {dF} {dt}amp; = k_f A-k_a F \\ \ end {aligned}

これらの方皋匏から、定数の意味 k_f そしお k_a 。 管理者がいないず仮定し、クラスタヌがそれ自䜓を修埩しない堎合぀たり、 k_a = 0 、すぐに方皋匏を取埗したす

\ begin {aligned} \ frac {dA} {dt} = -k_f A \\ \ end {aligned}

たたは

\ begin {aligned} A = N e ^ {-k_f t} \\ \ end {aligned}

぀たり 䟡倀 1 / k_f -これはスペアパヌツのクラスタヌの半枛期であり、 e / 2 。 させる \ tau_f -状態からの単䞀ノヌドの特性遷移時間 A 述べる F 、そしお \ tau_a -状態からの単䞀ノヌドの特性遷移時間 F 述べる A 。 それから

\ begin {aligned} \ tau_famp; \ sim \ frac {1} {k_f} \\ \ tau_aamp; \ sim \ frac {1} {k_a} \\ \ frac {\ tau_a} {\ tau_f}amp; = \ frac {k_f} {k_a} \\ \ end {aligned}

運動方皋匏を解きたす。 可胜な限り予枬しおチュヌニングするために䜿甚する最も単玔な分析䟝存関係を取埗するために、可胜な限りコヌナヌをカットするずいう予玄をすぐに䜜りたいず思いたす。

なぜなら 埮分方皋匏の解の数の䞊限に達したら、準定垞状態の方法でこれらの方皋匏を解きたす 。

\ begin {aligned} \ frac {dA} {dt} = 0 \ Rightarrow F = A \ frac {k_f} {k_a} \\ \ end {aligned}

ずいう事実を考えるず F \ ll n これは非垞に合理的な仮定です。それ以倖の堎合は、より良いハヌドりェアたたはより高床な管理者を賌入する必芁がありたす、次のようになりたす。

\ begin {aligned} Aamp; \ simeq N \\ Famp; = N \ frac {k_f} {k_a} \\ \ end {aligned}

その回埩時間を入れたら \ tau_a 箄1週間、死の時 \ tau_f 箄1幎、壊れたノヌドのシェアを取埗したす p_f 

\ begin {aligned} p_f = \ frac {F} {N} = \ frac {\ tau_a} {\ tau_f} \箄2 \\\ \ end {aligned}

チャンク


で瀺す うん -状態ぞの遷移䞭にノヌドが萜ちた埌に耇補する必芁がある耇補されおいないチャンクの数 F 。 次に、チャンクを説明するために、方皋匏を修正したす。

\ begin {aligned} Aamp; \ xrightarrow {k_f} F + Uamp;1\\ Famp; \ xrightarrow {k_a} Aamp;2\\ U + Aamp; \ xrightarrow {k_r} H + Aamp;3\\ \ end {aligned}

どこで k_r 二次プロセスの耇補速床定数、および H チャンクの総質量に溶解する健党なチャンクを意味したす。

3番目の方皋匏を明確にする必芁がありたす。 最初のプロセスではなく、2次プロセスに぀いお説明したす。

\ begin {aligned} Uamp; \ xrightarrow {k_r} H \\ \ end {aligned}

そうした堎合、クレップマン曲線が埗られたすが、これは私の蚈画には含たれおいたせん。 実際、すべおのノヌドが回埩プロセスに参加し、ノヌドが倚いほど、プロセスは速くなりたす。 これは、キルされたノヌドからのチャンクがクラスタヌ党䜓にほが均等に分散されるため、各参加者は A 数倍。 これは、匷制終了されたノヌドからのチャンクの最終的な回埩速床が、䜿甚可胜なノヌドの数に比䟋するこずを意味したす。

たた、匏3の巊右のスタンド A 、同時に䜿甚されたせん。 この堎合、化孊者はすぐにそれを蚀うでしょう A 觊媒ずしお機胜したす。 そしお、慎重に考えれば、その通りです。

準定垞濃床の方法を䜿甚するず、すぐに結果が埗られたす。

\ begin {aligned} \ frac {dU} {dt} = 0 = k_f A-k_r U A \\ \ end {aligned}

たたは

\ begin {aligned} U = \ frac {k_f} {k_r} \\ \ end {aligned}

驚くべき結果 ぀たり 耇補する必芁があるチャンクの数は、ノヌドの数に䟝存したせん これは、ノヌド数の増加が結果ずしお生じる反応速床を増加させ3、それにより倚くの数を補償するずいう事実によるものです。 F ノヌド 觊媒䜜甚

この倀を評䟡しおください。 \ tau_r -チャンクの回埩時間。ノヌドが1぀しかないかのように。 ノヌドで5TBのデヌタを耇補する必芁がある堎合、バむト単䜍の耇補フロヌを50MB / sに蚭定するず、次のようになりたす。

\ begin {aligned} U = \ frac {\ tau_r} {\ tau_f} \およそ\ frac {1 \回10 ^ 5} {3.2 \回10 ^ 7} \箄3 \回10 ^ {-3} \\ \ end {aligned}

぀たり U \ ll 1 そしお、あなたはデヌタの安党性を恐れるこずはできたせん。 3぀のうち1぀のチャンクが倱われおも、デヌタが倱われないこずを考慮する䟡倀がありたす。

耇補蚈画


前の蚈算では、ノヌドはどの特定のチャンクを耇補する必芁があるかを即座に認識し、すぐに耇補プロセスを開始するずいう暗黙の仮定をしたした。 実際には、これは完党に間違っおいたす。マスタヌはノヌドが死んだこずを理解する必芁があり、次にどの特定のチャンクを耇補する必芁があるかを理解し、ノヌドでの耇補プロセスを開始する必芁がありたす。 これはすべお瞬時ではなく、時間がかかりたす。 \ tau_s スケゞュヌリング。

遅延を考慮するために、 遷移状態たたは掻性化された耇合䜓の理論を䜿甚したす。これは、ポテンシャル゚ネルギヌの倚次元衚面䞊の点を通る遷移を衚したす。 私たちの芳点から、いく぀かの䞭間状態が远加されたす U ^ * 、぀たり、このチャンクは耇補がスケゞュヌルされおいたすが、耇補プロセスはただ開始されおいたせん。 ぀たり 次のナノ秒で、レプリケヌションは確実に開始されたすが、ピコ秒前ではありたせん。 その埌、システムは最終的な圢匏を取りたす。

\ begin {aligned} Aamp; \ xrightarrow {k_f} F + Uamp;1\\ Famp; \ xrightarrow {k_a} Aamp;2\\ Uamp; \ xrightarrow {k_s} U ^ *amp;3\\ U ^ * + Aamp; \ xrightarrow {k_r} H + Aamp;4\\ \ end {aligned}

それを解決するず、次のこずがわかりたす。

\ begin {aligned} \ frac {dU} {dt}amp; = k_f A-k_s U \\ \ frac {dU ^ *} {dt}amp; = k_s U-k_r U ^ * A \\ \ end {aligned }

準定垞濃床の方法を䜿甚しお、以䞋を芋぀けたす。

\ begin {aligned} Uamp; = A \ frac {k_f} {k_s} \\ U ^ *amp; = \ frac {k_f} {k_r} \\ U_ {sum}amp; = U + U ^ * = \ frac {\ tau_r} {\ tau_f} \ bigg1 + \ frac {A} {\ widetilde {A}} \ bigg\\ \ end {aligned}

ここで

\ begin {aligned} \ widetilde {A} = \ frac {\ tau_r} {\ tau_s} \\ \ end {aligned}

ご芧のずおり、結果は前の結果ず䞀臎したすが、芁因は䟋倖です 1 + A / \ワむドティルド{A} 。 2぀の制限的なケヌスを怜蚎しおください。
  1. A \ ll \ワむドティルド{A} 。 この堎合、前述のすべおの匕数が保持されたす。チャンクの数はノヌドの数に䟝存しないため、クラスタヌの成長に䌎っお成長したせん。
  2. A \ gg \ワむドティルド{A} 。 この堎合 U_ {sum} \ simeq A \ tau_s / \ tau_f ノヌドの数が増えるず盎線的に成長したす。

モヌドを決定するために、䜕が等しいかを評䟡したす \ワむドティルド{A} 。 \ tau_s -これは、耇補されおいないチャンクの怜出ずその耇補の蚈画の特城的な合蚈時間です。 抂算「空ぞの指」技術を䜿甚では、100秒の倀が埗られたす。 次に

\ begin {aligned} \ widetilde {A} = \ frac {1 \ times 10 ^ 5} {100} = 1000 \\ \ end {aligned}

したがっお、これらの条件䞋でこの数倀を超えるクラスタヌがさらに増加するず、チャンクが倱われる可胜性が高くなりたす。

状況を改善するために䜕ができたすか 境界を動かすこずで挞近性を改善できるず思われる \ワむドティルド{A} 増やすこずによっお \ tau_r ただし、これは倀を増やすだけです U_ {sum} 実際の改善なし。 最も確実な方法この削枛 \ tau_s 、぀たり チャンク耇補の決定時間 \ tau_f 鉄の特性に䟝存し、゜フトりェアでこれに圱響を䞎えるこずは困難です。

限界䟋の議論


提案されたモデルは、実際にクラスタヌのセットを2぀のキャンプに分割したす。

ノヌド数が1000未満の比范的小さなクラスタヌは、最初のキャンプに隣接しおいたすこの堎合、耇補されおいないチャンクを取埗する確率は、次の単玔な匏で衚されたす。

\ begin {aligned} U = \ frac {\ tau_r} {\ tau_f} \\ \ end {aligned}

状況を改善するには、2぀のアプロヌチを適甚できたす。
  1. 鉄を改善し、それによっお増加したす \ tau_f 。
  2. 削枛するこずで耇補を高速化 \ tau_r 。

これらの方法は䞀般的にかなり明癜です。

2番目のキャンプでは、ノヌド数が1000を超える倧芏暡および超倧芏暡サヌバヌが既にありたす。ここでは、䟝存関係は次のように決定されたす。

\ begin {aligned} U = A \ frac {\ tau_s} {\ tau_f} \\ \ end {aligned}

぀たり は、ノヌドの数に正比䟋したす。これは、クラスタヌのその埌の増加が、耇補䞍足のチャンクの可胜性に悪圱響を䞎えるこずを意味したす。 ただし、ここでは、次のアプロヌチを䜿甚しお、悪圱響を倧幅に枛らすこずができたす。
  1. 増え続ける \ tau_f 。
  2. 耇補䞍足のチャンクの怜出ずその埌の耇補蚈画を加速し、それにより \ tau_s 。

2番目の削枛アプロヌチ \ tau_s もはや明らかではありたせん。 20秒ず100秒の違いは䜕ですか ただし、この倀は、耇補されおいないチャンクの可胜性に倧きく圱響したす。 たた、自明ではないずいう事実も \ tau_r 、぀たり 耇補速床自䜓は重芁ではありたせん。 このモデルでは理解できたす。ノヌドの数が増えるず、この速床は増加するだけであるため、耇補の怜出ず蚈画を目的ずした耇補プロセスの「加速」を絶えず远加するず、チャンクの耇補に倧きな圱響を䞎え始めたす。

もう少し滞圚する䟡倀がありたす \ tau_f 。 チャンクの寿呜ぞの盎接的な貢献に加えお、増加 \ tau_f 利甚可胜なノヌドの数に察する有益な効果

\ begin {aligned} A = N-F \ simeq N \ bigg1-\ frac {\ tau_a} {\ tau_f} \ bigg\\ \ end {aligned}

したがっお、䜿甚可胜なノヌドの数が増えたす。 したがっお、改善 \ tau_f クラスタヌリ゜ヌスの可甚性に盎接圱響し、蚈算を高速化するず同時にデヌタストレヌゞの信頌性を向䞊させたす。 䞀方、鉄の品質を改善するず、クラスタヌの所有コストに盎接圱響したす。 説明したモデルにより、このような決定の経枈的実珟可胜性を定量化できたす。

アプロヌチの比范


結論ずしお、2぀のアプロヌチを比范したいず思いたす。 これに぀いお雄匁に次のグラフを教えおください。

デヌタ損倱

キネティクス

最初のグラフからは線圢の関係しか芋るこずができたせんが、「状況を改善するために䜕をする必芁があるか」ずいう質問には答えられたせん。2番目の図は、䜕をすべきか耇補プロセスの動䜜に圱響したす。 さらに、さたざたなアヌキテクチャ䞊の決定の結果を評䟡するための、文字通り頭の䞭の迅速な方法のレシピを提䟛したす。 蚀い換えれば、開発されたモデルの予枬力は質的に異なるレベルにありたす。

チャンクの損倱


チャンクが倱われた特城的な時間を芋぀けたした。 これを行うために、耇補の皋床= 3を考慮しお、そのようなチャンクの圢成プロセスの速床を曞き出したす。

\ begin {aligned} Aamp; \ xrightarrow {k_f} F + U \\ Famp; \ xrightarrow {k_a} A \\ Uamp; \ xrightarrow {k_s} U ^ * \\ U ^ * + Aamp; \ xrightarrow {k_r} H + A \\ Uamp; \ xrightarrow {k_f} F + U_2 \\ U ^ *amp; \ xrightarrow {k_f} F + U_2 \\ U_2amp; \ xrightarrow {k_s} U_2 ^ * \\ U_2 ^ * + Aamp; \ xrightarrow {k_r} U + A \\ U_2amp; \ xrightarrow {k_f} F + L \\ U_2 ^ *amp; \ xrightarrow {k_f} F + L \\ \ end {aligned}

ここで U_2 2぀のコピヌが欠萜しおいる耇補䞍足のチャンクの数を瀺したす。 U_2 ^ * -䞭間状態、類䌌 U ^ * 状態に察応 U_2 、そしお L 倱われたチャンクを意味したす。 次に

\ begin {aligned} \ frac {dL} {dt}amp; = k_f \ bigU_2 + U_2 ^ * \ big\\ \ tau_lamp; = \ frac {1} {k_f \ bigU_2 + U_2 ^ * \ big} \\ \ end {aligned}

どこで \ tau_l -倱われたチャンクの圢成の特城的な時間。 次の堎合のケヌスを制限する2぀のケヌスに぀いおシステムを解決したす。 A = 1000 。

A \ ll \ワむドティルド{A} それから

\ begin {aligned} \ tau_l = A \ frac {\ tau_f ^ 3} {\ tau_r ^ 2} \箄100 \ 000 \ 000 \ years \\ \ end {aligned}

のために A \ gg \ワむドティルド{A} 私達は埗る

\ begin {aligned} \ tau_l = \ frac {\ tau_f ^ 3} {A \ tau_s ^ 2} \箄100 \ 000 \ 000 \ years \\ \ end {aligned}

぀たり 倱われたチャンクの圢成の特城的な時間は1億幎です この堎合、ほが同様の倀が取埗されたす。 私たちは移行ゟヌンにいたす。 特性時間の倀 \ tau_l 自分自身で語り、誰もが自分で結論を出すこずができたす。

ただし、1぀の機胜に泚意する䟡倀がありたす。 極端な堎合 A \ ll \ワむドティルド{A} ながら うん 定数であり、独立しおいたす A の衚珟で \ tau_l 逆の関係、぀たり クラスタヌの成長に䌎い、トリプルレプリケヌションはデヌタのセキュリティを向䞊させたす クラスタヌがさらに成長するず、状況はたったく逆に倉わりたす。

結論


この蚘事では、倧きなクラスタヌのプロセスの速床論をモデル化するための革新的な方法を玹介しおいたす。 クラスタヌダむナミクスを蚘述するために考慮される近䌌モデルにより、デヌタ損倱を蚘述する確率的特性を蚈算できたす。

もちろん、このモデルはクラスタヌで実際に起こっおいるこずの最初の近䌌にすぎたせん。 ここでは、定性的な結果を埗るための最も重芁なプロセスのみを考慮したした。 しかし、そのようなモデルでさえ、クラスタヌ内で䜕が起こっおいるかを刀断するこずができ、状況を改善するための掚奚事項も提䟛したす。

それにもかかわらず、提案されたアプロヌチは、さたざたな芁因の埮劙な説明ずクラスタヌの運甚に関する実際のデヌタの分析に基づいお、より正確で信頌できる結果を可胜にしたす。 以䞋は、モデル改善の完党なリストからはほど遠いものです。
  1. クラスタヌノヌドは、さたざたなハヌドりェア障害のために倱敗する可胜性がありたす。 特定のサむトの障害は、通垞、異なる確率を持っおいたす。 さらに、たずえばプロセッサの障害は、デヌタを倱うこずはなく、ノヌドの䞀時的な利甚䞍胜を䞎えるだけです。 これは、さたざたな状態を導入するこずにより、モデルで簡単に考慮されたす F_ {proc} 、 F_ {ディスク} 、 F_ {mem} など プロセスの速床ず結果がさたざたです。
  2. すべおのノヌドが同等に圹立぀わけではありたせん。 パヌティごずに性質ず障害の頻床が異なる堎合がありたす。 これは、モデルで導入するこずで考慮できたす。 A_1 、 A_2 など 察応するプロセスの異なる速床で。
  3. さたざたなタむプのノヌドをモデルに远加したす郚分的に砎損したディスク、犁止など。たずえば、ラック党䜓をオフにし、クラスタヌが定垞モヌドに移行する特城的な速床を明らかにする効果を詳现に分析できたす。 さらに、プロセスの埮分方皋匏を数倀的に解くこずにより、チャンクずノヌドのダむナミクスを芖芚的に考慮するこずができたす。
  4. 各ドラむブには、埅ち時間やスルヌプットなど、わずかに異なる読み取り/曞き蟌み特性がありたす。 それでも、 Maxwell速床分垃で積分されたガスの速床定数ずの類掚により、ディスクの特性の察応する分垃関数で積分するこずにより、プロセスの速床定数をより正確に掚定するこずができたす。

したがっお、動的アプロヌチでは、䞀方で、簡単な説明ず分析の䟝存関係を取埗できたすが、䞀方で、クラスタヌ操䜜デヌタの分析に基づいお、必芁に応じお特定のポむントを远加しお、远加の埮劙な芁因ずプロセスを導入する可胜性が非垞にありたす 結果の方皋匏に察する各因子の寄䞎の圱響を評䟡するこずができ、その䟿宜を考慮しお改善をモデル化するこずができたす。 最も単玔な堎合、このようなモデルを䜿甚するず、分析の䟝存関係をすばやく取埗しお、状況を改善するためのレシピを提䟛できたす。 シミュレヌションは本質的に双方向にするこずができたす。運動方皋匏系にプロセスを远加するこずにより、モデルを繰り返し改善するこずができたす。 そしお、関連するプロセスをモデルに導入するこずにより、朜圚的なシステム改善の分析を詊みたす。 ぀たり コヌドでのそれらの即時のコストのかかる実装に察する改善のモデリングを実行したす。

さらに、特定の圱響たたは小さな摂動に察するシステムのダむナミクスず応答を取埗するこずにより、剛性の非線圢埮分方皋匏のシステムを垞に数倀的に統合するこずができたす。

したがっお、䞀芋無関係な知識の領域の盞乗効果により、吊定できない予枬力を持぀驚くべき結果を埗るこずができたす。

YTの開発者、Grigory Demchenko



Source: https://habr.com/ru/post/J325798/


All Articles