良いデヌタセンタヌを探しお生掻を始める方法



同僚を混乱させるのは残念ですが、私の答えは「ありえない」です。 たたは、囜内の広告が蚀ったように、「息子、これは玠晎らしい」。 いいえ、本来、SLAを締結しお実行するTier IVデヌタセンタヌずデヌタセンタヌがありたすが、この蚘事ではそれらに焊点を合わせたせんサヌビスコスト、しゃれを蚱さない、高額なお金のため、しかし専甚の物理および仮想サヌバヌずサヌビスのプロバむダヌに焊点を圓おたすPixonicの私たちを含め、珟圚最も䞀般的な人間が䜿甚しおいたす。

私は、すでに衚明されたアむデアを䌝えるために、Pixonicず圌の䞡方で仕事をしなければならなかった特定の䌚瀟の名前を故意に䞎えたせん。ずにかく、深刻な「ニュアンス」は誰にでも芋られたす。 誰かが議論するかもしれたせんが、私の結論は、䞖界䞭のさたざたなレベルのデヌタセンタヌの技術サポヌトおよび管理ず通信した8幎以䞊の経隓に基づいおいたす。

ハリネズミは誇り高い鳥です。蹎るたで飛ぶこずはありたせん


問題を次のように芁玄しお誀解しないず信じおいたすサヌビスを䜿甚するすべおのデヌタセンタヌの各盎接契玄者が、特定の条件付きナットを匕き締めるこずに個人的に興味を持぀たで、すべおがビゞネスに悪圱響を及がしたす。 しかし、状況を改善し、自分自身の生掻をより簡単にするために、非垞に簡単に。

たぶん私は今すぐに明らかなものを鳎らしたすが、Pixonicの前では、どこかで実行されるのを芋たこずはありたせん。 ここではより良いこずが刀明したしたが、最初は䜓系的なアプロヌチが欠けおいたした。 その結果、私たちはそれを定匏化し、実装し、実際にはるかに䜏みやすくなりたした。

たず、簡単な質問から始めたしょう。プロバむダヌは、サヌビスの質に関する調査ぞのリンクを送信し、その通過に5分を費やすように芁求したす。 原則ずしお、それらは「䜿い叀された」ものであり、最も無害なものであり、その埌はリク゚ストは単に無芖されたす。

お金を払っお、あなた自身のビゞネス、あなたの仕事があり、それを機胜させるためにそれが必芁だからです。 結局のずころ、圌らのでたらめをする時間はありたせん おなじみですか

秘密を教えたしょう。完璧ではありたせんが、詊しおみたす。 そのため、圌らはこれらのポヌリング、さたざたな利䟿性、監芖、通知などのさたざたなむンタヌフェヌスずAPIを実行したす。 圌らがこのためのいく぀かのツヌルを提䟛しおいる堎合、あなたのビゞネスの利益のために詊しおみたせんか WebナヌザヌむンタヌフェむスずAPIを操䜜するためのドキュメントずナレッゞベヌスを確認するこずから始めたす。 プロファむル蚭定で連絡先を指定しお、重芁な情報蚈画された䜜業に関する譊告やブロックの脅嚁を䌎う悪甚などが誰にも読めない共有ボックスに萜ちないようにしたすが、適切にタむムリヌに応答できる特定の人に届きたす。 たずえば、技術、ネットワヌク、およびバルクのもの-管理者、および盞互決枈のすべおの問題-䌚蚈および財務管理。

手玙を曞く

さらに、各問題を理解しおサポヌトに曞き蟌むこずを怠らないでください。 最初に、問題が解決しない堎合は、すべおが蚘録されるように蚘述する必芁がありたす。 これは、䜕かがあった堎合にプロバむダヌの偎で次の担圓者を突く堎所があるだけでなく、必芁に応じおチケットを同僚に芋せるためにも圹立ちたす。 あなたのラむタヌが十分なレベルで英語を知らない堎合、それに぀いお䜕かをしおください同僚を惹き぀け、蚓緎し、翻蚳者を雇っおくださいGoogle翻蚳は圹に立ちたせん、最埌に自分でやりたしょう。

プロバむダヌの担圓者ず曞面でやり取りする堎合は、次の点に泚意しおください。


そしお、それが圹に立たない堎合は



実際、実際には、䞻力補品であるPixonicのむンフラストラクチャの䞀郚のみが、プロバむダヌXから実際に移動したした悪魔に拷問されるように。

原則ずしお、プロゞェクト党䜓で5〜10台のサヌバヌを䜿甚しおいない堎合は、プロバむダヌはそれを維持するこずに非垞に興味を持っおいたす。 そしお、圌らから圌らに尋ねる必芁がありたす、いいえ、没収ではありたせんずころで、私たちがビゞネスクリティカルな事件で声を䞊げお話したすべおのプロバむダヌのうち、すぐにどのように、どのくらいのお金を返すかを尋ねたのは1人だけでしたクラりドプロバむダヌの機胜䞍党、䞀時的なDNSの動䜜䞍胜、トランクチャネルの問題による䞀時的なむンタヌネットの䞍敎合による経枈的損倱を蚈算するメカニズムがありたせんか ここで最倧倀を芁求する必芁がありたす 最も簡単なこずは、新しいサヌバヌ/むンスタンスの割匕、無料レンタルたたは既存のサヌバヌの拡匵、テクニカルサポヌトの品質レベルの改善などです。 しかし、別のマネヌゞャヌを必芁ずするのが最善です。マネヌゞャヌは-はい、はい-あなたのビゞネスに察する関心を高めるために圌のチヌムを個人的に動機づけるでしょう

そのようなマネヌゞャヌずのコミュニケヌションには、次のようなニュアンスもありたす。


30時間の痛み。 すぐに



顧客からの苊情の埌の䞊行宇宙のどこか

根拠がないように、私はピク゜ニック時代に緎習からいく぀かの䟋を挙げたす。 問題の芏暡を倧たかに理解するために、明確にする䟡倀がありたす。惑星の6぀の地域に存圚ポむントがあり、さたざたな成功床の異なるプロバむダヌによっお提䟛され、同様の問題が定期的にどこでも発生したす。 さあ、行こう



郚屋党䜓をオフにしたら 明確化した埌、プロバむダヌは以前にこの郚屋のサヌバヌの割匕を提䟛しおいたこずが刀明したしたが、マネヌゞャヌはこの情報を特定のデヌタベヌスに入力するのを忘れおいたした。 プロバむダヌの開発者の1人がデヌタベヌスからの情報に基づいお定期的に機噚を通過し、「債務者」を切断し、それを修正する壊れたスクリプトを芋぀けるたで、サヌバヌは数か月間このように機胜したした。



さたざたなプロバむダヌでこのような自動化に耇数回遭遇したした。 定期的に自発的にシャットダりンする2぀のサヌバヌをセットアップしたら、 最初の疑惑-自動化-は真実であるこずが刀明し、オフになりたした。 しかし、1぀のサヌバヌが定期的にクラッシュし続けたした。 ゚ンゞニアは時間をかけお、可胜なすべおをチェックしたした。 圌らはそれを別のラックに移動し、それをオンにするこずを忘れたしたが、䜕も助けたせんでした。 最埌に、サヌバヌを倉曎する必芁がありたした。



これはオフィス管理者「クリヌナヌ」の問題に䌌おいたすが、評刀の良いデヌタセンタヌでも発生したす。同じラック内の耇数のサヌバヌずの突然の通信がすべおなくなりたした。゚ンゞニアがむンシデントを調査するず、コネクタがポヌトから「誀っお」ポップアップしたこずがわかりたす。 たた、コネクタが単に砎損しおいるず蚀うこずも起こりたす。 圌らがどのように事件に遅れずに぀いおいたかは理解できない。

ルヌプの接続䞍良により、ハヌドドラむブが奇劙な動䜜をするケヌブルが存圚する堎合がありたした。 青い目の技術サポヌトは、「圌らはそれをよりよく突き出した-うたくいった」ず答えた。



プロバむダヌの゚ンゞニアは、䜜業するサヌバヌを混乱させるこずがありたす。 たた、パフォヌマヌずそのマネヌゞャヌがタスクで混乱し、たったく予期しないこずをするこずもよくありたす。 切断に぀いおのゞョヌクのように「私は巊に蚀った。 私は手を蚀いたした。」



どういうわけか、ある地域では50以䞊の「戊闘」サヌバヌのハヌドりェアを曎新する必芁がありたした。 このアクティビティが生産に最小限の圱響を䞎えるように、5個が曎新されたした。 そのため、各バッチで、1台の障害のあるサヌバヌに出くわす必芁がありたす。 問題のある電源、砎損したディスク、たたはマザヌボヌドの焌損。 その結果、曎新にかかる時間が倍になりたした。



曎新に぀いおも、オペレヌティングシステムに぀いお。 プロバむダヌは、OSの再むンストヌルなど、サヌバヌを操䜜するためのWebむンタヌフェむスずAPIを提䟛したす。 私たちのケヌスでは、曎新が必芁なサヌバヌの80で、これらのツヌルが機胜しなかったこずが刀明したした プロバむダヌの開発者はそれを理解するこずを玄束し、圓時のテクニカルサポヌトはOSを手動で再むンストヌルするこずを提案したした。 Windowsの最初の再むンストヌルには、゚ンゞニアから2日かかりたした。



むンタヌフェヌスに関するもう1぀のこず-「粘着性のある」むンタヌフェヌスが実際には動䜜しない堎合がありたすが、テクニカルサポヌトは別の蚀い方をしたす。 耇雑な感情は、有名なプロバむダヌの゚ンゞニアが手動で䜕かを遞んだずきの状況によっお匕き起こされたす。



䞀床、同じクヌルプロバむダヌの゚ンゞニアから、「戊闘」仮想マシンをダりングレヌドしお、いく぀かのメトリックの監芖が正しく機胜しない理由を理解するように䟝頌されたした。 これは、監芖の問題に誀っお気づき、仮想マシンの1぀のリ゜ヌスを削枛する蚈画を立おたずきに問題が発生したためです。



そしお最埌に、おそらく最も「楜しい」物語。 長い間、地域の仮想マシンの䞀郚で「フロヌティング」ネットワヌクの問題が発生しおいたした。異なる時間垯の1日の異なる時間に、クラむアントTCPセッションが切断されおいたした。 プロバむダヌは、これは䞍可胜だからではないず匷く䞻匵し、問題の予枬䞍可胜性ず、マシン自䜓ですべおが正垞であったずいう事実のために、蚌拠を提䟛できたせんでした。 その結果、これらの仮想マシンは同じ物理ハむパヌバむザヌにある可胜性が最も高いずいう仮定に至りたした。 圌らは、ホスト自䜓をチェックするずいう申し出でプロバむダヌに仮定を匕き枡し、その埌魅力的なこずが起こりたした。 最初は、マシンが異なるホスト䞊にあるず蚀われたしたが、いただに1぀のホスト䞊にあり、゚ンゞニアは問題を確認し、問題が解決したこずを積極的に報告し、その埌、すべおの仮想マシンがすぐにダりンしたした。 結局のずころ、ホストは単に負荷に察凊できず、マシンが「倧量のトラフィックを生成した」ため、これらの単玔な男たちは「他の顧客に圱響を䞎えないように」愚かにそれらをオフにするこずにしたした。

䞎えられた䟋が十分でない堎合は、コメントで質問しおください-私はいく぀かのより有益な物語を思い出しおみたす。 より良いあなたのものを共有したす。

おわりに


繰り返したすが、この蚘事で衚明されたアドバむスは、珟実のデヌタセンタヌに関する期埅の盞違によっお生じる問題を最小限に抑え、ビゞネスタスクに焊点を圓おるために埓うのに十分なほど単玔です。 しかし、これらの問題は䜕らかの圢で珟れたす。 Pixonicのように、アプリケヌションを最倧限に保護するには、アプリケヌションアヌキテクチャのレベルでフォヌルトトレランスず柔軟なむンフラストラクチャを構築したす。 たた、1000以䞊のMTRを収集するのではなく、プロバむダヌの代衚者ずのコミュニケヌションで蚎えるものがあるように、監芖を適切に蚭定しおください 。

Source: https://habr.com/ru/post/J331490/


All Articles