サーバーが電源のドライバーでどのように動作するか

画像の代替テキスト


PSUファームウェアは古くなっています。


HP DL380ファームウェアのバージョンをポーリングしているときにこのような碑文を初めて目にしたとき、私は幾分落胆しました。 ええと、まあ、本当に必要な場合は-ダウンロードしてインストールしてください。 しかし、平凡な電源にはどのようなソフトウェアを使用できますか? 地域の生命維持システムの診断と停電の処理のためにそれが判明しました。 独自のアービターとロジックを備えた電源の自然なクラスターがあります。 カットの下には、そのような「クラスター」の設計と2 x 1400 = 2300Wの理由に関する話があります。


2つの電源-信頼性の2倍? それは電源システムの設定に依存するため、常にではありません。 詳細と話はこちらです。 ストーリーの主題として、次のように中間サーバークラスの機器を選択しました。



つまり、ブレードでもメインフレームでもありません。それらはすべて異なります。 サーバーのフォームファクターは、追加の電源の有無に関係ないことに注意してください。


信頼性または利便性


「予備部品を少量だけ保管できるのに、なぜPSUがいくつあるのか」という質問に対する答えから始めましょう。 フォールトトレランスを考慮しない場合でも、サーバーに冗長性があるシステムは常に役立ちます。 たとえば、サービスの利便性が向上し、ディスクや同じ電源を交換するときにサーバールームで夜を過ごさないようにできます。


たとえば、2番目の電源は次の場合に役立ちます。



2つの電源は、サーバールームを設計する際の柔軟性を高めます。 たとえば、1つのクライアントの動作中の接続スキーム:サーバーでは2つのフェーズで、異なるサーバーの電源に接続されます。 1つのフェーズはUPSに接続され、2番目のフェーズは安定装置を介してのみ機能します。 ただし、この行はジェネレーターから自動スタートで送られます。 停電が発生すると、UPSの電源が切れた場合でも、ディーゼルが起動し、サーバーは稼働し続けます。 これは、クライアントおよび予算オプションの希望に応じて選択されるオプションの1つにすぎません。

合計で、管理者の利便性のためにいくつかのPSUが必要であり、システムの信頼性を高め、 より多くの電力を供給します。


膝理論


2つの電源を備えたシステムの最も単純なバージョンは、異なるユニットからコンピューターの個々のコンポーネントに電力を供給し、一方のコンポーネントがマザーボードを制御して電力を供給するように見えます。 このようなソリューションは、ゲーマーや鉱夫によって実践されています。3枚以上のビデオカードを取り付けるには、1つの電源だけでは不十分だからです。 接続するには、次のアダプターを使用します。


画像の代替テキスト


電源を押すと、アース付きの緑の信号線が閉じ、両方の電源を起動するコマンドが与えられます。


昔、私はSCSIディスクのセットを備えたPentium IIIレベルのコンピューターを持っていたことを覚えています。 通常の電源では不十分で、ハードドライブ用に古いATユニットを個別に接続しました。 ミラクルマシンの起動は次のように行われました。追加の電源ボタンを押してディスクの音が鳴るのを待ってから、主電源をオンにしてダウンロードを開始します。

普及している中国の時代でも、同様の構成を実現するために、Do-It-Yourselfの「Do-It-Yourself」の接続スキームがたくさんあります。


画像の代替テキスト


しかし、産業用サーバーソリューションに戻ります。


電源デバイスのロジックは非常にシンプルです。 ユニットは特別な配電バックプレーンに接続されており、ここには配電ユニットのマイクロコントローラーもあります( サーバーラックの配電器と混同しないでください)。 コントローラは、利用可能なPSUの使用を同時にまたはプライマリバックアップモードで行います。


セットアップと操作ロジック


このような高度な電源サブシステムは、特定のニーズに合わせてカスタマイズできます。 2つの電源を備えたサーバーを使用する場合、いくつかの動作モードが利用可能です。



RAIDと非常によく似ています-フォールトトレラントレベル1および生産的0です。


ほとんどのメーカーでは、管理者が目的のモードを選択できます。 たとえば、このようなHPサーバーでは、BIOSセットアップは次のようになります。


画像の代替テキスト


新しいシステムはiLO経由で構成を使用するため、イメージは少し古くなっていますが、本質を理解するには十分です。


さまざまな設定と低負荷のHP DL360電源のペアの出力を見てみましょう。 これには、コンソールユーティリティhpasmcliを使用します。



電源#1電源#2
現在:はいはい
冗長:はいはい
条件:わかったわかった
ホットプラグ:サポート対象サポート対象
パワー:110ワット95ワット

メーカーはだましませんでした、電源はほぼ同じ電力を供給します。



電源#1電源#2
現在:はいはい
冗長:はいはい
条件:わかったわかった
ホットプラグ:サポート対象サポート対象
パワー:90ワット20ワット

実際、負荷分散モードを使用する場合、ブロックはほぼ同じようにロードされます。 ただし、フォールトトレランスをオンにすると、1つの電源のみが使用され、2番目の電源はスタンバイに転送され、最小限のエネルギーを消費します。


バックアップ電源を接続するときのコールドスタートを回避し、時間を節約し、起動中の電源障害のリスクを最小限に抑えるには、一種の「スリープモード」が必要です。 家庭用電球の場合と同様に、コールドスタートでは、ピーク負荷が回路の要素ベースに形成され、損傷につながる可能性があります。


各メーカーの動作モードの設定は、独自の方法で行われます。 たとえば、2つの電源を持つLenovo(IBM)システムの場合、GUIを介した構成は次のとおりです。


画像の代替テキスト


次の3つの操作モードから選択できます。



IntelやSupermicroなどの汎用サーバーは、常に十分に文書化されているわけではなく、PSUの動作モードの設定に関する未解決の情報はありませんでした。 私たちのエンジニアとフォーラムに頼らなければなりませんでした。 そのようなシステムは通常、負荷分散モードで動作することが判明しました。


同様のプラットフォームと密接に連携しており、他の情報がある場合は、コメントで共有してください。

3つ以上のPSUのシステムでは、さらに興味深いことがあります。


3、4-誰が大きいですか?


RAIDと同様に、より多くのノードがより洗練された使用パターンを開きます。 たとえば、3つのブロックを持つSupermicroサーバーは通常2 + 1の動作モードを使用します。つまり、2つの作業が同時に行われ、3番目のモードは予約されています。


Lenovoの4つのPSUの場合、電源の使用をより柔軟に構成できます。 インターフェイスは、電力インジケータを独自に計算します。


画像の代替テキスト


パフォーマンスと信頼性のバランスの観点から、このような4つのPSUの構成は、「食いしん坊」コンポーネントを使用する場合にのみ正当化されます。 それ以外の場合、電力マージンは冗長であり、利便性と信頼性マージンは、異なる電源を持つ2つの電源によって提供されます。


私の意見では、このようなプラットフォームでは、3番目と4番目のPSU( SupermicroHPの例)の代わりにバックアップバッテリーを置く方がより興味深いです。 UPSの問題を防ぎ、5分間はネットワークに電力を供給せずに稼働時間を延長します。 さらに、このようなモジュールを使用すると、鉄のメンテナンスに対処するのがより便利になります。ケーブルを引き出して、サーバーを静かに別のキャビネットに移動しました。 サーバーのバッテリー寿命は約5分です。


800に1つまたは400に2つ


サーバーモールのエンジニアの経験によれば、障害の点ではハードドライブに次いで電源が2位になっています。 少なくともサーバーの復旧これらのコンポーネントは、設計に電解コンデンサを使用しているため、しばしば変更されます。


ディスクサブシステムの障害に慣れていて、スペアディスクの準備ができている場合、電源システムの交換はスペアパーツの棚ではあまり一般的ではありません。 ある程度は、保証と、クーリエで数日後に故障したPSUの交換品を入手する機会によって状況は保存されますが、マーフィーの法則は割引されるべきではありません。 私の練習では、故障したPSUの交換を待っている間に、残りのPSUが故障した場合がありました。 サーバーに重要なものがなかったのは良いことです。

信頼性を別にすれば、疑問は力のままです。 原則として、それぞれが十分な出力電力を備えた2つの電源装置を同時に使用することをお勧めします。 しかし、予算がそのような自由を許可しない場合、ニーズをより詳細に比較検討し、電力供給源の沈下を考慮する必要があります。 HPのマニュアルに目を向けると、さまざまな構成での電力システムの効率のグラフが表示されます。


画像の代替テキスト


マシンの負荷が低い場合、1つの電源の効率は高くなりますが、サーバーの負荷が高いと状況は変わります。


電源の1つが故障し、残りの電力が十分でない場合はどうなりますか?


多くのベンダーには、障害発生時の消費電力を削減するメカニズムがあります-PowerSafe Gard for Fujitsu、 Throttling for Lenovo。 このようなメカニズムを使用しても状況が必ずしも保存されるとは限らず、生産性の大幅な低下はダウンタイムよりも悪い場合があります。


もう1つ微妙な違いがあります。2番目の電源の負荷が増加し、故障の可能性が高くなります。 少なくとも標準負荷では、ペアからの1つの電源ユニットがサーバー全体を提供する必要があるという事実から進めることをお勧めします。 容量の異なる電源のコストの差はそれほど大きくないため、より生産的なモデルを選択する必要があります。 たとえば、Supermicroのオプションの価格は次のとおりです。



価格はYandex市場から取得されるため、実際にはさらに低くなる可能性があります。 フォールトトレランスを損なうために4,000 Savingを節約することは、小さなサーバーであってもまあまあです。


ファームウェアの最新情報


最新の電源には、内部冷却システム、電圧、電流、内部状態の質量を監視するための一連の診断メカニズムが含まれています。


過熱時の自動シャットダウンに加えて、電源サブシステムのインジケータを集中監視に接続できると便利です。 たとえば、特定の電源の障害を予測したり、不安定な電力供給を特定したりすることができます。 これはすべて、マイクロコントローラによって提供されます。マイクロコントローラの内部ロジックは、メーカーが定期的に新しいアップデートで改善しています。


そして今、短所について


上記の利点をすべて備えた、いくつかの電源を備えたソリューションにはマイナス面があります。



いくつかの電源からの構成で作業するあなた自身の否定的な経験がある場合-コメントで読むことは興味深いでしょう。

結論として、人気のあるベンダーの電力計算機への便利なリンクをいくつか紹介します。



次の新しいサーバーを選択するときに電力を評価するのが面倒な場合、これらのツールは、電源の電力とデータセンター全体のエネルギー消費の両方を計算するのに役立ちます。



Source: https://habr.com/ru/post/J310698/


All Articles