テラスケールOCPソリューション

Open Compute Project(OCP)とは何ですか?
ロシアでは、これについてかなり多くのことが知られています。主に、OCPを使用したFacebookの数十億の節約に関する広告宣伝です。

公式には、 Open Compute ProjectはFacebookベースのコミュニティであり、既存のオプションをほとんど考慮せずにデータセンターに最適なインフラストラクチャを作成することを目標としています。

実際、Facebookは長い間、データセンターに最適なオプションを考案しようとしてきました。理由の夢は、トリプル(トリプルラック、その1つは途切れることのないもの)のようなモンスターを生み出しました。 アイデアの長さは短かったが、ある日、誰かが素晴らしいアイデアを思いついた-コミュニティを作り、熱狂的なファンを集めてアイデアを投げかけた。

結果が非常に良かったことに注目する価値があります。




OCPの目標:
  1. MTBFを増やします。
    ボード上の「余分な」要素の拒否により、動作時間が35%増加しました。
  2. ラック密度を増やします。
    21インチへの移行により、各サーバーの機能を維持しながら、より多くのサーバーに対応できます。


    より広いラック-よりフィット

  3. メンテナンスを簡素化および高速化します。


  4. 寒い廊下からの作業に最適化する。


    行間で実行を停止
  5. エネルギー効率を改善します。


    35度の外部温度で
    同じ負荷と環境条件でのエネルギー消費を11%削減。


どうしたの?
その結果、 Software-Defined Datacenterの完全なラインが完成しました。


必要なものすべて

リモートコントロールシステムは忘れられていません。 OCP RMC(ラック管理コントローラー)は、サーバーと電源の状態を監視し、Web、SMASH CLIまたはSNMPを介して制御を行います。


ラックコントローラー

機能:
  1. リモート電源管理。
  2. ラックとサーバーの消費量を監視します。
  3. ラックおよびノー​​ドの電力制限の設定。
  4. BPおよびサーバーのステータスの監視。
  5. ホットスワップをサポートします。
  6. LDAPを介した認証。


サポートされているプロトコル:
  1. IPMI / RMCP +
  2. SMASH CLI
  3. SNMP
  4. HTTP / HTTPS
  5. NTP、SMTP、Syslog


スクリーンショット:


イベントログ


ノード構成


これがノード構成の設定方法です。
A.消費制限のオン/オフ(Y / N)
B. ME IPアドレス
C. MEユーザー名
D. MEパスワード

FacebookはIntel Management Engineの機能に依存しており、IPMI / KVM over IPを使用しないこと、それらが冗長であることを考慮してください。 故障が発生した場合、リモートコントロールを介してブートプロセスを監視しようとせずに、サーバー全体が変更されます。 この場合、統合されたフル機能のサービスプロセッサと仮想メディアを含むIPMI / KVM over IPのすべての喜びを備えたドーターボード用の10G SFP +オプションがあります。

ラインナップ

一般的なアイデアから提案されたモデルに移行する時が来ました。


スタンド



サーバー

ラインはミニマリズムに基づいて設計されており、本当に必要なものだけがあります。 メインネットワークはドーター(メザニン)ボードの形で作られており、オプションがあります
10G、InfiniBand、FC。



OCP2U4Nプラットフォームは2OU(Open Unit)フォームファクターで作成され、4台のサーバーに対応しています。 各サーバーに4つのホットスワップ可能なドライブと1つのPCI-E、または2つのドライブと2つのPCI-Eスロットと、高密度コンピューティングリソース、ディスクスペース、拡張カード(フラッシュアクセラレータなど)用のOCP mezz。 デフォルトのネットワークインターフェイスは、2つの10G SFP +ポートとフル機能のBMCプロセッサを備えたOCP Mezzドーターボードです。


より近いビュー

すべてのサーバーに共通のホットスワップファンが使用されます。



Web 2.0からコンピューティングまで、さまざまなタスク用のユニバーサルサーバー。 電源の集中化とボード上の不要な要素の欠如により、MTBFは従来のラックマウントシステムに比べて58%増加します。 2つの拡張スロット、OCP mezz、およびハードドライブのスペースが全体像を完成させます。 デフォルトのネットワークインターフェイスは、2つの10G SFP +ポートとフル機能のBMCプロセッサを備えたOCP Mezzドーターボードです。



タスクを計算するためのOCP1U3Nプラットフォームは、可能な限り実用的です。 16個のメモリスロット、1個のPCI-Eスロット、InfiniBandまたは40Gイーサネット用のOCP mezz、1個のハードドライブスペース、および管理を含むいくつかのネットワークインターフェイス。 空冷(プロセッサあたり115W)とスイッチを備えたラックあたり90ノード-すばらしい結果!

マイクロサーバー? 誰がマイクロサーバーに言及しましたか?



そして彼らも。 2OU形式のIntel AtomプロセッサC2000シリーズに基づく42サーバー、それぞれに2つの40Gアップリンクを持つIntel FM5224マトリックスに基づくOpenFlowスイッチングをサポートする2つのスイッチ。 サーバーあたり約4ギガビットの着信帯域幅により、分散アプリケーションの動作が保証されます。 すべてのコンポーネントは、簡単に展開および保守できるようにホットスワップ可能です。



SHD

特別なストレージはなく、ディスクシェルフ上のソフトウェア定義ストレージのみ。 誰もハードウェアRAIDコントローラーのインストールを禁止していませんが。



2OU形式のキチンクラを備えたディスクシェルフは、28個のホットスワップ可能な3.5インチディスクを収容します。キチンカは2層のディスク配置になっています。ディスクの2列目を修理するためにバスケットを前に出すと、所定の位置に残っているケーブルに苦痛はありません。



2OU形式の別のディスクシェルフは、30個のホットスワップ可能な3.5インチディスクを収容します。それぞれ15個のスピンドルと2個のSASエクスパンダを備えた2個のディスクパレットは、追加のツールなしですべてホットパレットに交換されます。



前の製品と同様に、エキスパンダーの代わりに、Intel Atom C2000に基づく2台のサーバー(15台のディスクに1台)がインストールされます。 各サーバーには、ネットワークと外部SASポートへの10G SFP +インターフェイスがあり、スペースを拡張できます。 コールドデータに適しています。



ネットワークインフラ

スイッチは完全に標準的なサイズで使用されます。 すでに気づいたように
モデルの説明から、メインネットワークのギガビットは原則として使用されず、最小値は10Gです。 Facebook自体は40G以上を狙っていますが、これまでのところ移行価格では許可されていません。

Software Defined Datacenter戦略のもう1つの重要なトレンドは、Software Defined Network(SDN)への移行です。 SDNへの移行は、ネットワークの展開を根本的に加速し、運用コストを削減し、独自の技術ですべてのネットワークメーカーをひどく台無しにするものと想定されています。

ところで、前回の記事では、SDNの理想的なスイッチと、それを無料で入手する方法について説明しました:)
Intel ONSオープンプラットフォームに基づくソフトウェア定義ネットワーク(SDN)


スイッチの内面図

合計

OCPは、一見したところ、幅広い聴衆には珍しいように見えます。 一見したところ、すべてがはるかに興味深いものになっています。 このソリューションは、大規模なインターネット企業だけでなく、大規模な内部IT機能を持つ企業にも適しています。

責任において:


アセット内:


(近い将来)ラック以上を必要とするソリューションを検討している場合、OCPへの切り替えは非常に興味深いオプションになります。 独自のソリューションは、特定の非常に限られたインフラストラクチャにバインドします。

さて、製品ラインでOpen Compute基づくソリューションを紹介しました。

Source: https://habr.com/ru/post/J213257/


All Articles