キャパシティ管理も別の課題です

ITの頭脳が収益、ユーザー、CTR、処理中のドキュメント、融資申し込み、支店の数、その他の心地よいCSVの増加に直面しているのは素晴らしいことです。 これらはすべてビジネスドライバーと呼ばれ、適切な状況では、サービスの下にあるITインフラストラクチャの負荷と相関します。 適切なキャパシティプランニングは、ブラックフライデーの壮大な失敗(あなたが本当に真っ黒にならないように;)と他のすべての日の予算からあなたを守ります。 今日は、容量管理プロセス自体についてではなく、問題の技術面についてお話します。 どのレポートで傾向を推定し、相関行列を作成できるかを説明します。 私たちが得た経験を簡単に説明し、コメントまたは個人的なメッセージですべての質問をしてみましょう。 行こう!
cost_risk_balance



最初の評価方法は時間分析です。 それ自体、いくつかのタイプがあります。

1.パフォーマンス対時間分析(PTA)-選択した時間間隔の1つ以上のパフォーマンスメトリックの値を表示します。 また、異なるシステムに属する複数のメトリックを異なるスケールで視覚化することもできます。

このタイプの分析の主なタスクは次のとおりです。



pta_analyse

CPU、RAM、およびディスクの負荷の3つのメトリックの視覚化からの一時的な分析の例

2.負荷対時間分析(LTA-負荷対時間分析)-選択した時間間隔での1つ以上のビジネスメトリックの動作を示します。 一例は、一定期間の取引数です。

LTAの主なタスク:



pta_analyse_business_metrics

ビジネス指標の一時的な分析の例

3.構成分析(CA-構成分析)-エンドサーバーなどの構成値の履歴を表示します。 選択した期間。

pta_analyse_infrastructure

ハードウェア構成の一時的な分析の例

2番目の評価方法は相関分析です。

データを分析するとき、相関係数に従ってビジネスドライバーと技術リソースの間にリンクが作成されます。 相関係数は、2つのメトリック間の相互接続の程度を示す獣であり、-100%(完全な逆関係)から+ 100%(完全な直接関係)の値を取ることができます。 値0(およびそれに近い)は、メトリックのペア間に関係がないことを示します。

レポートを作成するとき、相関分析を使用して相関マップとビジネスメトリックマップを作成します。 ビジネスメトリックのマップは、使用されるビジネスメトリックとリソースの依存関係を表示するレポートを作成する際の重要なコンポーネントです。 たとえば、次の図は、ビジネスメトリック(Webクライアントからの要求の数とWebクライアントに送信されるメッセージの数)の、アプリケーションサーバーとアプリケーションが実行されているDBMSのリソースへの依存を示しています。

depending_metrics

メトリックの依存関係の例

この情報に基づいて、ビジネスメトリックマップは、ビジネス負荷に関する後続のパフォーマンス分析のために構成されます。

business_metrics_map

ビジネス指標マップの例

metrics_correlation

パフォーマンスパラメータ値とビジネスメトリックの相関の計算

その結果、ビジネスメトリックが特定のサーバーに特定のリソースをロードする度合いが明らかになります。

resource_load

ビジネスメトリックのリソース使用率の負担

取得したデータにより、割り当てられたリソースに対するビジネスメトリックの依存性を視覚的に反映し、飽和点などを決定できます。

PLA

CPU負荷に対するビジネスシステム内のリクエストの総数の依存性と飽和点

また、相関分析を使用して、システム内のメトリックのペアを比較します。 これらは、ビジネスメトリックまたはパフォーマンスメトリックのいずれかです。

LLA

2つのビジネス指標(サイトへのアクセス数と表示されたページ数の比較)の例

comparison

パフォーマンスメトリックの比較例

そして最後に、3番目のタイプの評価がトレンドになっています。

将来の行動を予測する(傾向を計算する)モデルを使用して、履歴データに基づいて1つまたは複数のパフォーマンスインジケーター(またはビジネスメトリック)の将来の値と変化のダイナミクスを決定します。

次の図は、このメカニズムの可能な使用のモデルを示しています。 システムは、発信通信チャネルのダウンロードに関する履歴データをダウンロードしました。 このパラメーターには、しきい値が設定されます-可能な最大値からチャネル負荷の70%。 外挿メカニズムを使用して、パラメータ成長ダイナミクスの傾向が自動的に構築され、飽和時間が(しきい値に達する)決定されます-1暦月未満。

trend_calculation

トレンド計算を使用して飽和時間を決定する例

このようなツールは、「what-if」分析にも使用されます。 たとえば、以下は合計ディスク容量の増加を計算するシナリオの変形です。 グラフには、割り当てられたボリュームとディスクスペースの増加ポイント(3月中旬)が緑色で表示されます。 青色は、ディスク容量の使用状況のグラフです。 したがって、構築されたトレンドと「what-if」分析(ディスクの追加)は、飽和点が年末まで到達しないことを示しています。

what_if

合計ディスク容量の増加を計算するためのシナリオのバリアント

What-if分析は、ビジネスメトリックの変化する値に応じてITインフラストラクチャのパフォーマンスを計算するためにも使用されます。

次の図は、システムへのエントリの最大可能インジケータと送信された注文数の計算例を示しています。 表の最初の部分には、ビジネスメトリック(訪問数、受注数)とその現在の値(1時間あたり30,000件の呼び出しと1,000件の注文)が表示されます。 [ターゲット]列には、チェックされたパラメーターの値(120,000および5,000)が表示されます。 その結果、インフラストラクチャの最大負荷(それぞれ61,500と2,400)を計算でき、障害点-CPUパフォーマンス(下の表の赤い点)も確認できます。

point_of_failure

システム内のエントリの最大可能インジケータと送信された注文数の計算例

したがって、インフラストラクチャの最大容量を決定し、ボトルネックを特定し、近代化に関するタイムリーな決定を下すことができます。

コメントで質問してください。 そして、タスクがもう少し思慮深いアプローチを必要とする場合、 私たちのコンサルティング-それは、5月の休日のように-あなたを常に喜ばせます。

投稿の最後に、いくつかの投票があります。数十秒を費やすことができれば素晴らしいでしょう。 よろしくお願いします!

記事の著者: Anton Kasimov 、制御システムのアーキテクト、Jet Infosystems社。

Source: https://habr.com/ru/post/J327282/


All Articles