top 、
htop 、
uptime 、
wなどのコマンドの出力を観察すると、ユーザーは
負荷平均線に気付いているはずです。
「標準システム監視ツールの概要」の 説明を拡大して、これらの数値の意味を理解しようとします。 したがって、簡単に言えば、数値は、特定の時間間隔(つまり、それぞれ1分、5分、および15分)で実行キューにあるブロックプロセスの数を反映しています。 プロセスをブロックするという概念は、最近
nginxについて話すとき、通常よくカバーされ
ています。 :)この場合、ブロッキングプロセスとは、リソースが引き続き動作することを期待するプロセスです。 通常、中央処理装置、ディスクI / O、ネットワークI / Oなどのリソースが待機しています。
負荷平均インジケータの高い値は、システムが負荷に対処できないことを示します。 高負荷で実行されているターゲットサーバーについて話している場合は、通常、オペレーティングシステム(ネットワークサブシステム、同時に開くファイルの数を制限するなど)を微調整すると便利です。 高負荷は、ドライブの障害などのハードウェアの問題によっても発生します。
診断のために、
トップ出力によって提供される他の有用なデータを使用します。 文字列
Cpu(s)には、プロセッサ時間の割り当てに関する情報が含まれています。 最初の2つの値は、処理プロセスに対するCPUの作業を直接反映しています。

長く続く高(99-100%)インジケータは、CPUがボトルネックであることを示します。
waパラメータは、単純なI / O関連を示します。

80%を超えると、まったく正常ではないと見なされ、プロセッサが入出力を待機するのに多くの時間を費やすことを明確に示します(通常、これはHDDまたはNICに障害が発生することを意味します)。
ハードウェアに問題がなく、CPUが高速の場合、ソフトウェアに問題がある可能性があります。 問題のあるアプリケーションは、
ps axfuを使用して
キャッチできます。 結果の出力は、プロセスのリストと、必要な情報:プロセッサ消費、メモリ、ステータス、および直接プロセスを識別する情報(PIDとコマンド)を提供します。 プロセス状態といえば。 一般的なプロセスの状態は次の3つです(完全なリストは
psのmanページにあります
-thanks 、
onix74 ):
- S-いわゆる睡眠状態;
- Rは実行状態です。
- Dはスタンバイ状態です。
後者はまさに私たちが探しているものです。
iostat 、
systat (FreeBSD)、
strace 、
iperfを
使用して 、さらにデバッグを行うことができますが、これは別の記事のトピックです。
高い稼働率、低い平均負荷、そしてもちろん幸運! :)