Zabbixには、すぐに使用できる多くの可能性がありますが、これでは十分ではない場合があります。この場合、サードパーティのスクリプトを使用してイベントを処理することができます(スクリプトに問題を報告)。 あとでスクリプト自体に戻りますが、説明にトリガーを追加する理由と理由を明確にするために、主なアイデアのみを説明します。 スクリプトはメッセージの本文を解析し、行MYparsBLOCKを検索します:funcname:見つかった場合はfuncname()を実行し、見つからない場合はアラートを送信します。 これをトリガーの説明に追加するのが最も合理的です。そのため、Actions-Event source –Triggers-operationsでは、デフォルトメッセージに{TRIGGER.DESCRIPTION}を追加する必要があります。
料理テンプレート
自動登録ルールを使用して新しいホストに添付される監視テンプレートを作成する必要があります。 (アクション->イベントソース->自動登録->テンプレートへのリンク:Win_monitor)私は、Windows用の標準的なzabbixテンプレートと、青からどこかからのAPC Smart UPS Monitoringを基本として、それらから不要なものをすべて取り出して追加しました私が必要です。
アイテムエージェントのping
agent.ping
平均ディスクキュー長
perf_counter [\ 234(_Total)\ 1400]
平均ディスク読み取りキューの長さ
perf_counter [\ 234(_Total)\ 1402]
平均ディスク書き込みキューの長さ
perf_counter [\ 234(_Total)\ 1404]
CPUモデル
wmi.get [ROOT \ cimv2、Win32_Processorから名前を選択]
CPU使用率
perf_counter [\ 238(_Total)\ 6]
APC Smart UPSモニタリング:ドライバーキャプション
wmi.get [ROOT \ cimv2、Win32_PNPEntity WHERE PNPDeviceID LIKE '%VID_051D&PID_0002%'またはService LIKE '%hidbatt%'からのキャプションを選択]
Cの空きディスク容量:
vfs.fs.size [c :、無料]
Cの空きディスク容量:(パーセント)
vfs.fs.size [c:、pfree]
空きメモリ
vm.memory.size [無料]
実行中のzabbix_agentdのホスト名
agent.hostname
メインボードモデル
wmi.get [ROOT \ cimv2、Win32_BaseBoardから製品を選択]
システム情報
system.uname
システム稼働時間
system.uptime
Cの合計ディスク容量:
vfs.fs.size [c :、合計]
総メモリ
vm.memory.size [合計]
Cの使用済みディスク領域:
vfs.fs.size [c :、使用済み]
APC Smart UPSモニタリング:バッテリー寿命
battery.runtime
APC Smart UPS監視:バッテリー交換日
battery.mfr.date
APC Smart UPSモニタリング:バッテリー充電
バッテリー充電
APCスマートUPS監視:UPSモデル
ups.model
APC Smart UPSモニタリング:負荷
ups.load
APC Smart UPSモニタリング:電圧(入力)
入力電圧
APC Smart UPSモニタリング:電圧(出力)
出力電圧
APC Smart UPS監視:UPSステータス
ups.status
APC Smart UPS監視:ビープステータス
ups.beeper.status
APC Smart UPS監視:バッテリー温度
バッテリー温度
トリガーボリュームCの空きディスク容量が1GB未満です:{HOST.NAME}
{Win_monitor:vfs.fs.size [c :, free] .last(0)} <1073741824
{HOST.NAME}の空きメモリが不足しています
{Win_monitor:vm.memory.size [free] .avg(30m)} <10000000
APCスマートUPS監視:robot_ UPSデータが{HOST.NAME}に届かない
{Win_monitor:ups.status.str(Error)} = 1および{Win_monitor:wmi.get [ROOT \ cimv2、Win32_PNPEntity WHERE PNPDeviceID LIKE '%VID_051D&PID_0002%'またはService LIKE '%hidbatt%']からキャプションを選択します。 )}> 1
{HOST.NAME}のZabbixエージェントは7日間到達不能です
{Win_monitor:agent.ping.nodata(7d)} = 1
APC Smart UPS監視:{HOST.NAME}でバッテリーが充電されません
{Win_monitor:battery.charge.max(#120)} <90
APCスマートUPS監視:{HOST.NAME}でビープ音がオフ
{Win_monitor:ups.beeper.status.str(無効)} = 1
APC Smart UPS監視:{HOST.NAME}のバッテリー寿命が短い
{Win_monitor:battery.runtime.last(0)} <5および{Win_monitor:ups.model.str(Smart)} = 1
UPSを監視するというアイデアの実装は、私たちが望むほどスムーズではないことが判明したことはすでに書いています。 エラーが絶えず発生するため、devconユーティリティを使用してドライバーを再起動すると役立つため、nutp関数を使用したブロックをトリガーに追加します(説明中)。 さて、監視に死んだホストは必要ありません。そのため、トリガー「{HOST.NAME}のZabbixエージェントは7日間到達できません」で、remove_offline関数を追加して、zabbixからホストを削除します。
MYparsBLOCK:nutpt: HIP:{HOST.DNS} MYparsBLOCK:remove_offline: HID:{HOST.NAME}
低レベルの発見
スマートに関しては、通常のアイテムとトリガーは機能しません。マシンごとに異なる数のスマートを使用できるためです。 zabbixでは、低レベルのディスカバリルールを使用して取得したオブジェクトのリスト用に作成されるアイテムとトリガープロトタイプを作成でき
ます 。詳細については、こちらを参照してください。 ルールを機能させるには、起動時に特別なJSON形式でハードのリストを生成するスクリプト/アプリケーションを作成する必要があります。 最初にPowerShellでスクリプトを作成しましたが、PowerShell自体が非常に長い時間初期化されていたため、一部のマシンでは30秒で定期的にスクリプトを実行する時間がありませんでした。 私はpowershellをあきらめて、c#でexeアプリケーションを作成しなければなりませんでした(わかりませんが、スクリプトを書き直すのに十分簡単なように見えました)。 smartctlを使用するアプリケーションはhddリストを受け取り、重複を(シリアルで)削除し、必要な形式で表示します。
hddscan.cs using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.Diagnostics; using System.Text.RegularExpressions; namespace hdd_scan { class Program { static string[] smartctl(string arg) { Process p = new Process(); p.StartInfo.FileName = "C:\\Program Files\\Zabbix\\extra\\smart\\smartctl.exe"; p.StartInfo.Arguments = arg; p.StartInfo.UseShellExecute = false; p.StartInfo.RedirectStandardOutput = true; p.Start(); string output = p.StandardOutput.ReadToEnd(); string[] list = output.Split('\n'); p.WaitForExit(); return list; } static void Main(string[] args) { try { string[] hddlist = smartctl("--scan"); Dictionary<string, string> psarr = new Dictionary<string, string>(); string pattern = @"^(?<1>\/[\w]+)\/(?<xer>[\S]+)\s"; foreach (string hdd in hddlist) { var match = Regex.Match(hdd, pattern); if (match.Success) { string shdd = match.Groups["xer"].Value; string[] tmp = smartctl("-a " + shdd); foreach (string line in tmp) { if (line.Contains("Serial") == true) { string[] serials = Regex.Split(line, @"^Serial\sNumber\:\s+"); if (serials.Length < 2) continue; string serial = serials[1]; if (!psarr.ContainsValue(serial)) { psarr.Add(shdd, serial); } } } } }
はい、一部のマシンではスマートを無効にすることができるため、関数firstrunをもう1つ追加し、自動登録ルールのメッセージに配置しますアクション->イベントソース->自動登録スクリプトを介して...
MYparsBLOCK:firstrun: HIP:{HOST.IP}
テンプレートで、discoveyルール-smart.discoveryを作成します。
アイテムのプロトタイプsmart _ {#HDDNAME} _CRC_Error_Count
スマート[{#HDDNAME}、crc]
smart _ {#HDDNAME} _Current_Pending_Sector
スマート[{#HDDNAME}、保留]
smart _ {#HDDNAME} _Health_Status
スマート[{#HDDNAME}、ヘルス]
smart _ {#HDDNAME} _Model
スマート[{#HDDNAME}、モデル]
smart _ {#HDDNAME} _Reallocated_Sector_Ct
スマート[{#HDDNAME}、realloc]
smart _ {#HDDNAME} _Temperature
スマート[{#HDDNAME}、temp]
プロトタイプをトリガーしますHDD:{#HDDNAME} {HOST.NAME}のCurrent_Pending_Sectorは5より大きい
{Win_monitor:smart [{#HDDNAME}、pend] .last()}> 5
HDD:{#HDDNAME} {HOST.NAME}のReallocated_Sector_Ctは5より大きい
{Win_monitor:smart [{#HDDNAME}、realloc] .last()}> 5
HDD:{#HDDNAME} {HOST.NAME}のハードドライブ温度が55度を超えています
{Win_monitor:smart [{#HDDNAME}、temp] .last()}> 55
HDD:{#HDDNAME} {HOST.NAME}のCRC_Error_Countの成長を修正
{Win_monitor:smart [{#HDDNAME}、crc] .change()}> 0
HDD:Current_Pending_Sectorは、{#HDDNAME} {HOST.NAME}の増加を記録しました
{Win_monitor:smart [{#HDDNAME}、pend] .change()}> 0および{Win_monitor:smart [{#HDDNAME}、pend] .last()}> 6
HDD:{#HDDNAME} {HOST.NAME}でReallocated_Sector_Ctの増加を記録
{Win_monitor:smart [{#HDDNAME}、realloc] .change()}> 0および{Win_monitor:smart [{#HDDNAME}、realloc] .last()}> 6
プロトタイプの説明では、hddsmart関数を追加します。smartctlはsda、sdbなどを使用するため、HDDモデルをトリガーメッセージの本文に追加し、話しているハードドライブの種類を明確にします。
MYparsBLOCK:hddsmart: HIP:{HOST.DNS}:KKEY:smart[{
エージェントはほとんどのパラメーターを理解しないため、すべてのUserParameterをクライアント構成に登録する必要があります。
ユーザーパラメータUserParameter=battery.charge,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.charge
UserParameter=battery.charge.low,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.charge.low
UserParameter=battery.charge.warning,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.charge.warning
UserParameter=battery.mfr.date,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.mfr.date
UserParameter=battery.runtime,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.runtime
UserParameter=battery.runtime.low,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.runtime.low
UserParameter=battery.temperature,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.temperature
UserParameter=battery.type,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.type
UserParameter=battery.voltage,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.voltage
UserParameter=battery.voltage.nominal,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost battery.voltage.nominal
UserParameter=input.sensitivity,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost input.sensitivity
UserParameter=input.transfer.high,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost input.transfer.high
UserParameter=input.transfer.low,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost input.transfer.low
UserParameter=input.voltage,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost input.voltage
UserParameter=output.current,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost output.current
UserParameter=output.frequency,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost output.frequency
UserParameter=output.voltage,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost output.voltage
UserParameter=output.voltage.nominal,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost output.voltage.nominal
UserParameter=ups.beeper.status,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.beeper.status
UserParameter=ups.delay.shutdown,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.delay.shutdown
UserParameter=ups.delay.start,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.delay.start
UserParameter=ups.firmware,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.firmware
UserParameter=ups.firmware.aux,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.firmware.aux
UserParameter=ups.load,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.load
UserParameter=ups.mfr,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.mfr
UserParameter=ups.mfr.date,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.mfr.date
UserParameter=ups.model,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.model
UserParameter=ups.productid,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.productid
UserParameter=ups.serial,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.serial
UserParameter=ups.status,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.status
UserParameter=ups.test.result,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.test.result
UserParameter=ups.timer.reboot,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.timer.reboot
UserParameter=ups.timer.shutdown,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.timer.shutdown
UserParameter=ups.timer.start,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.timer.start
UserParameter=ups.vendorid,"c:\Program Files (x86)\NUT\bin\upsc.exe" primary@localhost ups.timer.vendorid
UserParameter=smart[*],"C:\Program Files\Zabbix\cmd\smart.cmd" "$1" $2
UserParameter=smart.discovery, "C:\Program Files\Zabbix\cmd\hdd_scan.exe"
smart.cmd @echo off rem use smart.cmd <disk> < parameter> smart.cmd sda health cd "C:\Program Files\Zabbix\cmd" if %2==health ("C:\Program Files\Zabbix\extra\smart\smartctl.exe" -H %1 | grep result | awk "{print $6}") if %2==model ("C:\Program Files\Zabbix\extra\smart\smartctl.exe" -i %1 | grep "Device Model" | awk -F"Device Model:" "{print $2}") if %2==realloc ("C:\Program Files\Zabbix\extra\smart\smartctl.exe" --attributes %1 | grep Reallocated_S | awk "{print $10}") if %2==crc ("C:\Program Files\Zabbix\extra\smart\smartctl.exe" --attributes %1 | grep CRC | awk "{print $10}") if %2==pend ("C:\Program Files\Zabbix\extra\smart\smartctl.exe" --attributes %1 | grep Pend | awk "{print $10}") if %2==temp ("C:\Program Files\Zabbix\extra\smart\smartctl.exe" --attributes %1 | grep Temperature_Celsius | awk "{print $10}")
警告スクリプト
実際にスクリプト自体は、文字を送信して機能を実行します。
複数の受信者がいる場合、関数は数回実行されることに注意してください。 一部の場合、これは関連性があり(たとえば、HDDモデル)、何らかの理由で有害になる場合があるため、アクションをセットアップする際にこれを考慮する
必要が
あります。
非アクティブなホストを削除するスクリプト
スクリプトを機能させるには、マシンを削除する権限を持つアカウントが必要です。 ここではパスワードがクリアテキストで保存されているため、別のアカウントでクラウンでスクリプトを実行します。
DNS名でエージェントを接続する
デフォルトでは、zabbixがIP経由でエージェントに接続するようにエージェントが登録されます。 これは私には合わないので、修正するスクリプトを作成し、同時にルックアップの問題を報告します。 私はpyzabbixの例からスクリプトを基礎として使用し、それを少しやり直しました。
追記
»すべてのスクリプト、テンプレート、およびその他の必要なファイルは
githubに投稿されます。
»
Zabbixを使用して、Microsoft ADのクライアントPCを監視します。 パート1-自動インストール