
多数の「外部」サーバーの管理には、お客様のデータを保護する責任が伴います。 サーバーへのsshアクセス権を持つユーザーのリストを確実に制御するために、ホストの限られたセットを持つ許可システムを考慮することが決定されました。
問題文にあるもの:
- 400台を超える物理マシン。
- すべてのクライアントサービスは、openvz仮想コンテナーに格納されます(ほとんど)。
- すべてのサーバーへのルートアクセスはsshによって閉じられます。
- 物理サーバーの管理者のみがsudoを介してルート権限にアクセスできます。
- 当社が所有するいくつかのサーバー。その半分は地理的に分散しています。 それらを「アクセスサーバー」と呼びましょう。
行われたこと:
- 最初のステップでは、構成管理システムを使用して、パスワードなしでアクセスサーバーからキーを入力するために、すべての物理sshサーバーにキーを配布しました。 各管理者には独自のキーがあります。
- 2番目のステップは、アクセスサーバーを除くすべてのホストから物理サーバーへのsshアクセスを閉じることです。
もちろん、このようなスキームには例外がありますが、これはすべて個別です。
ここで、このようなソリューションのセキュリティの問題が発生します。アクセスサーバーでアカウントを破ると、すべてのサーバーに無制限にアクセスでき、パスワードなしのキーでアクセスできます。
控えめに言っても、あまり良くありません!
ファイアウォールを介してアクセスサーバーへのsshアクセスを制限し、従業員のIPからのみアクセスを許可するという提案がありました。 いいね しかし、ここに問題があります:私たちには多くの管理者がいて、多くは動的IPを持っています。 はい、旅行中などに緊急に「働く」必要がある場合はどうなりますか?
レポートにとどまることにしました。 つまり、特定のログインが許可されているもののリストにないipで正常に認証されるたびに、このイベントの高いステータスの問題はredmineで私たちに落ち、そして中毒の尋問を使用して何が起こったのかを見つけます。
実装:
現在のssh監査の既成のソリューションを調べましたが、非常に恐ろしいこともそうでないことも、適切なものは見つかりませんでした。
そしていつものように、あなたの自転車、つまりスクリプトを書くことに決めました。 どれ:
- 許可が成功したかどうかsshログを分析します。
- 過去10分間のデータを取得します。
- 対応するリストからユーザー名/ IPペアを比較します
- 成功した場合、何もしません
- 一致しない場合、アラートを送信します。アラートはその後、redmineのタスクになります。
スクリプトはpythonで書かれています。 私は私の人生で2回目のpythonで書いたので、コードに関するコメントは客観的な方法で受け入れられます。 さらに、機能します!
添付のリスト:
List.ipファイルの形式は次のとおりです。
関連するアクション:
- スクリプトをcronに入れて、10分ごとに実行します。
- 深夜にsshログの毎日のローテーションを構成します。
- アクセスサーバー上のキーによる認証を無効にします。
- パロノイド性を高めるために、ユーザー名/ IPリストをギスに保存し、フックを介してアクセスサーバーに分散させることができます。
このスキームの追加(相対)プラス:従業員を解雇する必要がある場合(ただし、これはまだ発生します:()、アクセスサーバー上のセッションを強制終了するだけです。