2つのサーバーからWebアプリケーションのフォールトトレランスを整理するタスクを受け取りました。 Webアプリケーションには、MySQL DBMSの静的ファイルとデータが含まれます。
顧客の主な要件は、Webアプリケーションが常に利用可能であり、5分以内に障害が発生した場合、障害を復元することです。
異なるデータセンターに地理的に分散した2台のサーバーがこの要件を満たしている必要があります。

この問題を解決するために、Debian Squeeze OSを選択しました。 Webアプリケーション開発者はDebianを使用しています。 DNSを介してフォールトトレランスロジックを実行することにしました。 ドメイン名test.ruがあります。 私の2台のサーバーはNSサーバーとして機能します。 すべてのゾーン情報はローカルに保存されます。 プライマリサーバーで障害が発生した場合、DNSは上書きされ、Aレコードはバックアップサーバーを示します。
DNSに加えて、ファイルの同期と双方向に問題がありました。 バックアップサーバーでは、メインのアイドル時間の時点で、情報をアップロードできます。 この問題を解決するには、Unisonパッケージを使用します。
MySQLデータベースを同期するには、標準のMySQLレプリケーション双方向マスターが使用されます。 単方向レプリケーション(「マスタースレーブ」)では、スレーブデータベースへの書き込み時にデータに一貫性がなく、レプリケーションエラーが発生する可能性があります。 双方向レプリケーションの場合、データベースは一貫した状態になります。
システム全体のアービターは自己記述スクリプトになります。これについては以下で説明します。
システムの準備
apache2、mysql-serverパッケージがインストールされたクリーンなDebianシステムがあります。 インターネットは情報に満ちているので、私は彼らのインストールをペイントしません。
メインサーバーはマスターIP = 10.1.0.1、バックアップサーバーはスレーブIP = 10.2.0.2です
ファイル同期
Webアプリケーションファイルは/ site / web /ディレクトリにあります。 両方のサーバーのApacheは、このディレクトリですでに構成されている必要があります。
さらに、ファイルの同期のために、サーバー間でSSHを介してパスワードなしでアクセスする必要があります。このために、キーペアを生成します。
ssh-keygen -t rsa (passphrase ) scp /root/.ssh/id_rsa.pub root@10.2.0.2:/root/.ssh/authorized_keys2
同様に2番目のサーバーでも:
ssh-keygen -t rsa (passphrase ) scp /root/.ssh/id_rsa.pub root@10.1.0.1:/root/.ssh/authorized_keys2
その後、両方のサーバーの/ site / web /ディレクトリのデータが同一であることを確認し、Unisonをインストールする必要があります。
apt-get install unison
次の内容で構成ファイル/root/.unison/web.prfを作成します。
これで、メインサーバーで次のコマンドを使用して同期を開始できます。
unison web
5分ごとに自動同期を行うには、次のスクリプトを使用する必要があります。
このスクリプトをファイル/root/bin/sync.shに保存し、実行する権利を与えます
chmod +x /root/bin/sync.sh
そして、タスクをCRON "crontab -e"に追加します。
*/5 * * * * /root/bin/sync.sh > /dev/null 2>&1
このスクリプトを5分ごとに実行します。
MySQLレプリケーション
レプリケーションには、パスワードsome_passwordを持つMySQLレプリケーションユーザーを使用します。
メインマスターサーバーで、ファイル/etc/mysql/my.cnfを編集します。 次の行を複製セクションに貼り付けます。
server-id = 1 log_bin = /var/log/mysql/mysql-bin.log expire_logs_days = 10 max_binlog_size = 100M binlog_ignore_db = mysql binlog_ignore_db = test master-host = 10.2.0.2
同じファイルでbind-address変数を変更して、どのインターフェイスでもマッスルを使用できるようにします。
bind-address = 0.0.0.0
ルートユーザーでMySQLにアクセスし、レプリケーションユーザーにバックアップスレーブサーバーからサーバーに接続する権利を与えます。
mysql -u root -p Enter password: root, >grant replication slave on *.* to 'replication'@'10.2.0.2' identified by 'some_password'; >flush privileges; >quit; /etc/init.d/mysql restart
2番目のスレーブサーバーに渡します。 ファイル/etc/mysql/my.cnfを編集します。 次の行を複製セクションに貼り付けます。
server-id = 2 log_bin = /var/log/mysql/mysql-bin.log expire_logs_days = 10 max_binlog_size = 100M binlog_ignore_db = mysql binlog_ignore_db = test master-host = 10.1.0.1
同じファイルでbind-address変数を変更して、どのインターフェイスでもマッスルを使用できるようにします。
bind-address = 0.0.0.0
ルートとしてMySQLにアクセスし、レプリケーションユーザーにメインマスターサーバーからサーバーに接続する権利を与えます。
mysql -u root -p Enter password: root, >grant replication slave on *.* to 'replication'@'10.1.0.1' identified by 'some_password'; >flush privileges; >quit; /etc/init.d/mysql restart
両方のサーバーで、レプリケーションプロセスが実行されていることを確認します。 これを行うには、次を実行します。
表示される情報では、次の3つのパラメーターに関心があります。
Slave_IO_State: Waiting for master to send event Slave_IO_Running: Yes Slave_SQL_Running: Yes
両方のサーバーで指定されたパラメーターが上記に対応する場合、すべてが正常であり、レプリケーションが構成されています。 そうでない場合は、ログを見てください。
DNSサーバー
test.ruドメインゾーンを管理するには、ドメイン設定でサーバーに委任する必要があります。 グローバルネットワーク上のサーバーに、メインサーバーのドメイン名ns.master.my.comとバックアップのドメイン名ns.slave.my.comが既にあるようにします。
DNSゾーンをサーバーに委任した後のみ、管理できます。
両方のサーバーで、bind9パッケージをインストールします。
apt-get install bind9
/etc/bind/named.conf configに行を追加して、ゾーンを示します。
echo 'include "/etc/bind/my-zones.conf";' >> /etc/bind/named.conf
そして、次の内容で/etc/bind/my-zones.conf構成ファイルを作成します。
zone "test.ru" { type master; file "/etc/bind/db.test.ru"; };
最初のメインマスターサーバーで、次の内容のデータベースを/etc/bind/db.test.ruファイルに作成します。
$ORIGIN test.ru. $TTL 10 @ IN SOA ns.master.my.com. admin.my.com. ( 2 ; Serial 10 ; Refresh 10 ; Retry 10 ; Expire 10 ) ; Negative Cache TTL IN NS ns.master.my.com. IN NS ns.slave.my.com. ; @ IN A 10.1.0.1
ns.master.my.comはこのサーバーのドメイン名です(ドメインmy.comは架空のものです)
ここでのキーはAレコードで、更新時間は10秒です。
2番目のバックアップスレーブサーバーで、次の内容のデータベースを/etc/bind/db.test.ruファイルに作成します。
$ORIGIN test.ru. $TTL 10 @ IN SOA ns.slave.my.com. admin.my.com. ( 2 ; Serial 10 ; Refresh 10 ; Retry 10 ; Expire 10 ) ; Negative Cache TTL IN NS ns.master.my.com. IN NS ns.slave.my.com. ; @ IN A 10.1.0.1
SOAレコードの主なものとの違い。
次に、両方のサーバーでバインドをオーバーロードします
/etc/init.d/bind9 restart
そして、外部コンピューターからtest.ruドメインのAレコードを確認しようとしています。
たとえば、nslookup test.ruを使用します。 アドレス10.1.0.1。を指定する必要があります。
何かが間違っている場合は、ログを見てください。
仲裁
最も興味深いのは、仲裁です。これにより、これらすべてが解決され、DNSゾーンが管理されます。
基礎として、SSH、DNS、HTTP、およびMySQLサービスの仕事を引き受けました。 この場合、重要なのはHTTPおよびMySQLサービスです。なぜなら、 これらのサービスの少なくとも1つがメインサーバーで機能しない場合、すべての要求をバックアップサーバーに送信する必要があり、さらに管理者に電子メールで問題を通知する必要があります。
サービスのパフォーマンスを確認するには、TELNETを使用するスクリプトを使用してポートの可用性を確認し、値を特別な状態ファイルに設定します。
最初に、メインマスターサーバーがポーリングされ、結果がファイルに記録されます。次に、バックアップスレーブサーバーがポーリングされ、結果も記録されます。 次に、メインサーバー上の重要なサービスのステータスがチェックされます。問題が発生した場合、バックアップサーバーのステータスがチェックされ、ステータスに応じてDNSゾーンが書き換えられます。 すべてのロジックを説明するのではなく、スクリプトで説明します。
まず、両方のサーバーに特別なディレクトリを作成する必要があります。
mkdir /var/lock/sync/
すべてのスクリプトは/ root / bin /に保存されます
最初のスクリプト/root/bin/master.shは、メインマスターサーバーでDNS、SSH、HTTP、MySQLサービスをチェックします。
2番目のスクリプト/root/bin/slave.shは、バックアップスレーブサーバーのサービスをチェックします。
2つの変数$ HOSTと$ SEMAFORを除いて、これらの2つのファイルは同一です。
3番目のファイル/root/bin/compare.shは、サーバー上のサービスのステータスを比較し、DNSゾーンを上書きするために使用されます。
最後に、これらすべてのスクリプトを1つのファイル/root/bin/dnswrite.shに収集します
#!/bin/bash # /root/bin/master.sh # SLAVE /root/bin/slave.sh # /root/bin/compare.sh
これらのスクリプトを実行する権限を追加します
chmod +x /root/bin/*.sh
そして、crontab -eが毎分開始されるようにタスクをCRONに追加します。
*/1 * * * * /root/bin/dnswrite.sh /dev/null 2>&1
すべて準備完了です。
これで、完全に自動化されたフォールトトレラントWebアプリケーションのセットができました!
私はコメントを聞いて、コメントを受け入れてうれしいです。