Ping監視
ウェブサービスとは独立して、ネットワーク層でサーバーの稼働状況を確認できます。
なぜHTTPの監視をしているのにpingも必要なのか
HTTP監視はウェブサイトが正しい応答を返しているかを示します。ping監視はマシン自体がそもそも到達可能かを示します。これは異なる問いであり、障害が発生した際にその違いが重要となります。もしウェブアプリケーションがクラッシュしてもサーバー自体が稼働していれば、HTTP監視はダウンになりますがpingは通ります。これにより診断範囲がすぐに絞り込めます。両方がダウンの場合はネットワークやインフラ障害を示します。pingだけがダウンしている場合は、ファイアウォールがpingをブロックし始めただけで、HTTPは利用者にとって依然として問題なく動作している可能性があります。
ping監視は、HTTPを実行していないホスト、例えばデータベースサーバー、メールサーバー、ロードバランサー背後のアプリケーションサーバー、VPNゲートウェイ、内部サービスなど、「このボックスが生きていてアクセス可能かどうか」だけ知りたい場面にも最適なツールです。
なぜTCPベースのpingなのか
クラシックなICMP ping("ping"コマンド)はデスクトップ環境では有効ですが、クラウドからの監視用途には信頼性が低いです。ほとんどの最新ファイアウォールはICMPをブロックまたはレート制限します。特にパブリックネットワークからの場合、ICMPのタイムアウトは「サーバーダウン」か「ファイアウォールがパケットを破棄した」かの区別がつきません。この曖昧さは、アラートツールにとって致命的です。
DiagnoSEO Uptime Monitoring はTCPベースのpingを使用します。これは、既知のポート(まず80番、次に443番)へのTCP接続を5秒間タイムアウトで開きます。SYN/ACKが返ればホスト到達可能です。返らなければ、カーネルからの実際のエラーコード(connection refused, timeout, no route to host)で本当の障害を受け取り、より速くトリアージできます。
記録される内容
各pingは結果(アップ / ダウン)とRTT(ラウンドトリップタイム、ミリ秒単位)を記録します。これはHTTP監視と同じ履歴パイプラインに渡され、直近チェックのスパークライン、24hと30dの稼働率、30日間の稼働熱マップなどを取得できます。ホストがダウンした場合はインシデントが作成され、設定済みのチャネルへ通知が送信されます。
pingモニターのヒント
- 短い間隔を選ぶ:pingはコストが低いため、プランが許せば1〜5分ごとに設定しましょう。低コストですばやい障害検出が可能です。
- ポート監視と組み合わせる:データベース(5432)やメール(25)などがある場合は、そのポート監視も追加しましょう。pingは「ハードウェアが生きている」を意味し、ポート監視は「サービスがリッスンしている」ことを示します。
- RTTを確認する:応答時間は毎回記録されます。RTTの急激な増加は多くの場合、完全な障害の前兆です。しきい値を設定しておけば、重大なインシデントの前に発見できます。
- 確認しきい値を活用する:ネットワークは一時的に揺らぐものです。デフォルトの2回連続の失敗チェックが誤検知アラートを防ぎます。
ダッシュボードでの表示・運用
pingモニターはHTTP、ポート、キーワード、API、ハートビート監視と同じリストに表示されます。また、「infra」「内部」などタグ付け、ステータスでフィルタ、RTTで並び替え、一時停止/再開も他と同様です。アラート通知は(Email, Telegram, Slack, Discord, SMS)経由で送られ、夜間静音・確認しきい値などのルールも共通です。
設定方法
ツールを開き、「モニター追加」をクリック、「Ping (TCP)」タイプを選び、ホスト(例:db.internal.firma.com)を入力、間隔を設定して保存します。次のサイクルから毎分TCP接続が試行され、RTTが記録され、ホストが応答しなくなれば通知されます。
よくあるご質問
-
レイヤー3での到達性確認――ホストがICMPエコーに反応するかどうかをチェックします。ルーター、スイッチ、IoT機器、内部インフラ、HTTPでは動作しないが到達可能であるべき全ての対象に便利です。
-
ほとんどのクラウドプロバイダーはデフォルトでセキュリティグループやファイアウォールでICMPをブロックします。サーバー自体は正常でもping応答がありません。クラウド用途ではHTTPやTCPポートのチェックを推奨します。本当にpingが必要な場合はセキュリティグループで明示的にICMP許可が必要です。
-
pingはICMPを使い(ポートは使いません――レイヤー3の純粋な到達性)、TCPポートチェックは特定ポートへのTCP接続を開き、レイヤー4での通信を確認します。ホストがpingは通るがTCPは失敗(ポートブロック)したり、逆にICMPがブロックでもポートが開いている場合もあります。
-
はい、応答時間(ラウンドトリップ)は毎回のチェックで記録され、時間経過で追跡できます。同じホストでRTTが徐々に20msから200msまで伸びていく場合は、ルーティングや輻輳に問題があることを示します。
-
当社のチェッカーサーバーから到達できるIP(公開IP)であれば可能です。RFC1918(192.168.x.x、10.x.x.x、172.16-31.x.x等)のプライベートアドレスは外部監視では利用できません。内部インフラ用には、同じネットワークにself-hosted heartbeatエージェントを立て、それが当社サーバーにpingします。
UptimeRobot · Pingdom · BetterStack · Oh Dear · Site24x7 · StatusCake · Sentry · Uptrends · Cronitor · New Relic