Giám sát ping
Xác minh máy chủ của bạn hoạt động ở tầng mạng — độc lập với bất kỳ dịch vụ web nào đang chạy bên trên.
Tại sao cần ping khi đã giám sát HTTP
Giám sát HTTP cho biết trang web có phản hồi đúng hay không. Giám sát ping cho biết máy có thể truy cập được hay không. Đây là những câu hỏi khác nhau và sự khác biệt trở nên quan trọng khi có sự cố. Nếu ứng dụng web bị sập nhưng máy chủ vẫn hoạt động, HTTP sẽ hỏng - ping vẫn thành công. Điều này giúp thu hẹp chẩn đoán ngay lập tức. Nếu cả hai đều hỏng - có thể do sự cố mạng hoặc hạ tầng. Nếu chỉ ping hỏng - có thể tường lửa bắt đầu chặn gói tin kiểm tra, còn HTTP vẫn hoạt động cho người dùng.
Giám sát ping cũng là công cụ phù hợp cho các máy chủ không chạy HTTP: máy chủ cơ sở dữ liệu, máy chủ email, máy chủ ứng dụng sau load balancer, gateway VPN, dịch vụ nội bộ - bất cứ nơi nào bạn chỉ đơn giản cần biết "hộp này còn hoạt động và có thể truy cập được không".
Tại sao ping dựa trên TCP
Ping ICMP cổ điển (lệnh "ping") hoạt động tuyệt vời trên máy tính cá nhân, nhưng không tin cậy khi giám sát từ đám mây. Hầu hết các tường lửa hiện đại đều chặn hoặc giới hạn ICMP, đặc biệt từ mạng công cộng, vì vậy timeout ICMP có thể đồng nghĩa với cả "máy chủ bị sập" và "tường lửa đã chặn gói tin". Sự mơ hồ như vậy là thảm họa cho các công cụ cảnh báo.
DiagnoSEO Uptime Monitoring sử dụng ping dựa trên TCP: kiểm tra sẽ mở kết nối TCP đến cổng đã biết (đầu tiên là 80, nếu không thành công thì tới 443) với timeout 5 giây. Nếu nhận được SYN/ACK - host có thể truy cập. Nếu không - bạn sẽ nhận lỗi thực tế cùng mã lỗi từ kernel (connection refused, timeout, no route to host), giúp chuẩn đoán nhanh hơn.
Những gì được ghi lại
Mỗi lần ping sẽ ghi kết quả (up / down) và thời gian RTT tính bằng mili giây. Thông tin này sẽ được đưa vào cùng pipeline lịch sử như các monitor HTTP - bạn sẽ nhận được sparkline các lần kiểm tra gần nhất, phần trăm uptime 24h và 30 ngày, cùng bản đồ nhiệt độ truy cập trong 30 ngày gần nhất. Nếu host bị sập, một sự cố sẽ được mở và thông báo sẽ được gửi tới các kênh đã bật.
Gợi ý cho monitor ping
- Chọn khoảng thời gian ngắn: ping không tốn nhiều tài nguyên, hãy đặt 1-5 phút nếu gói dịch vụ cho phép. Phát hiện nhanh hơn với chi phí thấp.
- Kết hợp với monitor cổng: nếu bạn có database trên 5432 hoặc email trên 25, hãy thêm cả monitor cổng. Ping cho biết "máy còn sống", cổng cho biết "dịch vụ đang lắng nghe".
- Theo dõi RTT: thời gian phản hồi được ghi lại ở mỗi lần kiểm tra. Những cú nhảy RTT bất thường thường báo trước sự cố lớn - hãy đặt ngưỡng để bắt kịp trước khi thành sự cố nghiêm trọng.
- Dùng ngưỡng xác nhận: mạng có thể trục trặc nhất thời. Mặc định 2 lần kiểm tra lỗi liên tiếp để tránh báo động giả.
Làm sao tích hợp vào bảng điều khiển
Các monitor ping xuất hiện bên cạnh monitor HTTP, cổng, keyword, API và heartbeat trên cùng một danh sách. Bạn có thể gắn thẻ ("hạ tầng", "nội bộ"), lọc theo trạng thái, sắp xếp theo RTT và tạm dừng/tiếp tục như bất kỳ monitor nào khác. Cảnh báo cũng gửi qua các kênh như (Email, Telegram, Slack, Discord, SMS) với các quy tắc yên lặng ban đêm và ngưỡng xác nhận giống nhau.
Cấu hình
Mở công cụ, nhấp "Thêm monitor", chọn loại "Ping (TCP)", dán host (ví dụ db.internal.firma.com), đặt khoảng thời gian và lưu lại. Từ chu kỳ tiếp theo, monitor sẽ mỗi phút mở kết nối TCP, ghi lại RTT và cảnh báo khi host ngừng phản hồi.
Câu hỏi thường gặp
-
Kiểm tra khả năng truy cập ở lớp 3 — host có phản hồi ICMP echo không. Hữu ích cho router, switch, thiết bị IoT, hạ tầng nội bộ và bất cứ thứ gì không chạy HTTP nhưng cần phải có mặt trên mạng.
-
Hầu hết các nhà cung cấp cloud mặc định chặn ICMP ở cấp security-group hoặc tường lửa. Server vẫn hoạt động nhưng không trả lời ping. Với workload đám mây, ưu tiên kiểm tra HTTP hoặc cổng TCP. Bạn có thể mở ICMP trong security groups nếu thực sự cần ping.
-
Ping dùng ICMP (không dùng cổng — kiểm tra truy cập lớp-3). Cổng TCP sẽ mở kết nối TCP trên cổng cụ thể — xác nhận kết nối lớp-4. Máy chủ có thể qua ping nhưng thất bại TCP (tường lửa chặn cổng) hoặc ngược lại (ICMP bị chặn, cổng mở).
-
Có — thời gian phản hồi (round-trip) được ghi lại cho mỗi kiểm tra và theo dõi theo thời gian. Hữu ích để phát hiện suy giảm mạng: cùng một host nhưng RTT tăng dần từ 20ms lên 200ms thường là dấu hiệu của vấn đề routing hoặc nghẽn mạng.
-
Chỉ khi IP đó truy cập được từ các máy chủ kiểm tra của chúng tôi – tức là IP công cộng. Các dải IP riêng RFC1918 (192.168.x.x, 10.x.x.x, 172.16-31.x.x) sẽ không hoạt động từ giám sát bên ngoài. Với hạ tầng nội bộ, hãy chạy agent heartbeat self-hosted trong mạng nội bộ để ping ngược lại chúng tôi.
UptimeRobot · Pingdom · BetterStack · Oh Dear · Site24x7 · StatusCake · Sentry · Uptrends · Cronitor · New Relic
Kiểm tra SSL · Hết hạn miền · Theo dõi DNS · Cổng (TCP) · Endpoint · Từ khóa · API · Cron / Heartbeat · Thời gian phản hồi · Backlink · Theo từng khu vực · Giám sát website