HostiServer
2026-06-30 12:54
Blackbox monitoring v roce 2026: UptimeRobot, Gatus, Blackbox Exporter a kdy který zvolit
Externí monitoring dostupnosti serveru: jak se o problému dozvědět dřív než uživatel
Standardní postup pro seriózní produkci: na serveru běží agent (Prometheus node_exporter, Zabbix agent, Netdata, Datadog), který sbírá metriky CPU, RAM, disku, sítě. Vše se loguje, jsou tam pěkné dashboardy, nastavené alerty. Zdálo by se, plná kontrola.
Až do okamžiku, kdy OS zamrzne, síťový stack selže, nebo server chytne kernel panic. Agent mlčí, protože mlčí celý server. Dashboardy ukazují poslední stav před pádem. Alerty žádné. Uživatel, který obnovuje vaši hlavní stránku a vidí 408 Request Timeout (nebo rovnou connection refused), se o problému dozví rychleji než vy.
To je klasické slepé místo whitebox monitoringu: uvnitř toho vidí hodně, ale nevidí nic, když „uvnitř" není koho se zeptat. Externí monitoring (blackbox) tuto díru uzavírá z opačné strany, kontroluje dostupnost serveru zvenčí, nezávisle na jeho stavu.
ℹ️ Kontext série článků: v našem materiálu „Jak nastavit logování a monitoring serveru" je detailně rozebrána whitebox část: sběr metrik zevnitř, log aggregation, Prometheus + Grafana, ELK Stack. Aktuální článek je o druhé polovině skládačky: nezávislé kontrole zvenčí, bez které je jakýkoli monitoring neúplný.
1. Blackbox vs whitebox — dva úhly pohledu
Whitebox monitoring vidí server „zevnitř": ví o procesech, metrikách jádra, diskovém I/O, síťových spojeních, logách aplikací. Je hluboký, přesný, umožňuje nejen konstatovat problém, ale i pochopit jeho příčinu.
Blackbox monitoring vidí server tak, jak ho vidí uživatel: otevírá se stránka, odpovídá API, je validní SSL certifikát, jak dlouho trvá TCP handshake. Je povrchový, o příčinách nic neříká, ale má jednu unikátní vlastnost: funguje i tehdy, když whitebox mlčí.
| Parametr | Whitebox (zevnitř) | Blackbox (zvenčí) |
|---|---|---|
| Co vidí | CPU, RAM, disk, procesy, logy | Dostupnost endpointu, response time, SSL, DNS |
| Hloubka dat | Vysoká: až ke konkrétnímu procesu | Povrchová: „funguje / nefunguje" |
| Závislost na serveru | Úplná: umřel server, umřely metriky | Žádná: monitoring je nezávislý |
| Vidí síťové problémy mezi uživatelem a serverem | Ne | Ano |
| Odhaluje příčinu problému | Ano | Jen symptom |
Závěr je jasný: tyto dva přístupy se navzájem nenahrazují, ale doplňují. Whitebox říká „proč něco nefunguje". Blackbox říká „nefunguje". Každý sám o sobě ponechává slepá místa. Dohromady pokrývají většinu reálných scénářů výpadku.
2. Co přesně kontrolovat zvenčí
Než začneme mluvit o nástrojích, je potřeba rozumět sadě základních kontrol, ze kterých se skládá jakýkoli externí monitoring.
HTTP/HTTPS
Základní kontrola pro webové služby. Monitorovací agent udělá GET požadavek na váš endpoint a dívá se na:
- HTTP kód finální odpovědi (normální je 200; před ním mohou být 3xx redirecty, to není problém. Ale 4xx nebo 5xx jako konečný kód — nebo v řetězci po 3xx — je výpadek)
- Response time (zpomaluje ještě před úplným selháním, dává varování)
- Přítomnost klíčového slova v odpovědi (například útržku textu vaší hlavní stránky, aby se vyloučil případ „vrací něco jiného")
- Validitu HTTP hlaviček (například redirect chains, cache-control)
ℹ️ HTTP/3 (QUIC) je samostatné téma: v roce 2026 jde významná část provozu přes HTTP/3 nad UDP portem 443. Klasické blackbox kontroly posílají požadavek nad TCP (HTTP/1.1 nebo HTTP/2), takže nevidí, když se rozbije právě QUIC. Mobilní klienti při tom přejdou do fallbacku na TCP a dostanou stovky milisekund zpoždění na každém spojení. Pokud servírujete HTTP/3, stojí za to samostatně kontrolovat dostupnost UDP portu nebo mít monitoring, který podporuje HTTP/3 (Blackbox Exporter od Prometheu takovou podporu přidal v roce 2024, mnoho moderních SaaS platforem monitoruje QUIC out of the box).
TCP port
Pro nestandardní služby: SSH (22), SMTP (25, 465, 587), IMAP (143, 993), databáze (5432, 3306, 27017), vlastní API na netypických portech. Agent zkusí otevřít TCP spojení a dívá se, zda server odpoví SYN-ACK.
ICMP (ping)
Nejjednodušší kontrola: „je host živý na síťové úrovni". Užitečná jako rychlý indikátor, ale omezená: mnoho poskytovatelů a CDN blokuje ICMP ve výchozím nastavení, takže false positive „ping neprošel = server spadl" je typická chyba začátečníků.
SSL certifikát
Samostatná, podceňovaná kontrola. Monitorovací agent se připojí na port 443, získá certifikát a dívá se na dobu platnosti. Chcete se dozvědět o vypršení certifikátu 30 dní předem, ne v okamžiku, kdy uživatelé vidí strašlivá varování prohlížeče. V roce 2026 je to obzvlášť aktuální: doby platnosti certifikátů se dál zkracují (CA/Browser Forum odhlasovalo postupné snížení na 47 dní do roku 2029), takže ruční kontrola přestává fungovat.
DNS
Kontrola korektního DNS resolvingu pro vaši doménu z různých lokací. Odhaluje situace, kdy váš DNS poskytovatel má problém v konkrétním regionu a vy o tom nevíte, protože ve vašem regionu vše funguje.
ℹ️ Interval kontrol: pro většinu scénářů je optimum 1-5 minut. 30sekundové kontroly vytvářejí zbytečný šum a load, ale dávají smysl pro kritické e-commerce ve špičkových hodinách. 10+ minut je už příliš zřídka — o výpadku se dozvíte později než klienti.
3. Nástroje a přístupy
Trh externího monitoringu je velký a fragmentovaný. Všechna řešení lze rozdělit do tří kategorií: SaaS, self-hosted nebo hybrid. Každá má své výhody a své scénáře použití.
3.1 SaaS: rychlý start bez vlastní infrastruktury
SaaS služby přebírají veškerou infrastrukturní práci: jen se registrujete, zadáte URL ke kontrole, nastavíte alertovací kanály. Probe pointy mají v desítkách zemí, což automaticky dává globální obraz dostupnosti.
| Služba | Bezplatný tier | Silné stránky |
|---|---|---|
| UptimeRobot | 50 monitorů, 5min interval | Nejjednodušší nastavení, časem prověřený standard od roku 2010 |
| Better Stack (dříve Better Uptime) | 10 monitorů, 3min interval | Moderní UI, dobrá integrace s incident managementem a status pages |
| StatusCake | 10 monitorů, 5min interval | Britská služba, dobré pro GDPR citlivé firmy |
| Freshping | Jen trial | Integrace s Freshworks stackem, ale bezplatný tier zavřeli v roce 2024 |
Kdy volit SaaS: nemáte samostatného inženýra na self-hosted řešení; chcete rychle nastavit monitoring za 15 minut; váš projekt je malý nebo střední a bezplatný tier stačí; potřebujete kontrolu z reálně globálních lokací (Jižní Amerika, Asie, Oceánie), které je těžké emulovat vlastní infrastrukturou.
Na co si dát pozor: v bezplatných tierech je interval kontrol 3-5 minut, takže o výpadku se dozvíte se zpožděním až 5 minut. Placené tiery (od $7/měs) dávají 30sekundové kontroly. Také počítejte s tím, že sdílíte data o své infrastruktuře s třetí stranou — pro některé regulovaně citlivé obory to může být problém.
3.2 Self-hosted: Prometheus Blackbox Exporter
Pokud už máte nasazený Prometheus pro whitebox monitoring, Blackbox Exporter je přirozené rozšíření. Je to samostatný proces, který provádí HTTP/TCP/ICMP/DNS kontroly a vystavuje výsledky v Prometheus formátu.
Základní konfigurace blackbox.yml:
modules:
http_2xx:
prober: http
timeout: 5s
http:
method: GET
preferred_ip_protocol: "ip4"
valid_status_codes: [200, 301, 302]
fail_if_body_not_matches_regexp:
- "Welcome to Example"
tcp_connect:
prober: tcp
timeout: 5s
icmp_check:
prober: icmp
timeout: 5s
A odpovídající sekce v Prometheu, která scrapuje tento exporter pro konkrétní URL:
scrape_configs:
- job_name: 'blackbox_http'
metrics_path: /probe
params:
module: [http_2xx]
static_configs:
- targets:
- https://example.com
- https://api.example.com/health
relabel_configs:
- source_labels: [__address__]
target_label: __param_target
- source_labels: [__param_target]
target_label: instance
- target_label: __address__
replacement: blackbox-exporter:9115
Dále alerting přes Alertmanager na metriky probe_success (0 = spadl) a probe_ssl_earliest_cert_expiry (čas do vypršení SSL). Vizualizace přes Grafanu s hotovými dashboardy pro Blackbox Exporter (je jich hodně na grafana.com/dashboards).
Kdy volit: už máte Prometheus stack, máte kompetence na jeho údržbu, chcete jednotný alertovací systém pro whitebox i blackbox.
3.3 Self-hosted: Gatus — lehká YAML alternativa
Gatus je mladší a jednodušší varianta pro ty, kdo nechtějí nasazovat plný Prometheus stack kvůli externímu monitoringu. Jeden Go binárník, konfig v YAML, vestavěné webové rozhraní se status page, alerting přes Slack/Telegram/Discord/PagerDuty/email out of the box.
Konfig config.yaml pro typický monitoring:
endpoints:
- name: main-website
url: "https://example.com"
interval: 60s
conditions:
- "[STATUS] == 200"
- "[RESPONSE_TIME] < 1000"
- "[CERTIFICATE_EXPIRATION] > 720h"
alerts:
- type: telegram
failure-threshold: 3
success-threshold: 2
- name: api-health
url: "https://api.example.com/health"
interval: 30s
conditions:
- "[STATUS] == 200"
- "[BODY].status == up"
alerting:
telegram:
token: "${TELEGRAM_TOKEN}"
id: "${TELEGRAM_CHAT_ID}"
To je vše. Spouští se jedním docker run nebo jako systemd služba na VPS, spotřebuje 30-50 MB RAM, dává veřejnou status page pro klienty. V roce 2026 se Gatus stal jedním z nejpopulárnějších open-source řešení právě díky své jednoduchosti.
Kdy volit: nepotřebujete Prometheus, chcete maximálně jednoduchý systém s malým overheadem, zajímá vás veřejná status page pro klienty.
3.4 Hybrid: self-hosted + SaaS pro kritické endpointy
Nejrozumnější přístup pro seriózní produkci. Logika je taková: hlavní masu kontrol děláte self-hosted (levné, kontrolované, dává vám všechna data), a nejkritičtější endpointy se duplikují přes SaaS (fallback pro případ, kdy vaše monitorovací infrastruktura sama není dostupná).
Co se obvykle přesune na SaaS v hybridní schéma:
- Veřejná hlavní stránka: to, co klienti vidí jako první
- Login/auth endpoint: bez něj klienti nemohou dovnitř, i když se stránka otevírá
- Payment page: nejdražší výpadek, tady stojí za to platit za 30sekundové kontroly
- Public API health endpoint: pokud máte veřejné API s SLA
Zbylých 50-200 endpointů běží na self-hosted infrastruktuře, s vlastními dashboardy a plnou kontrolou nad daty.
3.5 Srovnání čtyř přístupů
| Přístup | Cena | Spolehlivost | Kontrola dat | Složitost |
|---|---|---|---|---|
| SaaS (UptimeRobot, Better Stack) | $0-50/měs | Vysoká (garantuje vendor) | Nízká — u třetí strany | Minimální |
| Self-hosted Prometheus + Blackbox | Cena VPS + čas inženýra | Záleží na vašem DevOps | Plná | Vysoká |
| Self-hosted Gatus | Cena jednoho VPS | Záleží na vašem DevOps | Plná | Střední |
| Hybrid (self-hosted + SaaS) | $10-30/měs + VPS | Nejvyšší | Částečná | Záleží na základu |
Univerzální odpověď neexistuje: pro malý projekt je lepší SaaS, pro střední Gatus, pro velký s vlastní infrastrukturou a DevOps týmem sedí hybrid s Prometheem jako základem.
4. Kde fyzicky umístit monitorovacího agenta
Tuto část při nastavování monitoringu často přeskakují, ale právě ona určuje, jak bude monitoring užitečný v okamžiku reálného výpadku.
4.1 Ne na tomtéž serveru, který se monitoruje
Zřejmé, ale porušované pravidlo: monitorovací agent nemá být na serveru, který kontroluje. Pokud u vás aplikace i monitoring běží na jednom VPS, v okamžiku pádu tohoto VPS se nedozvíte nic: monitoring umřel spolu se serverem. To je klasická chyba, kterou dělají i zkušení admini, když „šetří".
4.2 Poskytovatel v jednom datacentru
Pokud je celý váš stack (bojový server, zálohy, monitoring) u jednoho poskytovatele v jednom DC, váš monitoring má slepé místo o velikosti tohoto DC. Pokud u poskytovatele nastane problém se sítí, napájením, chlazením, spadne vám současně server i monitoring — a nikdo vám to neřekne.
Řešení: umístěte monitorovacího agenta na VPS u jiného poskytovatele nebo alespoň v jiném geografickém regionu. Může to být nejlevnější VPS za $3-5/měs, jeho jediným úkolem je periodicky pingat váš bojový server a alertovat, pokud něco není v pořádku. Malé dodatečné riziko se vyplatí v jediném případě, kdy někdy vypálí.
4.3 Poskytovatel v několika DC
Pokud váš poskytovatel má několik datacenter a pronajímáte si servery ve více z nich, situace je zajímavější. Monitorovací agenty lze (a měli byste) umístit v každém DC, aby pokrývaly nejen dostupnost jednotlivých serverů, ale i konektivitu mezi DC. Pak v případě problému uvidíte nejen „server X nedostupný", ale „server X nedostupný z DC Y, ale dostupný z DC Z", což hned ukazuje na povahu problému.
Detaily topologie závisí na konkrétní infrastruktuře. Pokud máte dvě DC, stačí dva probe nody. Pokud čtyři, stojí za to pokrýt každé.
4.4 SaaS monitoring jako poslední záchrana
I s nejdokonalejší vlastní infrastrukturou zůstává scénář, ve kterém je celá najednou nedostupná (katastrofa u poskytovatele, BGP problém celého regionu, nebo prostě masivní výpadek vašeho hlavního DNS poskytovatele). V takovém případě funguje jen SaaS monitoring z externí infrastruktury.
Proto i v plně self-hosted nasazení stojí za to mít alespoň jeden bezplatný UptimeRobot monitoring s email/Telegram alertem, který vypálí jen v případě úplného blackoutu. Jeden free-tier účet stojí nulu, nastavuje se za 5 minut a jednou vás zachrání ze situace, kdy tři hodiny nevíte, že vám vůbec nic nefunguje.
5. Alerting: kanály, prahy, false positives
Nastavit kontroly je jen půl práce. Druhá půle: abyste se o výpadku dozvěděli právě tehdy, kdy je to potřeba, a nedozvídali se tehdy, kdy to potřeba není. Špatný alerting vytváří alertovou únavu, kvůli které se reálné incidenty ztrácejí v proudu false positives.
Kanály doručování
- Email: pomalý (můžete si ho hodiny nevšimnout), ale archiv. Hodí se pro nekritické varování typu „SSL vyprší za 30 dní".
- Telegram / Slack: rychlý, s možností reakcí od kolegů. Standard pro pracovní dobu.
- SMS / telefonní hovor: pro noční incidenty. Placené, ale často jediný způsob, jak spolehlivě „probudit" dozorujícího.
- PagerDuty / Opsgenie: escalation policy, rotace dozorujících, integrace se vším. Pro týmy od 5+ inženýrů.
Pravidlo „tří po sobě"
Nejjednodušší způsob, jak snížit false positives: alert vypálí jen po N po sobě neúspěšných kontrolách. Typická hodnota je 3 po sobě jdoucí selhání s intervalem 1 minuta. O reálném výpadku se dozvíte 3-4 minuty po jeho začátku, ale nedostáváte alerty o náhodných síťových škytnutích trvajících 30 sekund.
Prahy „varování" a „alert"
Ne všechny problémy jsou stejně závažné. Užitečné je mít dvě úrovně:
- Warning: response time vzrostl z 200ms na 1000ms, SSL vyprší za 30 dní, 1-2 po sobě neúspěšné kontroly. Telegram notifikace, bez nočního budíku.
- Critical: 3+ po sobě neúspěšné kontroly, response time >5 sekund, SSL vyprší za 7 dní. Telegram + email + SMS v nočním čase.
Escalation pro dlouhotrvající incidenty
Pokud alert nedostal acknowledgement do 15 minut, eskalace na dalšího dozorujícího nebo team leada. To je základní hygiena pro týmy s noční podporou. Pokud jedna notifikace dozorujícího neprobudila, druhá za 15 minut to udělá s větší pravděpodobností.
⚠️ Nejčastější chyba alertingu: jednoúrovňové alerty na vše. Když „response time >300ms" a „server nedostupný 5 minut" přicházejí jako stejný typ notifikace, za měsíc budete ignorovat obě. Rozdělení na warning a critical, s různými kanály a časy doručování, není overkill, ale nutnost.
6. Minimální produkční schéma
Pokud nemáte čas nebo chuť budovat ideální systém, tady je minimum, pod které se nevyplatí klesat:
Povinné
- Alespoň jeden externí monitorovací agent z jiné lokace (ne u téhož poskytovatele, kde hostuje hlavní služba)
- Kontrola HTTP dostupnosti hlavní stránky a jednoho kritického API endpointu
- Kontrola SSL certifikátu s alertem 30 dní před vypršením
- Alerting alespoň přes dva kanály (Telegram + email)
- Pravidlo „3 po sobě selhání" před alertem (tam, kde se to nastavuje), abyste nereagovali na jednotlivé škytnutí
Vhodné
- 2-3 probe lokace v různých geografiích pro odhalení regionálních problémů
- Dvouúrovňový alerting (warning + critical) s různými kanály doručování
- Veřejná status page pro klienty (Gatus to dělá out of the box)
- Integrace monitoringu s incident managementem (PagerDuty, Opsgenie, nebo alespoň shared inbox)
- Pravidelný review alertů: které vypalovaly často, které nevypaly, kdy měly
Typické chyby
- Probe na tomtéž hostu. První věc, kterou je třeba opravit. Přeneste monitoring pryč z produkčního serveru.
- Příliš agresivní prahy. Alert na 200ms zpoždění bude tlouct celý den a nic nevyřeší.
- Absence escalation. Pokud dozorující neodpověděl, nikdo se to nedozví.
- Jediný kanál doručování. Pokud Telegram spadne spolu s vaším ISP, alert neuvidíte.
- Alerty bez runbooku. Alert „web nedostupný" bez pokynů, co s tím dělat, je půl užitku z monitoringu pryč.
7. Shrnutí
Externí monitoring není alternativou k internímu, ale jeho povinným doplňkem. Whitebox metriky dávají hloubku a pomáhají pochopit příčinu, blackbox kontroly zaručují, že se o výpadku dozvíte nezávisle na stavu serveru. Bez jedné z těchto polovin má váš monitoring slepé místo.
Co si z tohoto článku odnést:
- Probe nemá žít na tomtéž serveru, který se monitoruje. Pokud žije, v okamžiku skutečného výpadku alerty nebudou.
- Interval kontrol 1-5 minut je optimum pro většinu scénářů. 30 sekund dává smysl jen pro kritické e-commerce, 10+ minut je příliš zřídka.
- Pravidlo „3 po sobě selhání před alertem" zabíjí většinu false positives a nepropouští reálné incidenty.
- Dvouúrovňový alerting (warning + critical s různými kanály) je hygiena, ne overkill.
- SSL kontrola s prahem 30 dní je nejlevnější a nejužitečnější věc, která vás jednou zachrání před strašlivými varováními prohlížeče u klientů.
Další úroveň nezávislosti na OS, ke které stojí za to jít po nastavení externího monitoringu, je out-of-band management přes IPMI, iDRAC nebo iLO. To jsou hardwarová rozhraní na základní desce, která fungují nezávisle na hlavním OS: umožňují vidět konzoli i tehdy, když server „umřel", restartovat ho, vzdáleně připojovat ISO obrazy. Téma je velké a zaslouží si samostatný materiál.
🚀 Infrastruktura pro monitoring od Hostiserver
Externí monitoring vyžaduje samostatnou infrastrukturu — samostatný VPS v jiném regionu, případně několik. Hostiserver poskytuje právě takové servery: levné KVM VPS pro probe nody a plnohodnotné dedikované servery pro hlavní bojový stack.
💻 Cloud (VPS) Hosting
- Od $19.95/měs, KVM izolace, vyhrazené vCPU a RAM
- Připravené OS: Ubuntu 24.04, Debian 12, Rocky Linux 9 z krabice
- Samostatné lokace, ideální pro umístění probe nodů mimo hlavní DC
- API přístup pro automatizaci nasazování monitoringu přes Terraform
- 24/7 DevOps podpora: inženýři pomohou s nastavením Prometheu, Gatusu, Grafany
🖥️ Dedikované servery
- Od $90/měs, fyzický server s plnou hardwarovou kontrolou
- Samostatná DC pro distribuovanou infrastrukturu
- Out-of-band přístup přes IPMI/iDRAC/iLO pro plnou nezávislost na OS
- SLA 99,9 % uptime se zárukou ve smlouvě
💬 Nejste si jisti, která varianta je pro vás?
💬 Napište nám a se vším pomůžeme!
Časté dotazy
- Kolik monitorovacích lokací je reálně potřeba pro typický firemní web?
Pro typický firemní web s publikem v jedné zemi: 2-3 lokace, z nichž alespoň jedna se nachází ve vašem cílovém regionu (aby viděla reálné zpoždění pro vaše klienty) a alespoň jedna v jiném regionu (pro odhalení regionálních síťových problémů). Pro globální e-commerce nebo SaaS: 5-10 lokací na různých kontinentech. Víc už je jen marketingové vychloubání typu „230 probe pointů", v reálném provozu je rozdíl mezi 10 a 200 pointy nepostřehnutelný.
- Vyplatí se monitorovat z různých internetových poskytovatelů?
Ano, obzvlášť pokud je vaše publikum regionálně koncentrované. Velcí ISP občas mají problémy s routováním, které se dotýkají jen jejich klientů. Pokud všechny vaše monitorovací pointy sedí v síti jednoho cloudového poskytovatele (AWS, Hetzner, OVH), uvidíte „u nás všechno dobré", zatímco skuteční uživatelé u konkrétního ISP se nemohou dostat dovnitř. Dobré SaaS služby mají speciálně pointy v různých AS.
- Jak nastavit monitoring pro privátní API za VPN nebo firewallem?
Tady je několik variant. První: umístěte probe node uvnitř privátní sítě (například na bastion host) a dejte mu výstup ven pro alerty. Druhý: vytvořte samostatný health check endpoint, který nevyžaduje autorizaci, ale vrací 200 OK pouze tehdy, pokud skutečná byznys logika funguje (například kontroluje spojení s databází). Třetí: pro SaaS monitoring některé služby (Better Stack, Datadog) poskytují outbound IP adresy, které lze přidat do whitelistu firewallu.
Důležitý nuance ohledně IP whitelistu: seznamy probe adres velkých SaaS platforem se neustále mění — vendoři přidávají nové lokace, vyřazují staré, dělají A/B routing. Pokud tyto IP zadáte do firewallu ručně, váš monitoring se dříve nebo později rozbije, jakmile vendor spustí nový probe node s novou adresou. Správně je dynamicky importovat seznam přes API nebo pravidelně publikovaný JSON/TXT soubor (většina vendorů to poskytuje) a whitelist aktualizovat automaticky.
- Co je lepší pro status page: dělat vlastní nebo koupit hotovou?
Pokud už máte Gatus nebo Uptime Kuma — status page je tam zdarma out of the box. Pokud jste na Prometheus stacku — Grafana s public dashboardem taky stačí. Kupovat samostatný produkt (Statuspage.io, Status.io, Better Stack Status Pages) dává smysl, když potřebujete těsnou integraci s incident managementem (odběry klientů, historie incidentů, publikace post-mortemů), nebo chcete plnou brand kontrolu. Pro většinu projektů stačí self-hosted varianta.
- Dává smysl monitorovat DNS samostatně?
Ano, obzvlášť pokud závisíte na konkrétním DNS poskytovateli (Route 53, NS1, váš registrátor). DNS poskytovatel může mít problém v konkrétním regionu a váš web se stane nedostupným pro část uživatelů, zatímco monitoring z jiného regionu říká „vše OK". Jednoduché kontroly: rezolvuje se doména, rezolvuje se správně (porovnání s očekávanou IP). Nástroje jako Better Stack a Gatus to mají out of the box.
- Kolik stojí postavit normal-grade monitoring pro malý byznys?
Hybridní schéma pro malé e-commerce vypadá zhruba takto: free-tier UptimeRobot (10 monitorů, $0) + jeden VPS s Gatusem u jiného poskytovatele ($5-10/měs) + Telegram bot pro alerty ($0) = $5-10/měs. Pokud chcete SaaS-only: Better Stack starter tier ($24/měs) nebo UptimeRobot Pro ($7/měs) pokryje potřeby typického obchodu. Pro střední byznys s 50+ endpointy a 24/7 dozorem: $50-200/měs podle hloubky. Pro enterprise s SLA a pravidelným auditem: $500+/měs a vlastní tým.