Combinare monitoring di disponibilita e metriche
Uptime Kuma per il monitoring up/down dei servizi, Grafana per le metriche di performance. Insieme offrono visibilita completa.
Architettura
Uptime Kuma (porta 3001) → disponibilita servizi
Prometheus (porta 9090) → raccolta metriche
Node Exporter (porta 9100) → metriche sistema (su ogni host)
Grafana (porta 3000) → visualizzazione e dashboard
Dashboard Grafana consigliate
- Node Exporter Full (ID 1860): CPU, RAM, disco, rete per ogni server
- Proxmox VE (ID 10347): metriche VM e container
- Docker (ID 893): stato container
- NVIDIA GPU (ID 14574): temperatura, utilizzo, VRAM
Alert integrati
- Uptime Kuma: notifica immediata se un servizio va giu (Telegram, email)
- Grafana: alert su soglie (CPU > 90%, disco > 85%, temperatura GPU > 80)
Best practice
- Monitorare almeno: ping host, porte servizi critici, HTTPS dei siti
- Retention dati: 15 giorni per metriche dettagliate, 1 anno per metriche aggregate
- Un solo punto di monitoraggio: tutto visibile da un'unica dashboard