zurück
Monitoring – Grundlagen (SNMP, Metrics, Logs, Alerts, Dashboards)
Monitoring überwacht Systeme, Netzwerke und Anwendungen, um Fehler frühzeitig zu erkennen,
Performance zu analysieren und Ausfälle zu vermeiden.
Moderne Monitoring-Lösungen bestehen aus:
Metriken (CPU, RAM, Netzwerk)
Logs (Syslog, Anwendungslogs)
Events / Alerts
Dashboards (Grafana)
Health-Checks
Status-Überwachung (Up/Down)
Monitoring ist zentraler Bestandteil jeder IT-Infrastruktur.
1. Was wird überwacht?
Hardware
CPU-Auslastung
RAM
Festplattenplatz
Temperatur
Lüfter
Netzwerkkarten
Netzwerk
Dienste
Sicherheit
IDS/IPS Alerts
Login-Versuche
Firewall-Events
CrowdSec-Signale
Anwendungen
Fehler in Logs
Antwortzeiten
-
Benutzerzugriffe
2. Arten des Monitorings
a) Host-Monitoring
Überwachung eines einzelnen Systems:
CPU, RAM, Disk, Netzwerk
Dienste
Prozesse
Beispiele:
b) Netzwerk-Monitoring
Überwachung über das Netzwerk:
SNMP-Abfragen
ICMP (Ping)
Port-Checks
Beispiele:
c) Log-Monitoring
Auswertung von Logdateien:
Syslog
Docker-Logs
Suricata eve.json
Application Logs
Beispiele:
d) Anwendungs-Monitoring
3. SNMP – Simple Network Management Protocol
SNMP nutzt Netzwerkabfragen, um Geräte zu überwachen.
Ports:
Man erhält Daten wie:
Port-Status
Traffic-Counter
Temperaturen
Lüfter
Geräteinformationen
SNMP Versionen:
Beispiel Abfrage:
snmpwalk -v2c -c public 192.168.1.1
4. Prometheus & Exporter
Prometheus sammelt Metriken, z. B.:
CPU
RAM
Netzwerk
Containerstatus
HTTP-Latenzen
Jeder Dienst liefert Daten über einen „Exporter“.
Beispiele:
Prometheus arbeitet mit einer Pull-Architektur:
Prometheus → fragt Exporter regelmäßig ab
5. Grafana – Dashboards
Grafana ist ein Visualisierungstool für Monitoring-Daten.
Man erstellt damit Dashboards für:
Serverstatus
Suricata Alerts
Docker-Statistiken
Mailserver-Metriken
Netzwerkverkehr
CPU/RAM
ASCII:
Prometheus / Loki / MySQL →
Grafana →
Dashboards
6. Logging – zentrale Logverwaltung
Logs sind essenziell, um Fehler zu finden und sicherheitsrelevante Events zu erkennen.
Quellen:
Syslog (Switches, Server, Firewalls)
Docker-Container
Suricata eve.json
Auth-Logs (Loginversuche)
Mailserver-Logs
Moderne Systeme:
Loki + Promtail (leicht, schnell)
ELK Stack (Elasticsearch, Logstash, Kibana)
Graylog
7. Alerts & Benachrichtigungen
Alerting-Systeme informieren dich sofort bei Problemen.
Typische Trigger:
CPU > 90%
Datenträger voll
Server nicht erreichbar
viele IDS-Alarme
Mailqueue wächst
Container abgestürzt
Benachrichtigung über:
E-Mail
Teams/Slack
Matrix/Element
Grafana Alerting
SMS (optional)
Webhooks
8. Health Checks
Healthchecks prüfen Dienste automatisch:
HTTP-Status 200
Datenbank erreichbar
-
SMTP Check
Container status
Viele Load Balancer nutzen Healthchecks.
9. Blackbox Monitoring
Der „Blackbox Exporter“ testet externe Dienste:
GET https://example.com → 200 OK?
SMTP Port 587 erreichbar?
Ping erfolgreich?
Super zur Überwachung:
Domains
APIs
Mailserver
externe Dienste
10. Beispiel moderner Monitoring-Stack
ASCII:
+------------------------+
| Prometheus | ← Metrics
+------------------------+
| Loki + Promtail | ← Logs
+------------------------+
| Grafana | ← Dashboards + Alerts
+------------------------+
| SNMP Exporter |
+------------------------+
Dieser Stack läuft perfekt auch in Docker.
11. Best Practices
zentrale Loggingstelle einrichten
SNMPv3 statt v2c verwenden
Alerts nicht zu empfindlich, aber sinnvoll scharf
Dashboards für CPU/RAM/Disk/Netz
IDS/IPS-Events grafisch auswerten
Healthchecks für alle Dienste
Monitoring in eigene VLANs trennen
Zusammenfassung
Monitoring überwacht Systeme, Netzwerke, Sicherheit und Dienste
SNMP sammelt Netzwerkdaten
Prometheus sammelt Metriken
Grafana visualisiert alles
Logs → via Loki oder ELK
Alerts warnen vor Problemen
Healthchecks sichern Verfügbarkeit
Monitoring ist Schlüssel für stabile IT-Infrastrukturen