Files

T

stefan 15222b5453 chore: entferne veraltete Architekturdokumente

Signed-off-by: StefanMoCoAt <stefan.mo.co@gmail.com>

2026-05-05 21:23:02 +02:00

Observability: Dashboards & Alerts

Dieses Dokument definiert die Monitoring-Strategie für das Masterdata-SCS gemäß der Roadmap.

1. Zentrale Dashboards

Fokus: Überwachung des ZNS-Ingestion-Workers.

Import Duration: Histogramm der Zeit pro Import-Datei (ASCII-Batch).
Records per Second: Durchsatz der verarbeiteten Reiter/Pferde/Vereine während eines Imports.
Idempotency Skip Rate: Anteil der übersprungenen Datensätze (bereits vorhanden/unverändert).
Validation Error Rate: Anteil der Datensätze, die aufgrund von Validierungsfehlern abgelehnt wurden.

Fokus: Ktor REST-Endpunkte (Lese-Kanal).

Fokus: Exposed/Postgres Persistenz.

Fokus: JVM & Infrastruktur.

ID	Alarm Name	Bedingung	Priorität
AL-01	API High Error Rate	> 1% 5xx Fehler über 5 Minuten	Kritisch
AL-02	Slow API Requests	P95 Latenz > 500ms für 2 Minuten	Warnung
AL-03	Import Failure	Fehlerrate > 5% bei einem Batch-Lauf	Kritisch
AL-04	DB Pool Exhausted	Pool-Auslastung > 90% für 1 Minute	Kritisch
AL-05	JVM OOM Risk	Heap Usage > 85% nach Full GC	Kritisch
AL-06	Rule-Set Mismatch	Mehrere aktive `RegulationConfig` Versionen pro Sparte	Warnung

Metriken-Export: Prometheus-Format via /actuator/prometheus (Port 8081).
Tracing: Optional via Micrometer Tracing (Brave/Zipkin), falls global im Projekt aktiviert.
Logging: Strukturiertes Logging via Logback (ISO8601, TraceContext).