Monitoring & Alerting Engineer (m/w/d) – Zabbix / Rechenzentrum / 7×24 / ITSM
Zur Verstärkung eines Infrastruktur-Teams suchen wir einen erfahrenen Monitoring & Alerting Engineer (m/w/d) mit Fokus auf den Aufbau eines nachhaltigen und praxistauglichen Monitorings für ein Rechenzentrumsumfeld.
In diesem Mandat übernimmst du die Konzeption und Umsetzung eines ganzheitlichen Monitoring- und Alerting-Ansatzes für zentrale Infrastrukturkomponenten – von Netzwerk und Firewall bis hin zu Server- und Storage-Systemen. Neben der technischen Implementierung steht insbesondere der Aufbau eines belastbaren Betriebs- und Eskalationsmodells für den 7×24-Betrieb im Fokus.
Aufgaben:
* Entwicklung eines ganzheitlichen Monitoring- und Alerting-Konzepts für die Rechenzentrumsinfrastruktur
* Konzeption und Umsetzung von: Event Management, Availability Management, Capacity Management
* Implementierung und Konfiguration der Monitoring-Lösung auf Basis von Zabbix
* Evaluation, ob ergänzende Tools oder Erweiterungen im Rahmen der Konzeption sinnvoll bzw. notwendig sind
* Definition von Schwellenwerten, Alarmierungslogiken und Eskalationsprozessen
* Aufbau eines First-Level-Support-Monitorings für den 7×24-Betrieb
* Dokumentation von Architektur, Prozessen und Betriebsmodellen
* Übergabe in den Betrieb inklusive Know-how-Transfer an das Betriebsteam
Erfahrungen:
* Mehrjährige Erfahrung im Aufbau und Betrieb von Monitoring- und Alerting-Lösungen im Rechenzentrumsumfeld
* Fundierte Kenntnisse in Zabbix (Design, Dashboards, Templates, Trigger, Alerting)
* Erfahrung im Monitoring von: Netzwerk, Firewall, Server & Storage
* Gute Kenntnisse in ITSM-Prozessen, insbesondere mit Event Management, Availability Management & Capacity Management
* Erfahrung im Aufbau von 7×24-Betriebs- und Eskalationsmodellen
* Analytische und konzeptionelle Stärke kombiniert mit einer ausgeprägten Hands-on-Mentalität
* Sehr gute Deutschkenntnisse in Wort und Schrift
* Englischkenntnisse von Vorteil