Stellungnahme zum Ausfall im Rechenzentrum Reutlingen am 04. März 2024
Am 04. März 2024 , kam es zwischen 15:12 gegen 15:42 Uhr in unserem Rechenzentrum in Reutlingen zu einem unerwarteten Totalausfall, der sämtliche Anbindungen für eine Dauer von 30 Minuten beeinträchtigte. Wir möchten unsere Kunden und Partner über die Ursachen und die getroffenen Maßnahmen in Kenntnis setzen.
Der Ausfall wurde durch einen Konfigurationsfehler verursacht, der sich bis zu den Core-Switches ausweitete und somit einen kompletten Ausfall aller Routings zur Folge hatte. Dies führte dazu, dass die Verbindungen unseres Rechenzentrums vorübergehend unterbrochen waren. Wir möchten betonen, dass dieser Vorfall ausschließlich die Anbindungen betraf und keine Kundenserver oder andere Systeme beeinträchtigt wurden.
Unsere Techniker waren sofort vor Ort, um das Problem zu identifizieren und schnellstmöglich zu beheben. Durch ihre rasche und effiziente Arbeit konnten wir die Systeme wieder in den Normalbetrieb überführen. Aktuell analysieren unsere Fachleute die genaue Ursache des Konfigurationsfehlers, um zukünftige Vorfälle dieser Art zu verhindern.
Wir verstehen, dass Zuverlässigkeit und Verfügbarkeit der von uns bereitgestellten Dienste von höchster Bedeutung sind. Deshalb nehmen wir diesen Vorfall sehr ernst und ergreifen zusätzliche Maßnahmen, um die Sicherheit und Stabilität unserer Infrastruktur weiter zu verbessern. Dazu gehören eine umfassende Überprüfung und Anpassung unserer Konfigurationsprozesse sowie die Implementierung zusätzlicher Sicherheitskontrollen.
Wir möchten uns bei allen Betroffenen für die Unannehmlichkeiten entschuldigen und versichern, dass wir alles in unserer Macht Stehende tun, um solche Vorfälle in Zukunft zu vermeiden. Unsere Teams arbeiten kontinuierlich daran, die Qualität und Zuverlässigkeit unserer Dienstleistungen zu erhöhen.
Sollten Sie weitere Fragen zu diesem Vorfall haben oder zusätzliche Informationen benötigen, stehen wir Ihnen jederzeit zur Verfügung. Wir danken Ihnen für Ihr Verständnis und Ihr Vertrauen in uns.
Update zur Ursachenanalyse des Ausfalls:
05.03.2024: Nach eingehender Untersuchung konnten wir die Ursache des Problems identifizieren. Ein zentraler Switch hat entgegen der korrekten Konfiguration, die eine Weiterleitung hätte unterbinden sollen, ein VLAN akzeptiert und dieses in das Netzwerk weitergeleitet. Diese unerwartete Handlung führte zu Netzwerkkollisionen und war ausschlaggebend für den Ausfall. Unsere Analyse deutet darauf hin, dass die Wurzel des Problems in der Firmware des Switches liegt. Wir haben diesen Vorfall umgehend dem Hersteller gemeldet, um eine dauerhafte Lösung zu finden und zukünftige Ausfälle dieser Art zu verhindern.