Cloud-SicherheitSchwachstellenDatenschutz

Microsoft behebt Ausfallstörung bei MFA-Setup und MySignIn-Dienst

Microsoft behebt Ausfallstörung bei MFA-Setup und MySignIn-Dienst
Zusammenfassung

Ein Ausfall bei Microsoft hat am Freitag Millionen von Nutzern weltweit beeinträchtigt, die ihre Multi-Faktor-Authentifizierung (MFA) einrichten oder die MySignins-Plattform nutzen wollten. Der Dienst reagierte nicht mehr auf Anfragen und zeigte Fehlermeldungen vom Typ „504 Gateway Timeout", was auf Überlastungen der Server hindeutet. Microsoft bestätigte das Problem am frühen Morgen (5 Uhr ET) und stufte es als kritischen Vorfall ein. Das Unternehmen reagierte schnell, indem es auf alternative Serverinfrastruktur auswich und zuletzt eine fehlerhafte Cache-Konfiguration als Ursache identifizierte. Besonders für deutsche Nutzer und Unternehmen ist dieser Vorfall relevant, da er die Sicherheitsmechanismen bei der Anmeldung in Microsoft-Diensten beeinträchtigt – genau in einer Zeit, in der robuste Authentifizierung essentiell ist. Der Incident zeigt einmal mehr die kritische Abhängigkeit von Cloud-Services und unterstreicht, wie wichtig es für Organisationen ist, Notfallpläne für solche Ausfallszenarien zu haben. Besonders deutsche Behörden und Unternehmen, die auf Microsoft-Dienste für sensible Daten angewiesen sind, sollten ihre Backup-Strategien überprüfen.

Die Störung betraf eine der kritischsten Sicherheitsfunktionen in der Microsoft-Cloud-Infrastruktur: das Einrichten von Multi-Faktor-Authentifizierung und der Zugriff auf das MySignIn-Portal. Der Fehlercode MO1329260 wurde in der Admin-Konsole dokumentiert, wodurch Administratoren und Benutzer identifizieren konnten, ob ihre Organisation betroffen war.

Microsoft reagierte schnell und schaltete betroffene Systeme auf alternative, funktionierende Infrastruktur um. Dies ist eine bewährte Best-Practice bei Cloudanbietern, um Ausfallzeiten zu minimieren. Das Unternehmen überwachte anschließend die Service-Telemetrie kontinuierlich, um sicherzustellen, dass alle Systeme wieder vollständig hergestellt waren.

Die Ursache ließ nicht lange auf sich warten: Microsoft identifizierte eine kürzliche Cache-Konfigurationsänderung als Auslöser. Während der automatischen Umschaltung erlebte der MySignIn-Dienst extreme CPU- und Speicherauslastung, insbesondere weil der europäische Datenverkehr zu diesem Zeitpunkt Spitzenwerte erreichte. Dies führte dazu, dass der Service das Anfragevolumen nicht mehr verarbeiten konnte — ein klassisches Szenario bei Infrastruktur-Engpässen in Cloud-Umgebungen.

Für deutsche Organisationen unterstreicht dieser Vorfall, wie wichtig redundante Systeme und Disaster-Recovery-Pläne sind. Das BSI und der Bundesbeauftragte für Datenschutz (BfDI) betonen regelmäßig, dass Unternehmen ihre IT-Systeme mit ausreichender Ausfallsicherheit gestalten müssen. Der Ausfallfall zeigt auch die Risiken von zentralisierten Cloud-Abhängigkeiten: Wenn ein kritischer Service bei Microsoft ausfällt, können deutsche Unternehmen und Behörden nicht auf lokale Alternativen ausweichen.

Microsoft bestätigte später, dass alle Mitigationsmaßnahmen rückgängig gemacht wurden und der Datenverkehr zur ursprünglichen Infrastruktur zurück migriert wurde. Dies war der sichere Weg, um die Stabilität wiederherzustellen. Dass der Konzern zeitgleich mit anderen Service-Unterbrechungen wie Teams-Free-Ausfällen und Outlook-Problemen kämpfte, illustriert, dass auch bei großen Tech-Anbietern Fehler in Konfigurationen zu Kettenreaktionen führen können.