: https://blackout-news.de/aktuelles/goog…l-in-frankfurt/
Stromausfall und Kühlprobleme: Google Cloud-Dienste in Europa zeitweise lahmgelegt
Ursachen und technische Details
Der Ausfall der Google Cloud-Dienste in Frankfurt wurde durch
einen Stromausfall in Verbindung mit Kühlungsproblemen verursacht. Dies
führte dazu, dass Teile der Zone europe-west3-c heruntergefahren werden
mussten. Google-Ingenieure arbeiteten intensiv an einer Lösung, um das
Rechenzentrum wieder in den Vollbetrieb zu versetzen und das Problem zu
beheben.
Die Auswirkungen des Ausfalls waren weitreichend und betrafen
verschiedene Google Cloud-Dienste. Bei der Google Compute Engine kam es
zu Fehlern bei der Erstellung virtueller Maschinen und Verzögerungen bei
Löschvorgängen. Einige Instanzen in der betroffenen Zone waren für
Operationen nicht verfügbar. Im Google Kubernetes Engine waren Knoten am
betroffenen Standort nicht erreichbar, und Versuche, neue Knoten zu
erstellen, schlugen teilweise fehl.
Weitere betroffene Dienste umfassten Cloud Build, Cloud Developer
Tools, Cloud Machine Learning, Google Cloud Dataflow, Google Cloud
Dataproc, Google Cloud Pub/Sub, Persistent Disk und Vertex AI Batch
Prediction. Bei Google Cloud Dataflow gab es Verzögerungen beim
Skalieren von Workern für Batch-Jobs, und einige Streaming-Jobs konnten
nicht ordnungsgemäß fortgesetzt oder skaliert werden.
Google reagierte auf den Vorfall, indem es betroffenen Nutzern
empfahl, Workloads in andere Regionen oder Zonen zu verlagern. Für
Nutzer mit beeinträchtigten regionalen persistenten Festplatten wurde
empfohlen, regelmäßige Snapshots zu erstellen.
Dieser Vorfall unterstreicht die Bedeutung von Redundanz und Disaster
Recovery-Plänen in der Cloud-Infrastruktur. Er zeigt auch, wie wichtig
es ist, dass Cloud-Anbieter wie Google robuste Systeme zur Erkennung und
Behebung von Störungen haben, um die Auswirkungen auf Kunden zu
minimieren.
Mal sehen, wann die Banken ausfallen? Die sind alle Pleite und es fehlt nur noch ein Bank Run! 