Cortes en la nube de Google y Oracle causados por la ola de calor en el Reino Unido

Las interrupciones de Google Cloud y Oracle Cloud se produjeron después de la falla de los sistemas de enfriamiento en los centros de datos de las empresas debido a una ola de calor en curso en el Reino Unido.

El Reino Unido ha soportado una ola de calor sin precedentes durante la última semana, lo que ha provocado temperaturas elevadas en toda la zona.

Sin embargo, hoy, los sistemas de enfriamiento en los centros de datos utilizados por Google y Oracle para alojar su infraestructura en la nube han comenzado a dejar de funcionar con temperaturas que alcanzan un récord de 40,2 grados Celsius (104,4 Fahrenheit).

Con el fin de crear una interrupción prolongada para evitar daños permanentes a los componentes de hardware, tanto Google como Oracle han finalizado los equipos, lo que ha provocado interrupciones en sus servicios en la nube.

El fenómeno afectó inicialmente a Oracle, ya que la compañía informó una falla de enfriamiento alrededor de las 11:30 a.m. EST de hoy, lo que provocó que se apagara el “hardware no crítico”.

Un mensaje de estado de Oracle Cloud que parece haber sido detectado por primera vez por TheRegister decía: “Como resultado de las temperaturas fuera de temporada en la región, un subconjunto de la infraestructura de enfriamiento dentro del centro de datos del sur del Reino Unido (Londres) experimentó un problema. Esto llevó a un subconjunto de nuestra infraestructura de servicio necesitaba apagarse para evitar fallas de hardware descontroladas”.

“Este paso se tomó con la intención de limitar el potencial de cualquier impacto a largo plazo para nuestros clientes”.

Sin embargo, según Oracle, es posible que los clientes de esta región no puedan acceder a sus recursos de Oracle Cloud Infrastructure, incluso con solo el hardware no crítico apagado.

Aproximadamente dos horas después, Google también informó fallas de enfriamiento en uno de sus edificios que alberga la zona europe-west2-a para la región europe-west2.

“Hubo una falla relacionada con el enfriamiento en uno de nuestros edificios que alberga la zona europe-west2-a para la región europe-west2. Esto provocó una falla parcial de la capacidad en esa zona, lo que provocó terminaciones de VM y la pérdida de máquinas por un pequeño conjunto de nuestros clientes”, se lee en el informe de incidentes de Google Cloud.

“Estamos trabajando arduamente para que la refrigeración vuelva a estar en línea y crear capacidad en esa zona. No anticipamos un mayor impacto en la zona europe-west2-a y las máquinas virtuales que se ejecutan actualmente no deberían verse afectadas. Un pequeño porcentaje de dispositivos de disco persistente replicados son ejecutándose en modo redundante único”.

“Para evitar daños a las máquinas y una interrupción prolongada, hemos apagado parte de la zona y estamos limitando los lanzamientos interrumpibles de GCE. Estamos trabajando para restaurar la redundancia para cualquier dispositivo de disco persistente replicado afectado restante”.

Al igual que Oracle, los clientes de Google Cloud también se ven interrumpidos por esta falla de enfriamiento, con dispositivos que se terminan, sistemas inaccesibles y dispositivos de disco persistente que se ejecutan en modo de redundancia única.

Ninguna de las compañías esperaba ningún golpe adicional, ya que se está trabajando en los sistemas de enfriamiento para que vuelvan a estar en línea.