
- Los despidos se produjeron en julio en varias áreas de AWS
El pasado lunes 20 de octubre, cientos de páginas web, plataformas y servicios (incluidos datáfonos y cajeros automáticos) sufrieron una caída a nivel mundial por culpa de un fallo masivo en los sistemas de Amazon Web Services (AWS), la infraestructura que soporta la nube de millones de empresas.
El fallo se produjo en las instalaciones de AWS en el norte de Virginia (EEUU), pero ha afectado a todos los servicios que dependen de AWS particularmente en la región US-EAST-1. Se estima que la compañía controla los datos del 76,8 millones de webs a nivel global, de las que 200.000 están en España, y por eso esta caída que duro más de cuatro horas en solucionarse afectó a tantos negocios tan distintos.
El origen del fallo se identificó en el servicio Amazon DynamoDB, una base de datos sin servidor, es decir, el cliente no necesita preocuparse por mantener o escalar la infraestructura física: AWS se encarga automáticamente de la capacidad, las copias de seguridad, la seguridad y el rendimiento del sistema de cada empresa.
En una extensa publicación en su web, AWS afirmó que había un error en su software de automatización que provocó una serie de problemas en cadena. La compañía explicó que se debía a "un defecto latente en el sistema automatizado de gestión de DNS [sistema de nombres de dominio] del servicio".
Lo que leyendo entre líneas se entiende como que el sistema con Inteligencia Artificial de la compañía sufrió problemas de latencia, lo que provocó la caída a nivel mundial de AWS.
Ahora, tirando de hemeroteca, fue hace tan solo unos meses que Amazon tomó la drástica decisión de recortar cientos de puestos de trabajo en la unidad de computación en la nube de AWS, según publicaron en Reuters. Esto significa que despidieron a trabajadores directamente implicados en el mantenimiento de esta infraestructura y como ha reconocido Amazon, "el error no se reparó automáticamente y requirió la intervención manual del operador".
Por ello es lícito especular que de haber humanos encargándose de ese trabajo, este fallo no se habría producido o se habría solucionado con mucha más rapidez. Muchas empresas están utilizando cada vez más la IA para escribir código para su software y están adoptando agentes de IA para automatizar tareas rutinarias, con el fin de ahorrar costes y reducir la dependencia del personal, pero fallos como este, sobre todo a nivel mundial, siguen demostrando que el valor humano sigue siendo indispensable.