Esto no debería haber sucedido.
Nos dijeron que a medida que maduraba Internet, este tipo de cosas – un solo error causando un efecto dominó afectando a millones de máquinas – debería volverse cada vez menos probable. Habría más y más servidores y cables distribuidos en más lugares, haciendo que un punto de falla sea cada vez más improbable.
Últimas interrupciones de IT a nivel global: ‘Aumento enorme’ en llamadas al 999
En cambio, lo que el episodio de hoy – en el cual una actualización de una empresa llamada CrowdStrike a clientes que utilizan sus servicios en todo el mundo esencialmente rompió el sistema operativo Windows en sus computadoras – ha subrayado es que a menudo, cuanto más complejo se vuelve un sistema, más vulnerable es a colapsar.
La ironía en el centro del caos
La gran ironía, por supuesto, es que la razón de ser de CrowdStrike es evitar que ocurran momentos como este. El “Falcon Sensor” de la empresa es un producto utilizado para prevenir ataques cibernéticos – un programa complejo que se puede considerar como una especie de superpaquete de antivirus, que, para hacer su trabajo, obtiene acceso privilegiado a más partes de su computadora que el software regular.
Pero resulta que la última actualización al Falcon Sensor, subida durante la noche a computadoras en todo el mundo, tenía un código defectuoso, lo que causó que las máquinas con Windows se bloquearan.
¿Cómo se puede solucionar?
En este momento, parece que la única forma de solucionarlo es que los técnicos reinicien cada máquina y eliminen manualmente un archivo en particular (C-00000291*.sys por si lo preguntaba). En otras palabras, tenga presente a los técnicos de su empresa, porque van a tener un largo fin de semana.
Pero quizás la lección más impactante del episodio sea una más antigua, expuesta por el historiador Joseph Tainter en su libro de 1988 “El Colapso de las Sociedades Complejas”.
Cuanto más complejas se vuelven las sociedades y los sistemas, más vulnerables son al colapso. Tainter se refería a ejemplos como la caída de Roma o el colapso de la antigua civilización mesopotámica, pero uno podría aplicar la lógica con la misma facilidad a ejemplos modernos.
La complejidad de la sociedad nos hace vulnerables
Al acecho bajo la tesis de Tainter estaba el punto de que a menudo en una sociedad compleja de actores de organización podrían tomar decisiones que parecen sensatas pero, debido a la complejidad del sistema y su incapacidad para entenderlo, realmente podrían hacerlo más vulnerable.
Considere la crisis de las hipotecas subprime que desencadenó la crisis financiera de 2008. Las hipotecas se empaquetaron y revendieron como activos, eventualmente, a bancos que tenían poco entendimiento de su valor real y sus riesgos. Cuanto más complejo se volvía el sistema, menos podían comprender las personas cuán expuestas estaban a un fracaso catastrófico, y más vulnerable era toda la estructura al colapso.
Lee más:
Gráficos que muestran cuándo las interrupciones alcanzaron su punto máximo en los servicios
Interrupción de IT ‘causando problemas en la mayoría de los consultorios médicos’
Ahora reflexionemos sobre la actual desdicha de IT. Preguntémonos: ¿cómo llegó a ser que tantas empresas en todo el mundo tenían el mismo software instalado en sus sistemas, haciéndolos vulnerables a las mismas líneas de código defectuosas?
Después de todo, la gran mayoría de las personas que trabajan en las empresas afectadas nunca habrán oído hablar de CrowdStrike. Como los banqueros que presidieron la crisis financiera, no tenían idea de las vulnerabilidades potenciales dentro de sus sistemas.
Pero en los últimos años, a medida que las empresas se han vuelto más y más preocupadas por el riesgo de los ciberataques, han comenzado a implementar controles y regulaciones de ciberseguridad. A menudo, estos tomaban la forma de una lista de verificación que algún pobre operario debía completar: ¿cuántas computadoras tienes? ¿Qué sistema operativo? ¿Están todas en línea? ¿Qué formas de protección cibernética tienen? Y así sucesivamente.
Demasiado pronto para determinar el alcance de la interrupción y el daño económico
Es demasiado pronto para calcular cuánta interrupción ha causado este episodio y cuánto daño económico ha causado. La respuesta corta casi con seguridad es: mucho. Millones de personas en todo el mundo no han podido viajar, comunicarse, hacer transacciones. Es posible que haya puesto en peligro vidas, dado que ha afectado la capacidad de muchos médicos para desempeñar su trabajo.
Quizás lo mejor que se pueda sacar del caos de hoy es que podría servir como una historia ejemplar que podría hacer que nuestras computadoras sean un poco más seguras y estables en el futuro. Podría recordar a los jefes que las decisiones de ciberseguridad son más que simples checklists, y a veces instalar software de ciberseguridad puede salir mal.
Nos recuerda lo peligroso que es si todo el mundo en el mundo depende del mismo proveedor. Nos recuerda la necesidad de redundancia – de tener sistemas de respaldo. Nos recuerda los peligros de la complejidad.
Esto probablemente no consuele mucho si eres una de esas personas cuyos planes de vacaciones se han visto perturbados o tu negocio ha sido afectado por la interrupción de IT de hoy. Pero es algo.
Fuente y créditos: news.sky.com
Cats: