Regresa

Automatización en minutos: las 10 evaluaciones principales para evitar interrupciones

by Valeria Dimartino Apr 11, 2024

El tiempo de inactividad es caro. Más de la mitad (54%) de los encuestados sobre centros de datos de Uptime Institute de 2023 dicen que su interrupción significativa, grave o grave más reciente costó más de $100,000 16, y el 1% dijo que su interrupción más reciente costó más de $XNUMX millón. 

La frase de la película Apolo 13, “El fracaso no es una opción”, es uno de los eslóganes cinematográficos más reconocibles de todos los tiempos.

NetBrain Prevención de cortes para la página de registro

En las operaciones de red, se aplica la misma mentalidad. El dinero y la reputación están en juego. El fracaso no es una opción.

Los datos del Uptime Institute sugieren que cada año hay, en promedio, de 10 a 20 interrupciones de TI o eventos de centros de datos de alto perfil en todo el mundo que causan pérdidas financieras graves o graves, interrupciones en los negocios y los clientes, pérdida de reputación y, en casos extremos, pérdida de vida.

Entonces, ¿por qué seguimos siendo tan vulnerables dadas todas las redes de redundancia que tienen incorporadas? ¿Por qué seguimos dependiendo tanto de los procesos manuales y la resolución de problemas reactiva? Los ingenieros de redes dedican incontables horas a establecer las bases para la prestación de servicios, pero la aplicación regular es escasa o nula. Sólo cuando se informa de un problema, se ponen en marcha (lentamente) los mecanismos de resolución de problemas.

La respuesta es: que no estamos siendo proactivo suficiente. Esto se debe a una falta de atención a la industria de la automatización de redes. Dejamos que los mismos problemas sigan sucediendo una y otra vez cuando sabemos cómo resolverlos porque simplemente carecemos de los mecanismos para aprovechar y aplicar este conocimiento automáticamente a través de redes híbridas.

Una importante interrupción impulsa el cambio en Saudi Telecom (stc)

En 2021, una aplicación crítica en stc sufrió una importante interrupción del servicio. Fue necesario casi un mes de resolución de problemas en operaciones de red, servidores, aplicaciones y equipos de seguridad para identificar la causa y restaurar el servicio. Esta costosa interrupción puso de relieve la necesidad de una mejor visibilidad y un enfoque más estratégico para la gestión de incidentes. Como resultado, el CTO del grupo stc presionó por una solución para toda la organización que proporcione visibilidad de extremo a extremo y automatice la gestión de incidentes en toda la infraestructura y aplicaciones.

Imagine capturar la experiencia de sus ingenieros y aplicarla de forma proactiva en toda su red sin codificación. La automatización de la red está ayudando a que las operaciones de la red reaccionen más rápido, pero no ha avanzado lo suficiente (alerta de spoiler: hasta hoy) para aplicar ese conocimiento en toda la red de manera proactiva y sencilla. ¿Qué pasaría si pudiéramos aprovechar el vasto conocimiento de nuestros ingenieros de redes y almacenarlo para utilizarlo en una plataforma de automatización?

Cada día, los equipos de operaciones de red evaluar la red para detectar desviaciones, cumplimiento, estado y cambios manualmente. ¿Qué pasaría si los ingenieros pudieran realizar estas evaluaciones periódicamente con la ayuda de la automatización?

Relacionado: