Regresa

Por qué la automatización del diagnóstico de problemas es tan difícil

by lingping gao 7 de marzo, 2022

En 7 diciembreth, 2021, Amazon AWS tuvo una interrupción importante que comenzó con una interrupción en el norte de Virginia y se extendió rápidamente por todo el país. En poco tiempo, muchos sitios comerciales como Google, Netflix, DoorDash, Southwest Airlines se vieron afectados por la interrupción. En el punto álgido, más de 600 personas de AWS estaban en un puente de llamadas de conferencia para solucionar el problema. El apagón duró más de 8 horas. Piense en las implicaciones comerciales a largo plazo de una interrupción de 8 horas.

Durante el mes, AWS continuó con 2 interrupciones más.

Plantea la pregunta: ¿Puede ser mejor?

Puede. AWS, de hecho, es una de las redes más automatizadas del mundo, pero esta interrupción, basada en la resumen post-mortem por AWS, tardó tanto en aislarse porque la interrupción en sí afectó su acceso a la capacidad de diagnóstico automatizado.

En nuestro mundo moderno de TI, el diagnóstico de problemas debe automatizarse, aunque es realmente difícil de hacer. Una encuesta de 2021 realizada por NetBrain a cientos de nuestros clientes reveló que 2/3 de estos ingenieros de redes no tienen ninguna capacidad de automatización durante la resolución de problemas. ¿Qué usan? La simple y antigua consola de interfaz de línea de comandos. Lo que sufre es el tiempo de reparación y las interrupciones prolongadas, junto con impactos a mucho más largo plazo en la satisfacción y retención del cliente, las valoraciones, la reputación, etc.

Para las empresas que aspiraban a aprovechar la automatización para el diagnóstico de problemas, el viaje fue muy duro. Las herramientas RCA (análisis de causa raíz) atrajeron muchos ojos hace 20 años, pero los resultados estuvieron lejos de ser satisfactorios. La mayoría de los innovadores han sido absorbidos por los grandes jugadores de soluciones de TI y simplemente detuvieron la innovación. Más recientemente, las soluciones AiOps están tratando de llenar este vacío con un enfoque de caja negra. Todas las soluciones AiOps aprovechan el aprendizaje automático o las funciones tradicionales de inteligencia artificial basadas en estadísticas para descubrir las causas principales de grandes cantidades de datos de máquinas. Pero para la mayoría de los problemas de TI, es muy difícil obtener un conjunto de datos limpios, además de muchos otros desafíos, incluido un PH.D para operar dicha herramienta. Como uno de NetBrainLos clientes de lo expresaron cuando discutieron sus primeros esfuerzos con AIOps, esperaron 6 meses para ver su primer problema diagnosticado a través de su herramienta AiOps, y ese fue un problema muy simple. (El nombre de la herramienta se omite aquí para evitar confusiones)

No sin intentarlo, la automatización del diagnóstico de problemas sigue siendo el mayor desafío de TI sin resolver en la actualidad. NetBrain comenzó a trabajar en este problema hace más de 10 años, utilizando un enfoque Whitebox centrado en Network Intent. La llamada próxima generación basada en intenciones se puede conectar a la mayoría de las herramientas ITSM, lo que le permite comenzar a resolver problemas en el momento en que ocurren. Puede abordar más del 95% de los problemas de red que llegan a los sistemas de TI y potencialmente afectar las aplicaciones comerciales de las organizaciones, y también ayuda a prevenir muchos problemas recurrentes. En los próximos blogs, explicaremos el funcionamiento interno de NetBrain, Intent-based automation sistema para redes híbridas con más detalle.

Relacionado: