Regresa

Aplicar la automatización para reducir MTTR

by mark Harris 18 de jul, 2017

Las organizaciones empresariales incurren en miles de incidentes de red cada mes, lo que equivale a miles de horas de tiempo de TI dedicadas a la resolución de problemas y reparaciones. Para las organizaciones que manejan redes a esa escala, reduciendo el tiempo medio de reparación (MTTR) incluso en pequeños incrementos puede marcar una gran diferencia en el resultado final. La parte sorprendente es que se ven relativamente pocos tipos de problemas en una empresa, pero cada uno de estos tipos de problemas se repite una y otra vez. Se debe a que, si bien la mayoría de los problemas parecen únicos, en realidad son bastante similares a los problemas que se abordaron anteriormente. La mayoría de las empresas no se han dado cuenta de esto, por lo que todos y cada uno de los problemas se abordan a medida, como si nunca antes se hubieran visto. Esto produce toneladas de esfuerzo redundante e inconsistencia.

MTTR

Hoy en día, la mayoría de las organizaciones confían en los procesos manuales para abordar los problemas de la red, particularmente en las fases de resolución de problemas y escalamiento. De lo que no se dan cuenta es que implementar la automatización de la red para todo ese trabajo repetitivo puede reducir drásticamente MTTR en un 60 por ciento o más, ¡y se puede lograr en días, no en semanas, meses o incluso años!

Para la mayoría de las organizaciones, la raíz del problema comienza con la falta de visibilidad de extremo a extremo, ya que un ingeniero o técnico dedicará una o dos horas a establecer el contexto del problema de la red en sí, incluida la ejecución de diagnósticos preliminares y la búsqueda de detalles de topología. Los mapas de red desactualizados son inútiles en caso de cualquier incidente en la red, ya que incluso una pequeña imprecisión dificultará en gran medida la resolución del problema o la imposibilitará. Y a los ingenieros de red les lleva mucho tiempo y es redundante obtener una comprensión precisa del problema en cada momento.

La resolución de problemas efectiva comienza con una comprensión profunda de la red, no solo la topología básica, sino también la subyacente. design intent, configuración y comprensión del rendimiento en tiempo real y las características de seguridad. La única forma de tener ese nivel de conocimiento es a través de la visibilidad de la red en tiempo real, el diagnóstico del rendimiento y la comparación de datos con buenas líneas de base conocidas.

NetBrain ayuda a las organizaciones a reducir MTTR de tres maneras críticas:

Acelere la solución de problemas de red a través de la automatización

Solucionar problemas de red es como encontrar una aguja en un pajar. Las herramientas de monitoreo de red son excelentes para identificar problemas a nivel de dispositivo, pero brindan poca información sobre la causa del problema o una visión más amplia de los servicios que pueden verse afectados. NetBrain puede reducir el tiempo de resolución de problemas a la mitad mediante la automatización de cientos de diagnósticos preconstruidos y compartidos, impulsados ​​por nuestro Network Intent tecnología. De hecho, cada parte de la red puede describirse no solo por su conectividad, sino también por el aprovechamiento de nuestra Network Intent la tecnología, los requisitos de rendimiento en tiempo real y los perfiles de seguridad también son visibles. Podría decirse que una red de 1000 servicios físicos o virtuales debería en realidad ser descrita por DIEZ VECES esa cantidad de Network Intents, o 10,000 Intents! (Y NetBrain facilita la generación de todos esos intentos de Red, ya que podemos aplicar la resolución de problemas de situaciones SIMILARES en toda la red a escala).

La consistencia también es parte del valor de la automatización. Uno de los mayores desafíos en la resolución de problemas de red tradicional es que es un arte muy individual, basado en el conocimiento y la experiencia de cada ingeniero. Y dado que los ingenieros de redes trabajan con una variedad de herramientas diferentes, sus resoluciones serán muy únicas y rara vez transferibles a situaciones adicionales que ellos o sus colegas puedan encontrar en el futuro. Además, NetBrain's dinámico Mapa de red se convierte en el único panel de vidrio para la solución de problemas que se convierte en la base para la automatización Network Intent diagnósticos a aplicar. Esto da como resultado un proceso más conciso y garantiza que haya visibilidad en todo el proceso de solución de problemas.

Automatice la documentación de la red en tiempo real

Los equipos de red confían en la documentación para la resolución de problemas. Desafortunadamente, la mayoría de los equipos viven sin diagramas precisos porque lleva meses documentar una red grande y, una vez que se completa el proyecto, los mapas ya están obsoletos. NetBrain le permite automatizar diagramas de red y manténgalos actualizados mediante el uso de auto-discovery tecnología que interactúa con las tablas L2 y L3 de cada dispositivo, junto con una gran cantidad de otros detalles, para establecer la vista en tiempo real de toda la red, desde el borde hasta la nube. (Sí, incluye visibilidad y control de todos los controladores y servicios virtuales de los principales proveedores de la nube).

¡Y esta vista dinámica proporciona muchos más detalles que nunca antes! Para solucionar problemas de red, los ingenieros necesitan saber cómo fluye el tráfico a través de la red activa, desde el origen hasta el destino, en ambas direcciones. Como no existe un diagrama para cada flujo de tráfico, los ingenieros confían en traceroute para comprender traffic paths. Con redes modernas, traceroute es muy limitante – los ingenieros necesitan una mejor visibilidad. Con NetBrain, solo se necesita la dirección IP de origen y destino para mapear dinámicamente cualquier flujo de tráfico, los flujos tendrán todas las métricas de rendimiento requeridas incluidas en esas vistas.

Mejore la colaboración y comparta las mejores prácticas

La resolución de problemas puede ser un proceso largo cuando varias organizaciones deben involucrarse. Otros equipos operativos generalmente se involucran a través de la escalada, lo que retrasa la resolución de problemas. Como plataforma en tiempo real, varios ingenieros pueden colaborar en tiempo real para abordar cualquier problema. Con NetBrain, NetOps, SecOps, DevOps y otros equipos operativos pueden aplicar la automatización en cada fase de la resolución de problemas, desde la creación de tickets hasta la recopilación de datos y el intercambio de conocimientos sobre las mejores prácticas. En cada fase, compartir información clave es fundamental, y esto se puede lograr compartiendo una sola URL de mapa. La colaboración es fundamental, pero también requiere un tiempo valioso y, en última instancia, mejorar el proceso de colaboración reducirá MTTR.

Para mejorar aún más la colaboración, los equipos de la red pueden aprovechar los guiones existentes, las notas de diseño, los libros de texto y el conocimiento tribal para digitalizar las mejores prácticas en Ejecutable Runbooks. Runbooks hacer que el conocimiento sea accesible y ejecutable para todos los ingenieros del equipo.

Relacionado: