Regresa

Resuelva los problemas intermitentes con la solución de problemas de red "justo a tiempo"

by 11 de jul, 2018

Si usted es como la mayoría de los ingenieros de redes, cerca de la parte superior de su lista de tareas más frustrantes está intentar solucionar un problema de red que ya no está en juego. Todos hemos estado allí: abre un ticket de problema, pero las circunstancias que originalmente causaron el problema ahora han cambiado, y el problema parece haberse desvanecido en el aire. Lo mejor que podemos hacer es cerrar el ticket como NTF (no se encontraron problemas) o CND (no se puede duplicar) y esperar que no vuelva a aparecer. (Alerta de spoiler: lo hará, y probablemente en el peor momento posible). Y con SDN "volviéndose real", solo veremos más de estos efímeros problemas intermitentes en el futuro.

Es casi imposible reproducir estos problemas intermitentes y hay que tener suerte para verlos “en vivo” en tiempo real. pero ahora con NetBrain puede desencadenar un diagnóstico automatizado de un problema en el momento en que ocurre: resolución de problemas de red con automatización "justo a tiempo".

En realidad, solucionar un problema intermitente es bastante sencillo. Pero fijarlo no lo es.

 

Activar diagnósticos automáticos de "nivel 0" para la página de destino

NetBrain Integrated Edition presenta la integración de API con otros sistemas de administración de red, como ServiceNow, sus soluciones de monitoreo IDS/SIEM, Splunk, 24×7, de modo que tan pronto como se genera una alerta, la ruta del área problemática se mapea automáticamente y Ejecutable Runbooks entre en acción instantáneamente para capturar todos los datos y análisis sobre el evento en tiempo real. A esto lo llamamos automatización “justo a tiempo” porque como un evento está sucediendo, todos los datos que necesita sobre el problema se recopilan, analizan y visualizan automáticamente en contexto en un Dynamic Map. No se necesita la participación humana. Cuando respondes al incidente, todo está esperando por ti.

El ABC de la automatización “Justo a tiempo”

En el momento de un evento, la automatización “justo a tiempo” realiza dos acciones distintas:

  1. Se crea dinámicamente un mapa del problema.
  2. Un conjunto predefinido de procedimientos se ejecuta automáticamente para realizar un diagnóstico de "nivel 0".

Dynamic Maps Definir automáticamente el alcance del problema

Digamos que de la noche a la mañana su herramienta de monitoreo 24×7 detectó que una aplicación se estaba ejecutando lentamente y se creó un ticket de ServiceNow. El ticket de ServiceNow se activó automáticamente NetBrain para mapear la ruta a lo largo de la cual fluía el tráfico de la aplicación entre el servidor web y el servidor de la base de datos, y todos los saltos intermedios. en ese mismo momento. Este no es tu promedio traceroute: NetBrain inicia sesión en la puerta de enlace predeterminada del servidor web para comenzar a analizar la ruta, comenzando con las tablas de enrutamiento y luego analizando parámetros avanzados (VRF, ACL, PBR, NAT y más). Y también verá la ruta de flujo inverso: información crucial si el tráfico de la aplicación es asimétrico. Esto le da una precisión alcance del problema en tiempo real, no en algún momento posterior, después de que la red haya cambiado dinámicamente el traffic path por cualquier número de razones o después de que los solucionadores de problemas anteriores hayan intentado reasignar la aplicación. Se escribe una URL del mapa directamente en el ticket de ServiceNow. Un clic y estás en el Dynamic Map, que se puede enriquecer con información de rendimiento adicional de su solución de monitoreo (o cualquier otro sistema con una API). Todo está ahí en un solo panel de vidrio.

boleto de servicio ahora

La solución de problemas de red "justo a tiempo" realiza los mismos pasos que usted, solo que automáticamente, sin que tenga que estar allí cuando llegó la alerta.

 

Runbooks Ejecutar automáticamente los pasos para diagnosticar el problema

Al mismo tiempo, nuevamente, automáticamente, un Ejecutable Runbook recopila datos de rendimiento y emite comandos CLI en múltiples dispositivos de múltiples proveedores de una sola vez para obtener los datos relevantes que necesita para descubrir exactamente qué está causando la lentitud. Verá cómo se veía la utilización de la memoria y la CPU cuando se envió la alerta, así como el estado de la interfaz. Él Runbook buscará automáticamente colisiones de interfaz y errores CRC en todo el traffic path, verifique la falta de coincidencia de velocidad o dúplex, ID OSPF duplicadas, números AS mal configurados para conexiones vecinas BGP, etc. Dado que nuestra primera pregunta es siempre, "¿Qué cambió?" a Runbook realiza un análisis comparativo de la topología y el enrutamiento entre el momento en que se detectó el problema y algún punto anterior en el tiempo (cuando la aplicación funcionaba bien). Hay cientos de diagnósticos automatizados listos para usar y puede personalizar un Runbook para ejecutar prácticamente cualquier tarea de recopilación o análisis de datos, sin tener que escribir una sola línea de código.

(Matt Speidel entra en mayor detalle en Qué tan ejecutable Runbooks trabajo.)

La Runbook realiza los mismos pasos de solución de problemas de red que usted, solo que de forma automática, sin tener que estar allí cuando llegó la alerta. Y todos los resultados de diagnóstico se documentan en el Runbook que está adjunto al mapa. Simplemente haga clic en la URL del mapa en el informe de problemas, y toda la recopilación y el análisis de datos que hubiera hecho de todos modos ya se han hecho por usted.

Un administrador de red sénior que conozco dijo una vez que los problemas intermitentes no son especialmente intermitentes; es sólo nuestra conciencia de ellos que es. Lo más probable es que, si surge un problema una vez, vuelva a asomar su fea cabeza, o en otro lugar de la red. NetBrain ha introducido una nueva capacidad que le permite aprovechar su poder de automatización para continua y proactivamente monitor para cualquier problema que acaba de resolver. En otras palabras, esos misteriosos problemas intermitentes se convierten en problemas conocidos.

Mire este breve video para obtener una idea de cómo NetBrain se integra con otros sistemas (como ServiceNow, herramientas de monitoreo 24 × 7) para proporcionar un diagnóstico de solución de problemas de red "justo a tiempo" de un problema de red en el instante en que ocurre.

 

También podemos pensar en esta solución de problemas de red automatizada desencadenada por eventos como un diagnóstico de "nivel O" porque toda la recopilación, el análisis y la visualización de datos se han realizado antes de que un ingeniero de nivel 1 comience a investigar el problema. De hecho, la automatización maneja todo este trabajo antes de que un humano entre en escena.

No puedes arreglar lo que no puedes ver. En los entornos de red de rápido movimiento de hoy en día, con demasiada frecuencia los problemas han desaparecido cuando pasamos a solucionarlos. Por lo general, solucionar un problema intermitente es bastante sencillo. Pero fijarlo no lo es. Ahí es donde entra la automatización “justo a tiempo”.

 

Relacionado: