Retour

Surmonter les quatre principaux défis pour réduire MTTR

by Le 3 janvier 2018

Ce résumé récapitule nos Réduire MTTR et webinaire sur les violations de SLA, maintenant disponible sur demande — aucun formulaire d'inscription requis.

Les équipes réseau ressentent de plus en plus la pression pour réaliser une disponibilité « 9 99.999 s » (disponibilité de 5 %). C'est moins de 17 minutes, 4 secondes d'indisponibilité par an. La plupart des organisations subissant 5 à XNUMX pannes chaque année, vous avez environ une minute de temps de réparation par panne.

Vous avez dépensé une fortune pour créer de la redondance, vous avez automatisé vos systèmes de surveillance et de billetterie, mais un 2017 NetBrain enquête a constaté qu'il accapare encore 80 % des entreprises plus d'une heure par panne pour se remettre en marche. Le calcul ne correspond tout simplement pas.

Le seul moyen de réduire MTTR passer d'une heure à environ une minute consiste à automatiser les étapes de dépannage entre la détection, la première réponse et l'escalade jusqu'à la résolution. S'appuyer sur des méthodes traditionnelles et manuelles de dépannage, c'est comme apporter un couteau dans une fusillade.

S'appuyer sur des méthodes traditionnelles et manuelles de dépannage, c'est comme apporter un couteau dans une fusillade.

 

MTTR Surface d'attaque

Quatre défis entre détection et résolution

La solution 2017 NetBrain enquête a identifié quatre défis clés entre la détection et la résolution - les obstacles à la réduction MTTR:

  1. Les premiers intervenants n'ont pas la visibilité requise pour résoudre le problème en cours.
  2. La collecte de données prend énormément de temps via CLI.
  3. Le manque de collaboration entre les équipes retarde la résolution.
  4. Les problèmes disparaissent avant même que les premiers intervenants n'y parviennent.

 

1. La cartographie à la demande est indispensable

Environ 43 % des équipes réseau n'ont pas de diagrammes à jour pour résoudre le problème à résoudre, soit en s'appuyant sur des outils de documentation manuels comme Visio (les diagrammes devenant obsolètes presque aussitôt qu'ils sont créés), soit en s'appuyant sur les « connaissances tribales ». ” des ingénieurs les plus expérimentés. Vous ne pouvez tout simplement pas résoudre les problèmes rapidement ou efficacement si vous ne savez pas exactement comment le trafic circule réellement sur votre le travail réseau. Après tout, vous ne pouvez pas réparer ce que vous ne pouvez pas voir. Reposant sur traceroute limite votre compréhension de ce qui se passe ; NetBrain, d'autre part, vous donne une visibilité complète de bout en bout sur toutes les combinaisons de traffic paths en quelques secondes.

NetBrain Dynamic Maps visualisez toutes les données du réseau et affichez-les dans leur contexte sur une « toile propre », afin de ne pas vous noyer dans une mer de détails non pertinents. Vous voyez non seulement la topologie de base, mais également la conception sous-jacente, la configuration, les détails des performances en temps réel et, peut-être le plus important, les informations historiques. Vous obtenez des réponses immédiates à la principale question de dépannage : Qu'est-ce qui a changé ? Tirer parti des instantanés récurrents du réseau, NetBrain effectue une analyse comparative pour trouver des changements dans la configuration, le routage et bien plus encore.

Et parce que NetBrain les cartes sont construites à l'aide de données de réseau en direct, elles sont toujours à jour, toujours précises.

3. Mettre à jour les cartes automatiquement 2

C'est la profondeur et l'étendue des données collectées automatiquement par NetBrain cela vous donne un bon départ pour dépanner plus rapidement. Pratiquement toutes les données du réseau peuvent être superposées sur la carte (ou non). Explorez en profondeur pour obtenir des détails infinis sur la topologie et les données de conception - fichiers de configuration, tables de routage, MAC, ARP, STP, BGP, OSPF, multidiffusion, MPLS, NAT - toutes les données dont vous avez besoin pour diagnostiquer un problème sont à portée de clic.

(Dans le webinaire, Ray Belleville, directeur de Solutions Architecture, vous emmène sous le capot de NetBraindu moteur de récupération de données automatisé.)

2. Automatiser les analyses de diagnostic

Si vous êtes comme la plupart des équipes réseau, le dépannage reste une opération manuelle. Vous émettez probablement un tas de commandes CLI pour obtenir les informations dont vous avez besoin, essayez une poignée de solutions d'essai et d'erreur, ou - pour les problèmes vraiment délicats - allez trouver l'expert résident de votre entreprise (le "chef de tribu") qui connaît le réseau à l'intérieur et à l'extérieur.

Mais tout cela prend du temps, et quand il y a un problème, le temps est la seule chose que vous n'avez pas.

NetBrain prend toutes les commandes CLI que vous exécutez manuellement une commande à la fois, un appareil à la fois, et les exécute automatiquement sur tous les appareils d'un seul coup. Au lieu de collecter péniblement des données au coup par coup, puis de parcourir des centaines de lignes de sortie, tout ce que vous avez à faire est de faire glisser et déposer toutes les commandes CLI sur la carte. Toutes vos preuves de dépannage sont automatiquement collectées pour vous - dans leur contexte - directement dans le Dynamic Carte du réseau.

Récupérer les commandes CLI

Ensuite, pour analyser toutes les données, vous pouvez facilement définir des seuils - aucune connaissance particulière en programmation n'est nécessaire - pour créer des alertes. Ensuite, c'est littéralement un clic pour transformer cette alerte en un moniteur qui signalera toute anomalie à partir de là. Et encore mieux, vous pouvez comparer les données actuelles aux données historiques pour une analyse immédiate afin de voir ce qui a changé.

3. Rationaliser les transferts et l'escalade

Lorsque chaque seconde compte, vos premiers intervenants n'ont pas le temps de retrouver votre chef de tribu ou de feuilleter un classeur. Vous voulez qu'ils soient habilités à gérer le plus de dépannage possible le plus rapidement possible. Et puis, si nécessaire, faites remonter le problème aussi efficacement que possible - sans que chaque équipe successive dans la chaîne n'ait à réinventer la roue (effectuez exactement le même diagnostic que l'équipe précédente).

NetBrainest exécutable Runbooks sont utilisés pour numériser les flux de travail et les meilleures pratiques.

C'est là que NetBrain Exécutable Runbooks entrent en jeu. Un exécutable Runbook numérise les procédures, étape par étape, que votre meilleur expert suivrait pour résoudre le problème. Chaque étape de la runbook est un diagnostic automatisé rendu exécutable en un clic. Runbooks émettez des commandes CLI sur plusieurs périphériques simultanément et analysez les données pour afficher des informations pertinentes sur la carte, telles que l'état actif/en veille HSRP, les pertes de file d'attente QoS, l'incompatibilité duplex, l'état de basculement ASA, etc.

Une logique de flux de travail codifiée « si-alors » guide les intervenants moins expérimentés pour qu'ils suivent un processus de prise de décision ramifié, leur permettant non seulement de traiter plus de problèmes plus rapidement, mais aussi de faire remonter les problèmes avec un transfert simplifié.

4. Attrapez les problèmes intermittents avant qu'ils ne disparaissent

Nous sommes tous passés par là : vous ouvrez un ticket d'incident, mais quelles que soient les circonstances à l'origine du problème, vous ne pouvez répondre qu'avec NTF (aucun problème trouvé). Encore une fois, vous ne pouvez pas réparer ce que vous ne pouvez pas voir. Il est presque impossible de reproduire le problème et il faut avoir de la chance pour le voir « en direct » en temps réel.

Ce dont vous avez besoin, ce sont des informations sur le problème tel qu'il s'est produit, et non après coup.

3. Diagnostic déclenché

NetBrain l'automatisation est continue. L'intégration de l'API avec d'autres NMS (comme les systèmes de billetterie et de surveillance) signifie que les diagnostics automatisés et la collecte de données sont toujours activés, donc dès qu'un problème est détecté, NetBrain entre en jeu pour créer un Dynamic Map de la zone problématique et déclencher un exécutable Runbook pour capturer toutes les données et analyser les choses.

 

La Réduire MTTR et violations de SLA le webinaire est maintenant disponible dans son intégralité sur demande, aucune inscription requise.

Ou une meilleure façon de voir NetBrain en action est de programmez une démo personnalisée de 30 minutes avec l'un de nos experts.

Services Connexes