Retour

Appliquer l'automatisation pour réduire MTTR

by Mark Harris Le 18 juillet 2017

Les organisations d'entreprise subissent des milliers d'incidents réseau chaque mois, ce qui équivaut à des milliers d'heures de temps informatique consacrées au dépannage et à la réparation. Pour les organisations qui gèrent des réseaux à cette échelle, réduire le temps moyen de réparation (MTTR) même par de petits incréments peuvent faire une énorme différence sur le résultat net. Ce qui est surprenant, c'est qu'il y a relativement peu de types de problèmes rencontrés dans une entreprise, mais chacun de ces types de problèmes se répète encore et encore. C'est parce que même si la plupart des problèmes semblent uniques, ils sont en fait assez similaires aux problèmes précédemment traités. La plupart des entreprises ne s'en sont pas rendu compte, donc chaque problème est traité sur mesure, comme s'il n'avait jamais été vu auparavant. Cela donne des tonnes d'efforts redondants et d'incohérences.

MTTR

Aujourd'hui, la plupart des organisations s'appuient sur des processus manuels pour résoudre les problèmes de réseau, en particulier dans les phases de dépannage et d'escalade. Ce qu'ils ne réalisent pas, c'est que la mise en œuvre de l'automatisation du réseau pour tout ce travail répétitif peut réduire considérablement MTTR de 60 % ou plus, et peut être accompli en quelques jours, pas en semaines ou en mois ou même en années !

Pour la plupart des organisations, la racine du problème commence par un manque de visibilité de bout en bout, car un ingénieur ou un technicien passera une heure ou deux à établir le contexte du problème de réseau lui-même, y compris l'exécution de diagnostics préliminaires et la recherche de détails de topologie. Les cartes réseau obsolètes sont inutiles en cas d'incident réseau, car même une inexactitude mineure entravera considérablement la résolution du problème ou la rendra impossible. De plus, il est fastidieux et redondant pour les ingénieurs réseau d'acquérir une compréhension précise de la proximité du problème à chaque fois.

Un dépannage efficace commence par une compréhension approfondie du réseau - pas seulement la topologie de base, mais aussi le sous-jacent design intent, la configuration ainsi que la compréhension des performances en temps réel et des caractéristiques de sécurité. La seule façon d'avoir ce niveau de connaissances est d'avoir une visibilité du réseau en temps réel, des diagnostics de performance et une comparaison des données avec de bonnes références connues.

NetBrain aide les organisations à réduire MTTR de trois manières critiques :

Accélérez le dépannage du réseau grâce à l'automatisation

Dépanner les problèmes de réseau, c'est comme trouver une aiguille dans une botte de foin. Les outils de surveillance du réseau sont parfaits pour identifier les problèmes au niveau de l'appareil, mais fournissent peu d'informations sur la cause du problème ou une vue plus large des services qui peuvent être affectés. NetBrain peut réduire de moitié le temps de dépannage en automatisant des centaines de diagnostics prédéfinis et partagés, alimentés par notre Network Intent La technologie. En fait, chaque partie du réseau peut être décrite non seulement par sa connectivité, mais en tirant parti de notre Network Intent la technologie, les exigences de performance en temps réel et les profils de sécurité sont également visibles. On pourrait dire qu'un réseau de 1000 services physiques ou virtuels devrait en fait être décrit par DIX FOIS cette quantité de Network Intents, soit 10,000 XNUMX Intentions ! (Et NetBrain facilite la génération de toutes ces intentions Netork puisque nous pouvons appliquer la résolution de problèmes de situations SIMILIAIRES à travers le réseau à grande échelle).

La cohérence fait également partie de la valeur de l'automatisation. L'un des plus grands défis du dépannage réseau traditionnel est qu'il s'agit d'un art très individuel, basé sur les connaissances et l'expérience de chaque ingénieur. Et comme les ingénieurs réseau travaillent avec une variété d'outils différents, leurs résolutions seront très uniques et rarement transférables à d'autres situations qu'eux-mêmes ou leurs collègues pourraient rencontrer à l'avenir. En outre, NetBrainest dynamique Carte du réseau devient le panneau de verre unique pour le dépannage qui devient la base de l'automatisation Network Intent diagnostic à appliquer. Cela se traduit par un processus plus concis et garantit une visibilité sur l'ensemble du processus de dépannage.

Automatisez la documentation réseau en temps réel

Les équipes réseau s'appuient sur la documentation pour le dépannage. Malheureusement, la plupart des équipes vivent sans diagrammes précis car il faut des mois pour documenter un grand réseau et, une fois le projet terminé, les cartes sont déjà obsolètes. NetBrain vous permet de automatiser les diagrammes de réseau et maintenez-les à jour en utilisant des auto-discovery technologie qui interagit avec les tables L2 et L3 de chaque appareil, ainsi qu'une multitude d'autres détails, pour établir la vue en temps réel de l'ensemble du réseau, de la périphérie au cloud. (Oui, cela inclut la visibilité et le contrôle de tous les contrôleurs et services virtuels des principaux fournisseurs de cloud).

Et cette vue dynamique fournit beaucoup plus de détails que jamais auparavant ! Pour résoudre les problèmes de réseau, les ingénieurs doivent savoir comment le trafic circule sur le réseau actif, de la source à la destination, dans les deux sens. Comme il n'existe pas de diagramme pour chaque flux de trafic, les ingénieurs s'appuient sur traceroute pour comprendre traffic paths. Avec les réseaux modernes, traceroute est très limitant – les ingénieurs ont besoin d'une meilleure visibilité. Avec NetBrain, seules les adresses IP source et de destination sont nécessaires pour mapper dynamiquement tout flux de trafic, les flux auront toutes les mesures de performances requises incluses dans ces vues.

Améliorez la collaboration et partagez les meilleures pratiques

Le dépannage peut être un long processus lorsque diverses organisations doivent s'impliquer. D'autres équipes opérationnelles sont généralement engagées par escalade, ce qui retarde la résolution des problèmes. En tant que plate-forme en temps réel, plusieurs ingénieurs peuvent collaborer en temps réel pour résoudre n'importe quel problème. Avec NetBrain, NetOps, SecOps, DevOps et d'autres équipes opérationnelles peuvent appliquer l'automatisation à chaque phase du dépannage - de la création de tickets à la collecte de données et au partage des connaissances sur les meilleures pratiques. Dans chaque phase, le partage des informations clés est essentiel, et cela peut être accompli en partageant une seule URL de carte. La collaboration est essentielle, mais elle prend également un temps précieux, et l'amélioration du processus de collaboration réduira finalement MTTR.

Pour améliorer encore la collaboration, les équipes réseau peuvent tirer parti des scripts existants, des notes de conception, des manuels et des connaissances tribales pour numériser les meilleures pratiques en Exécutable Runbooks. Runbooks rendre les connaissances accessibles et exécutables, pour chaque ingénieur de l'équipe.

Services Connexes