Zurück

Anwenden von Automatisierung zum Reduzieren MTTR

by Mark Harris 18. Juli 2017

Unternehmen erleiden jeden Monat Tausende von Netzwerkvorfällen, was Tausenden von Stunden IT-Zeit für Fehlerbehebung und Reparatur entspricht. Für Organisationen, die mit Netzwerken dieser Größenordnung zu tun haben, Verringerung der mittleren Reparaturzeit (MTTR) selbst in kleinen Schritten kann einen massiven Unterschied zum Endergebnis machen. Das Überraschende ist, dass es in einem Unternehmen relativ wenige Problemtypen gibt, aber jeder dieser Problemtypen wiederholt sich immer und immer wieder. Das liegt daran, dass die meisten Probleme, obwohl sie einzigartig erscheinen, tatsächlich den zuvor behandelten Problemen ziemlich ähnlich sind. Die meisten Unternehmen haben dies nicht erkannt, daher wird jedes einzelne Problem individuell angegangen – als wäre es noch nie zuvor aufgetreten. Dies führt zu Tonnen von redundantem Aufwand und Inkonsistenz.

MTTR

Heutzutage verlassen sich die meisten Unternehmen auf manuelle Prozesse, um Netzwerkprobleme zu lösen – insbesondere in der Fehlerbehebungs- und Eskalationsphase. Was sie nicht erkennen, ist die Implementierung einer Netzwerkautomatisierung für all diese sich wiederholenden Arbeiten, die sich drastisch reduzieren lassen MTTR um 60 Prozent oder mehr und kann in Tagen erreicht werden, nicht in Wochen oder Monaten oder sogar Jahren!

Für die meisten Organisationen beginnt die Wurzel des Problems mit einem Mangel an End-to-End-Transparenz, da ein Ingenieur oder Techniker ein oder zwei Stunden damit verbringt, den Kontext des Netzwerkproblems selbst zu ermitteln, einschließlich der Durchführung vorläufiger Diagnosen und der Suche nach Topologiedetails. Veraltete Netzwerkkarten sind im Falle eines Netzwerkvorfalls nutzlos, da selbst eine geringfügige Ungenauigkeit die Problemlösung stark erschwert oder unmöglich macht. Außerdem ist es für Netzwerktechniker zeitaufwändig und überflüssig, sich jedes Mal ein genaues Bild von der Problemstelle zu machen.

Eine effektive Fehlerbehebung beginnt mit einem tiefen Verständnis des Netzwerks – nicht nur der grundlegenden Topologie, sondern auch der zugrunde liegenden design intent, Konfiguration sowie das Verständnis von Echtzeitleistung und Sicherheitsmerkmalen. Der einzige Weg, diesen Wissensstand zu erreichen, ist Netzwerktransparenz in Echtzeit, Leistungsdiagnostik und Datenvergleich mit bekannten guten Baselines.

NetBrain hilft Organisationen zu reduzieren MTTR auf drei kritische Weisen:

Beschleunigen Sie die Fehlerbehebung im Netzwerk durch Automatisierung

Die Behebung von Netzwerkproblemen ist wie die Suche nach der Nadel im Heuhaufen. Netzwerküberwachungstools eignen sich hervorragend zum Identifizieren von Problemen auf Geräteebene, bieten jedoch wenig Einblick in die Ursache des Problems oder die umfassendere Ansicht der Dienste, die möglicherweise betroffen sind. NetBrain kann die Fehlerbehebungszeit halbieren, indem Hunderte von vorgefertigten und gemeinsam genutzten Diagnosen automatisiert werden, die von unserem unterstützt werden Network Intent Technologie. Tatsächlich kann jeder Teil des Netzwerks nicht nur durch seine Konnektivität beschrieben werden, sondern auch durch die Nutzung unserer Network Intent Technologie, Echtzeit-Leistungsanforderungen und Sicherheitsprofile sind ebenfalls sichtbar. Man könnte sagen, dass ein Netzwerk von 1000 physischen oder virtuellen Diensten eigentlich durch die ZEHN MAL dieser Menge beschrieben werden müsste Network Intents oder 10,000 Absichten! (Und NetBrain macht es einfach, all diese Netork-Intents zu generieren, da wir die Problemlösung von ÄHNLICHEN Situationen im gesamten Netzwerk in großem Umfang anwenden können).

Konsistenz ist auch Teil des Automatisierungswerts. Eine der größten Herausforderungen bei der traditionellen Netzwerkfehlerbehebung ist, dass es sich um eine sehr individuelle Kunst handelt, die auf dem Wissen und der Erfahrung jedes Ingenieurs basiert. Und da Netzwerkingenieure mit einer Vielzahl unterschiedlicher Tools arbeiten, sind ihre Vorsätze höchst einzigartig und selten auf zusätzliche Situationen übertragbar, denen sie oder ihre Kollegen in der Zukunft begegnen könnten. Zusätzlich, NetBrainist dynamisch Netzwerkkarte wird zur einzigen Glasscheibe für die Fehlerbehebung, die zur Grundlage für die Automatisierung wird Network Intent Diagnostik anzuwenden. Dies führt zu einem übersichtlicheren Prozess und stellt sicher, dass der gesamte Fehlerbehebungsprozess transparent ist.

Automatisieren Sie die Netzwerkdokumentation in Echtzeit

Netzwerkteams verlassen sich bei der Fehlerbehebung auf die Dokumentation. Leider leben die meisten Teams ohne genaue Diagramme, da die Dokumentation eines großen Netzwerks Monate dauert und die Karten nach Abschluss des Projekts bereits veraltet sind. NetBrain ermöglicht es Ihnen, Netzwerkdiagramme automatisieren und halten Sie sie auf dem neuesten Stand, indem Sie patentierte verwenden auto-discovery Technologie, die mit den L2- und L3-Tabellen aller Geräte zusammen mit einer Fülle anderer Details interagiert, um eine Echtzeitansicht des gesamten Netzwerks vom Rand bis zur Cloud zu erstellen. (Ja, es beinhaltet Transparenz und Kontrolle über alle virtuellen Controller und Dienste der großen Cloud-Anbieter).

Und diese dynamische Ansicht bietet wesentlich mehr Details als je zuvor! Zur Behebung von Netzwerkproblemen müssen Ingenieure wissen, wie der Datenverkehr über das Live-Netzwerk von der Quelle zum Ziel in beide Richtungen fließt. Da es nicht für jeden Verkehrsfluss ein Diagramm gibt, verlassen sich Ingenieure zum Verständnis auf Traceroute traffic paths. Mit modernen Netzwerken Traceroute ist sehr einschränkend – Ingenieure brauchen eine bessere Sichtbarkeit. Mit NetBrain, werden nur die Quell- und Ziel-IP-Adresse benötigt, um jeden Verkehrsfluss dynamisch zuzuordnen, die Flüsse enthalten alle erforderlichen Leistungsmetriken in diesen Ansichten.

Verbessern Sie die Zusammenarbeit und teilen Sie Best Practices

Die Fehlerbehebung kann ein langwieriger Prozess sein, wenn verschiedene Organisationen beteiligt werden müssen. Andere operative Teams werden in der Regel durch Eskalation eingebunden, was die Problemlösung verzögert. Als Echtzeitplattform können mehrere Ingenieure in Echtzeit zusammenarbeiten, um jedes Problem zu lösen. Mit NetBrain, NetOps, SecOps, DevOps und andere Betriebsteams können die Automatisierung in jeder Phase der Fehlerbehebung anwenden – von der Ticketerstellung über die Datenerfassung bis hin zum Austausch von Wissen über Best Practices. In jeder Phase ist es wichtig, wichtige Erkenntnisse zu teilen, und dies kann durch die gemeinsame Nutzung einer einzigen Karten-URL erreicht werden. Zusammenarbeit ist entscheidend, aber sie kostet auch wertvolle Zeit, und die Verbesserung des Zusammenarbeitsprozesses wird sich letztendlich reduzieren MTTR.

Um die Zusammenarbeit weiter zu verbessern, können Netzwerkteams vorhandene Skripte, Designnotizen, Lehrbücher und Stammeswissen nutzen, um Best Practices zu digitalisieren Ausführbar Runbooks. Runbooks machen Wissen für jeden Ingenieur im Team zugänglich und ausführbar.

Verbunden