Zurück

Best Practices zur Automatisierung des Fehlerbehebungsworkflows in Netzwerkumgebungen mit mehreren Anbietern

by Valerie Dimartino 27. März 2024

Seien wir ehrlich: Die manuelle Fehlerbehebung in Hybridnetzwerken ist mühsam und zeitaufwändig. Jedes Problem wird so angegangen, als ob es noch nie zuvor aufgetreten wäre, und verschiedene Netzwerktechniker wenden basierend auf ihrem Fachwissen und ihrer Erfahrung unterschiedliche Lösungen für ähnliche Probleme an. Das Ergebnis ist, dass die heutige Fehlerbehebung im Netzwerk eher eine Kunst als eine Wissenschaft ist – was an sich schon ein erhebliches Problem darstellt! Erschwerend kommt hinzu, dass die Zahl der Eskalationsingenieure begrenzt ist und sie, wenn sie eingesetzt werden, aufgrund des begrenzten Kontexts, der Herausforderungen im Arbeitsablauf und der unterschiedlichen Ansätze die ersten Untersuchungsschritte wiederholen müssen.

Case in point: Ein bekannter Hersteller von Elektrofahrzeugen überschwemmte sich mit Serviceanfragen für bestimmte Netzwerkdaten von anderen IT-Abteilungen. Beispielsweise mussten die Sicherheits- und IT-Infrastrukturteams häufig den Switch-Port kennen, an den ein bestimmtes Gerät wie eine Kamera angeschlossen war, oder sie wollten ungenutzte Ports finden, an denen sie zusätzliche Geräte bereitstellen konnten. Zweitens war es eine Herausforderung, den Überblick über wöchentliche Geräteänderungsanfragen, Passwortrotationen und Hardwareaktualisierungen zu behalten. Es war überwältigend, all dies am Laufen zu halten und das Unternehmen zu unterstützen und gleichzeitig auf die ständigen Anfragen anderer IT-Abteilungen zu reagieren.

Jetzt ist aufgrund der schieren Menge an Servicetickets und der Reduzierung des NOC-Personals für deren Bearbeitung eine stärkere Automatisierung erforderlich. Die Budgets sind knapp und die qualifizierten Ressourcen begrenzt. Und wir wissen, dass wir nicht gerade übervoll sind mit erfahrenen Netzwerktechnikern, die wir für jedes Mal zur Verfügung haben, wenn eine langsame App gemeldet wird oder eine Verbindung abbricht. Bei vielen handelt es sich um häufig wiederkehrende Probleme, die durch Operationen der Stufe 1 leicht gelöst werden können, wenn sie nur über die entsprechenden Diagnosetools verfügen. Dennoch wird die Fehlerbehebung als Teamarbeit unter Verwendung eines manuellen Reaktionsprotokolls angesehen:

👨‍💻 Technikerdiagnose der Stufe 1 > 🎫 Ticketeskalation > 👨‍💼 Technikerdiagnose der Stufe 2 und so weiter.

Darüber hinaus gibt es von unseren Überwachungstools Fehlalarme, die zu einer endlosen Jagd nach Geistern führen, beispielsweise durch Flattern. Wenn es nur eine Möglichkeit gäbe, diese vorübergehenden Probleme herauszufiltern.

Während Automatisierung seit langem die gewünschte Lösung zur Beschleunigung der Fehlerbehebung ist, werden die meisten dieser Bemühungen zu von Entwicklern geleiteten Projekten, die keine ausreichenden Ergebnisse liefern. Und wenn eine Basisautomatisierung versucht wird, geschieht dies in Form benutzerspezifischer Skripte, die ebenfalls das Effizienzziel nicht erreichen. Keiner dieser Ansätze verändert den zentralen Referenzarbeitsablauf der Organisation. Keiner der beiden Ansätze kann im gesamten Unternehmen wiederverwendet werden, was zu einer Reduzierung führt MTTR, lässt sich auf ein Multi-Vendor-Netzwerk skalieren, verbessert die Zusammenarbeit, verhindert das erneute Auftreten von Problemen oder maximiert die Effizienz auf wesentliche Weise.

Um diese betrieblichen Mängel zu beheben, muss ein völlig neuer und maschinenzentrierter Ansatz für den Netzwerkbetrieb implementiert werden. Es erfordert eine grundlegende Änderung der Art und Weise, wie Netzwerkingenieure über den Betrieb denken, einschließlich der Netzwerkautomatisierung bei allem, was sie tun. Dazu ist eine Automatisierungsplattform erforderlich, die allen technischen Ressourcen zur Verfügung steht (ohne dass Code erforderlich ist). Diese erfahrenen Ingenieure wissen bereits, wie man Probleme löst – sie benötigen eine einfache Möglichkeit, ihre umfassende Problemlösungserfahrung zu erfassen und sie maschinell für jeden ausführbar zu machen, der die gleiche Fehlerbehebungssituation überall in der Infrastruktur angehen möchte. Mit der richtigen Plattform wird jeder Ingenieur zu einem Netzwerkautomatisierungsingenieur, der in der Lage ist, innerhalb von Minuten und nicht Monaten eine Netzwerkautomatisierung für jedes große oder kleine Problem zu erstellen.

Best Practices, die bei der Untersuchung der Netzwerkautomatisierung zu berücksichtigen sind:

Verbunden