Zurück

Network Operations Center: Mission Control für ein gesundes Netzwerk

by Phillip Gervasi 9. Nov 2017

Mit riesigen Flachbildfernsehern an den Wänden, auf denen verschiedene Karten und blinkende Lichter angezeigt werden, kann ein Netzwerkbetriebszentrum wie eine Missionskontrolle bei der NASA aussehen. Aber der Hauptzweck eines Netzwerkbetriebszentrums (NOC) besteht nicht darin, eine Mission zum Mond durchzuführen, sondern den Betrieb einer Netzwerkinfrastruktur aufrechtzuerhalten und zu optimieren.

Wenn Sie der Meinung sind, dass dies eine allgemeine Aussage ist, die näher erläutert werden muss, haben Sie Recht. Die Idee eines zentralisierten Netzwerkbetriebs kann mehrdeutig und der Zweck vielschichtig sein, also lassen Sie uns es in drei Bereiche unterteilen: Überwachung, Protokollierung und Maßnahmen ergreifen.

Netzwerk Performance

Die Überwachung ist für viele NOCs ein Kampf. Einige fügen ein Flickenteppich aus Protokollaggregatoren und Warnsystemen zu einer Art einheitlicher Überwachungslösung zusammen. Diese Art von Projekten beginnt mit großem Enthusiasmus, entwickelt sich aber schnell zu einer selten genutzten Sammlung von Plattformen, die nicht miteinander sprechen und bei denen sich niemand mehr anmeldet.

Unabhängig davon, ob ein Netzwerkbetriebsteam ein Out-of-Band-Tap-Netzwerk oder die integrierte Funktionalität seiner Switches und Router verwendet, Alarme und Warnungen sind das Lebenselixier der NOC-Techniker.

Stellen Sie sich dieses Szenario vor: Es wird ein Tool benötigt, um Informationen von den alten Switches zu erhalten, aber dieses Tool funktioniert nicht mit den neuen Rechenzentrums-Switches. Dafür wird ein anderes Tool benötigt. Und noch eine weitere wird für die Firewalls benötigt, da diese weder CDP noch LLDP unterstützen.Überwachung mehrerer Bildschirme

Es ist nicht einfach, eine Vielzahl unterschiedlicher Plattformen gleichzeitig zu überwachen. In der Regel sind Ingenieure auf vorgefertigte Software angewiesen, die alle Module enthält, die die Entwickler für ihre Kunden halten. Dies schränkt ein, was das NOC tun kann und wie effektiv es bei der Überwachung einer Infrastruktur sein kann.

Dennoch ist die Überwachung das, was Techniker bietet Netzwerkbewusstsein, oder mit anderen Worten, ein klares Gefühl dafür, was das Netzwerk zu einem bestimmten Zeitpunkt tut.

Protokollierung

Protokolle halten alles fest, was im Netzwerk vor sich geht, und liefern Hinweise zur Fehlerbehebung und Beweise für Sicherheitsvorfälle. Leider kann ihre effektive Nutzung äußerst mühsam sein – was das Protokollieren für ein typisches NOC sowohl zu einem Fluch als auch zu einem Segen macht.

Ein Teil der Verwendung von Protokollinformationen ist das Erstellen Benchmarks des Netzwerkstatus in sinnvollen Intervallen. Dies ist entscheidend für die Bestimmung von Trends und die Abbildung von Anwendungsabläufen. Diese Idee taucht in Blogs, Whitepapers und Best-Practice-Dokumenten auf, aber Benchmarks werden selbst von den größten NOCs selten durchgeführt, weil sie so schwierig sind.

Ein E-Commerce-Unternehmen kann eine unglaubliche Menge an Protokollinformationen erstellen und speichern, aber es könnte auch Benchmark-Snapshots des Netzwerks zu Zeiten hoher Aktivität wie dem Black Friday, Wochenenden und während Werbeveranstaltungen erstellen. Diese Informationen geben Netzwerktechnikern Einblick in Anwendungsabläufe, wenn das Netzwerk belastet ist, um den Lastausgleich zu verfolgen und Engpässe aufzudecken.

Das Problem ist, dass das Erstellen von Benchmarks nicht einfach ist und daher vernachlässigt wird. Es erfordert die Erfassung von Netzwerkdaten von einer Vielzahl von Plattformen gleichzeitig und in Beziehung zueinander. Die Erfassung dieser Daten im Laufe der Zeit gibt NOC-Technikern jedoch ein Modell, mit dem sie arbeiten und ihr Netzwerkbewusstsein aufbauen können. Und die sofortige Verfügbarkeit dieser Informationen für das gesamte Team fördert eine Kultur der Zusammenarbeit.

Maßnahmen ergreifen

NOCs überwachen Netzwerke, um anomale Aktivitäten zu erkennen und entsprechende Maßnahmen zu ergreifen. Sie überwachen den Zustand und die Sicherheit der Infrastruktur und ergreifen Maßnahmen, um eine optimale Netzwerkleistung sicherzustellen, Vorfälle zu beheben und Transparenz zu gewährleisten change management verarbeiten.

Wenn ein Alarm eingeht, antwortet das NOC. Ein Ticket wird erstellt, um den Vorfall zu verfolgen, ein Techniker übernimmt die Verantwortung dafür und der Prozess der Fehlerbehebung beginnt.

Wenn die Geschäftskontinuität beeinträchtigt ist, erfordert ein NOC ein Gefühl der Dringlichkeit, klare Arbeitsabläufe und optimierte Abläufe. Es bleibt keine Zeit, sich bei beliebigen Geräten anzumelden und das Problem durch Aufnahmen im Dunkeln aufzuspüren.

Automatisierung und Informationsaustausch sind entscheidend, um den Vorfall so schnell wie möglich zu beheben.

Mittlere Reparaturzeit bzw MTTR, ist die durchschnittliche Zeit, die zur Behebung eines Vorfalls benötigt wird. Ein optimiertes NOC verwendet Automatisierung zur Reduzierung MTTR um die Geschäftskontinuität so schnell wie möglich wiederherzustellen.

Dies kann das Ausführen eines Skripts beinhalten, um Konfigurationsunterschiede zwischen laufenden Konfigurationen und Benchmarks zu finden. Es kann auch die Möglichkeit beinhalten, Änderungen programmgesteuert rückgängig zu machen, um Dienste schnell wiederherzustellen. Und wenn Geräte konfiguriert werden müssen, um das Problem zu beheben, muss das NOC sicher sein, dass sie die Situation nicht verschlimmern. Dies bedeutet, dass ein optimiertes NOC einen Validierungsmechanismus benötigt, um Änderungen zu testen, bevor sie implementiert werden.

Ultraschall NetBrain Löst diese Probleme

Verlassen Sie sich stark auf Automatisierung, NetBrain lässt sich leicht in den Arbeitsablauf eines NOC integrieren, um die Mittel zur Ausführung in jedem der drei Hauptbereiche bereitzustellen.

5. Fehlerbehebung bei fortgeschrittenen Technologien 1Erstens NetBrain bindet Ingenieure nicht an ein paar spezifische Module. Ausführbar Runbooks ermöglichen es Technikern beispielsweise, benutzerdefinierte Logik zu erstellen, die für ganze Gruppen von Geräten bereitgestellt werden kann. Auf diese Weise können Ingenieure benutzerdefinierte Berichte und Warnungen erstellen, um ihre individuellen Anforderungen und für ihre jeweiligen Plattformen zu erfüllen. Für eine durchgängige Sichtbarkeit ist eine einfache Anpassung erforderlich.

Zweitens, obwohl die meisten Unternehmens-NOCs den Wert einer guten Protokollierung zu schätzen wissen, NetBrain geht noch einen Schritt weiter, um Ingenieuren die Möglichkeit zu geben, Benchmarks ihres Netzwerks entweder in geplanten Intervallen oder sogar bei Bedarf zu erstellen.

Ingenieure suchen Optimieren Sie den NOC-Betrieb kann vor und nach einer Änderung, in regelmäßigen Abständen, z. B. jede Woche, zu Zeiten hoher Aktivität oder möglicherweise zu Beginn und am Ende einer Schicht, einen Benchmark erstellen. Dies ist eine unglaubliche Möglichkeit für ein NOC, Netzwerkänderungen zu verfolgen.

NetBrain gibt allen Teammitgliedern, die an einem Vorfall arbeiten, einfachen Zugriff auf dieselben Informationen in Echtzeit. Dynamic Maps und ausführbar Runbooks bieten dem Team die Möglichkeit, sowohl Informationen zu speichern als auch Daten in einem leicht konsumierbaren Format sofort auszutauschen Verbessern Sie die Workflows zur FehlerbehebungUnterstützung beim Aufbau der Zusammenarbeit zwischen Ingenieuren.

Drittens NetBrain ist eine Bereicherung in Verringerung der mittleren Reparaturzeit. Ingenieure sind nicht mehr mitten in einem Ausfall damit beschäftigt, sich bei Geräten anzumelden, nach Diffs zu suchen und Befehle nachzuschlagen; stattdessen der kumulative Effekt von Executable Runbooks, Dynamic Maps und On-Demand-Benchmarks bedeutet, dass technische Teams Probleme schnell finden und lösen sowie neue Konfigurationen effizient testen können. Zum Beispiel, NetBrain automatisiert CLI-Befehle und wählt aussagekräftige Informationen aus der Ausgabe aus, um sie auf einem anzuzeigen Dynamic Map – Letztendlich sparen Sie Stunden bei der Fehlersuche und reduzieren die Gesamtzeit, die ein NOC benötigt, um eine Lösung zu finden.

Zusätzlich Schießen aus der Hüfte mit Befehlszeilentools wie Traceroute sind einschränkend und mühsam zu bedienen. Insbesondere Traceroute kann keine Informationen über Layer-2-Hops liefern – was die Sichtbarkeit stark einschränkt – und der Versuch, ein Netzwerk auf diese Weise abzubilden, kann eher Stunden als Sekunden dauern NetBrain.

Die heutigen IT-Abteilungen von Unternehmen führen keine Missionen zu den Sternen durch, aber sie sind entscheidend für die Aufrechterhaltung eines gesunden Netzwerks. Das bedeutet automatisierte Überwachung, Protokollierung und die Möglichkeit, im Fehlerfall schnell einzugreifen. Vielleicht werden sich Netzwerke eines Tages wirklich selbst heilen, aber bis dahin sind unsere Netzwerkbetriebszentren die Helden, die das Licht am Laufen halten.

Verbunden