Zurück

Automatisierung in Minuten: Top-10-Bewertungen zur Vermeidung von Ausfällen

by Valerie Dimartino 11. April 2024

Ausfallzeiten sind teuer. Mehr als die Hälfte (54 %) der Befragten der Rechenzentrumsumfrage 2023 des Uptime Institute geben an, dass ihr jüngster erheblicher, schwerwiegender oder schwerwiegender Ausfall mehr als 100,000 US-Dollar gekostet hat, und 16 % gaben an, dass ihr jüngster Ausfall mehr als 1 Million US-Dollar gekostet hat. 

Der Satz aus dem Film „Apollo 13“ „Misserfolg ist keine Option“ ist einer der bekanntesten Filmslogans aller Zeiten.

NetBrain Ausfallprävention für die Registrierungsseite

Im Netzwerkbetrieb ist es die gleiche Denkweise. Geld und Ruf stehen auf dem Spiel. Scheitern ist keine Option.

Daten des Uptime Institute deuten darauf hin, dass es jedes Jahr weltweit durchschnittlich 10 bis 20 hochkarätige IT-Ausfälle oder Rechenzentrumsereignisse gibt, die schwerwiegende finanzielle Verluste, Geschäfts- und Kundenunterbrechungen, Reputationsverluste und in extremen Fällen den Verlust von Ressourcen verursachen Leben.

Warum sind wir angesichts der vielen integrierten Redundanznetzwerke immer noch so anfällig? Warum verlassen wir uns weiterhin so stark auf manuelle Prozesse und reaktive Fehlerbehebung? Netzwerktechniker verbringen unzählige Stunden damit, die Grundlage für die Bereitstellung von Diensten zu schaffen, doch es gibt kaum oder gar keine regelmäßige Durchsetzung. Erst wenn ein Problem gemeldet wird, werden die Räder der Fehlerbehebung in Gang gesetzt.

Die Antwort ist: dass wir es nicht sind proaktive genug. Dies ist auf einen mangelnden Fokus auf die Netzwerkautomatisierungsbranche zurückzuführen. Wir lassen zu, dass die gleichen Probleme immer wieder auftauchen, wenn wir wissen, wie wir sie lösen können, weil uns einfach die Mechanismen fehlen, um dieses Wissen automatisch in hybriden Netzwerken zu nutzen und anzuwenden.

Ein großer Ausfall führt zu Veränderungen bei Saudi Telecom (stc)

Im Jahr 2021 kam es bei einer kritischen Anwendung bei stc zu einer erheblichen Dienstunterbrechung. Die Fehlerbehebung bei Netzwerkbetrieb, Servern, Anwendungen und Sicherheitsteams dauerte fast einen Monat, um die Ursache zu ermitteln und den Dienst wiederherzustellen. Dieser kostspielige Ausfall verdeutlichte die Notwendigkeit einer besseren Transparenz und eines strategischeren Ansatzes für das Vorfallmanagement. Daher drängte der Group CTO von stc auf eine unternehmensweite Lösung, die durchgängige Transparenz bietet und das Vorfallmanagement über Infrastruktur und Anwendungen hinweg automatisiert.

Stellen Sie sich vor, Sie könnten das Fachwissen Ihrer Ingenieure erfassen und es ohne Programmierung proaktiv in Ihrem gesamten Netzwerk anwenden. Die Netzwerkautomatisierung trägt dazu bei, dass Netzwerkabläufe schneller reagieren können, sie ist jedoch noch nicht weit genug fortgeschritten (Spoiler-Alarm: bis heute), um dieses Wissen proaktiv und auf einfache Weise im gesamten Netzwerk anzuwenden. Was wäre, wenn wir das umfangreiche Wissen unserer Netzwerkingenieure nutzen und für die Nutzung durch eine Automatisierungsplattform speichern könnten?

Jeden Tag Netzwerkbetriebsteams beurteilen Überprüfen Sie das Netzwerk manuell auf Abweichung, Compliance, Zustand und Änderung. Was wäre, wenn Ingenieure diese Bewertungen mithilfe der Automatisierung regelmäßig durchführen könnten?

Verbunden