by Mark Harris 22-2017-XNUMX
Het is geen nieuws om te zeggen dat mensen niet perfect zijn. Toch vertrouwen veel organisaties op de onrealistische verwachting dat hun IT-teams nooit een fout zullen maken. Volgens het lopende onderzoek van het Uptime Institute loopt IT in feite achter bij het draaiende houden van de systemen en services, met meer storingen die elk van langere duur zijn en een grotere negatieve impact hebben op het bedrijf. En het migreren van uw IT-diensten naar de cloudproviders is NIET de oplossing.
De 2017 Amazon Web Services (AWS) storing is een perfect voorbeeld. Hysterie ontstaat na een grote storing en de druk die op dat moment op de IT-teams wordt uitgeoefend, kan overweldigend zijn om het probleem snel te identificeren en op te lossen. Toch kan zoiets alledaags als een typfout de oorzaak van het probleem zijn. Een simpele menselijke fout, en toch veroorzaakte het wereldwijd chaos in de Fortune 2000.
In het geval van Amazon is dat precies wat er gebeurde toen een technicus probeerde een probleem met zijn factureringssysteem op te lossen:
“Een geautoriseerd S3-teamlid dat een opgesteld draaiboek heeft een opdracht uitgevoerd die bedoeld was om een klein aantal servers te verwijderen voor een van de S3-subsystemen die wordt gebruikt door het S3-factureringsproces. Helaas, een van de ingangen van de opdracht is ingevoerd onjuist en er is een grotere set servers verwijderd dan de bedoeling was.”
Zoals de meeste menselijke fouten, had deze voorkomen kunnen worden, en niet alleen door wat aandachtiger te typen. In feite kunnen alleen wijzigingen worden aangebracht aan individuele apparaten om te beseffen dat de IT-services die deze apparaten doorkruisen onbedoeld zijn aangetast. In de netwerkwereld kan het probleem behoorlijk acuut zijn. Van oudsher vergde netwerkengineering veel handmatig werk, van het verzamelen van gegevens tot het handmatig oplossen van problemen. Handmatig werk, vooral vervelend handmatig werk, leidt vaak tot menselijke fouten. En zelden ondergaan alle applicaties en services die betrokken zijn bij gewijzigde apparaten proactief een kwaliteitscontrole om er zeker van te zijn dat ze volledig operationeel zijn. In het geval van AWS werkte een technicus een bestaand draaiboek door en maakte een simpele typefout, maar de wijziging was misschien gemakkelijk correct aangebracht, maar het had onbedoelde gevolgen voor de IT-services. Het gebeurt de hele tijd.
At NetBrain, hebben we ons volledige Network Problenm DIagnostic Automation System ontworpen om het vervelende en inconsistente handmatige werk te helpen minimaliseren door netwerkautomatisering te implementeren via Executable Runbooks. En door gebruik te maken van ons real-time model van het netwerk en de beoogde verwachte resultaten, kunnen we verifiëren dat de verandering goed is geweest voor het bedrijf.
In plaats van te vertrouwen op traditionele grassroots-inspanningen waarbij kennis vaak op een stuk papier staat of geïsoleerd is voor een team van experts, kunnen netwerkengineers hun bewezen best practice-processen codificeren in uitvoerbare bestanden die gedeeld kunnen worden met collega's en vervolgens met minimale menselijke tussenkomst. De kracht van intent-based automation reikt verder dan het verminderen van fouten. Ze versnellen ook de tijd voor probleemoplossing terwijl de werklast van geavanceerde taken over meerdere teamleden wordt verdeeld. Dit helpt de overmatige afhankelijkheid van tribale kennis te verminderen en bouwt een sterkere cultuur van samenwerking op binnen de netwerk-, beveiligings- en change managementteams. Het is een manier om kennis en ervaring binnen elke organisatie te schalen.
Het digitaliseren van best practices en het automatiseren van de uitvoering ervan is waar het om gaat. Als AWS iets had gebruikt dat lijkt op Executable Runbooks, is het heel goed mogelijk dat de storing is vermeden. In onze wereld kunnen netwerkteams eenvoudig uitvoerbaar maken, uitvoeren en delen Runbooks. En met hen kunnen ze problemen oplossen, netwerktraagheid diagnosticeren, proactief beschermen tegen verkeerde configuratie en meer - allemaal zonder de angst dat de dame met dikke vingers zal zingen.
Leer meer over Uitvoerbaar Runbooks en hoe netwerkengineers kennis kunnen delen, handmatig werk kunnen verminderen en het netwerk kunnen verbeteren.