Teruggaan

SLA's halen en de bedrijfsresultaten verbeteren

NB auteur by kelly.yue 25-2019-XNUMX

Ik had onlangs een interessant gesprek met een vriend, waarin ik zijn zorgen besprak over het voldoen aan de strenge SLA's die waren opgesteld om te voldoen aan de zakelijke vereisten en de verwachtingen van de CIO. Mijn vriend werkt voor het IT-outsourcingbedrijf dat de netwerkinfrastructuur beheert voor een wereldwijd bedrijf en krijgt te maken met aanzienlijke boetes als SLA's niet worden gehaald. De SLA's vermelden specifieke serviceresponstijden met betrekking tot het accepteren van geopende tickets, het reageren op en het oplossen van netwerkproblemen. Het uitbestede IT-team is ook verantwoordelijk voor het implementeren van infrastructuurupgrades en projecten zonder ongeplande downtime te veroorzaken.

Kan dezelfde oude aanpak voor het oplossen van problemen voldoen aan de huidige SLA's?
SLA's zijn gebaseerd op snelle doorlooptijden die traditionele probleemoplossingstechnieken uitdagen. Terwijl de klok tikt, moeten netwerkingenieurs vaak met een hypothese komen op basis van beperkt bewijs. Ze besteden meestal een aanzienlijke hoeveelheid tijd aan het verzamelen en analyseren van gegevens om te bepalen waar ze moeten beginnen met het oplossen van problemen. Zonder tools die het proces automatiseren en versnellen, is de technicus vaak gedwongen om tijdrovende handmatige procedures te gebruiken, zoals inloggen op veel apparaten totdat het probleem kan worden geïsoleerd.

MTTI-afbeeldingHet daadwerkelijk oplossen van een probleem is slechts 20% van het oplossen van problemen. De andere 80% zoekt uit wat de oorzaak van het probleem is.

Dezelfde handmatige procedures en het oplossen van problemen kunnen ook van toepassing zijn op infrastructuurupgrades en projectimplementaties, vooral als er iets misgaat. Het netwerkteam moet niet alleen complexe upgrades testen zonder de noodzakelijke en dure testlaboratoriumapparatuur, maar ze moeten ook de impact begrijpen van voorgestelde wijzigingen en wat er mis kan gaan tijdens de upgrade. De mogelijkheid hebben om verschillende scenario's te doorlopen voorafgaand aan de upgrade of projectimplementatie is van onschatbare waarde.

Verhaal uit de loopgraven: vPC-configuratieproblemen handmatig oplossen
Tijdens mijn gesprek met mijn vriend besprak hij de details van een recent switch-vernieuwingsproject dat ze in hun datacenter hadden geïmplementeerd. Ze implementeerden meerdere racks met nieuwe Cisco Nexus-switches en configureerden virtuele poortkanalen (vPC). Met een vPC kunnen twee links die zijn aangesloten op twee verschillende Nexus-switches als één poortkanaal worden weergegeven op het derde apparaat. Het biedt veel voordelen; sommige omvatten het gebruik van alle beschikbare uplink-bandbreedte, een lusvrije topologie en geen door het spanning tree-protocol geblokkeerde poorten.

Op de avond van de wijzigingsperiode implementeerde het team de ontworpen oplossing, maar had het beperkte mogelijkheden om de oplossing te testen voordat deze in de productieomgeving werd geïmplementeerd. Het ontwerp omvatte het configureren van een ander vPC-domein-ID per paar Nexus 9K-switches, talloze vPC's en het configureren van poortkanalen voor elk paar switches. De implementatie bleek goed te gaan en iedereen ging 's avonds naar huis.

De volgende dag werden ze overspoeld met kaartjes. Dingen die de dag ervoor werkten, werkten niet meer. Ook al wisten ze wat er was veranderd en waar ze hun inspanningen op moesten richten, vanwege de omvang van de veranderingen die de avond ervoor waren aangebracht, waren er zoveel variabelen om naar te kijken.

De hoeveelheid handmatige inspanning die de ingenieurs nodig hadden om de reeks opdrachten voor alle schakelaars uit te voeren, kon uren duren. NetBrain is in staat om de volledige workflow voor het oplossen van problemen te optimaliseren en de taken binnen enkele seconden te voltooien.

Dit was een groot datacenter en er waren veel handmatige probleemoplossing, inloggen op alle nieuwe switches en het uitvoeren van een reeks opdrachten. Ze ontdekten verschillende configuratieproblemen. Eén paar Nexus-switches had niet dezelfde vPC-domein-ID geconfigureerd en een ander paar switches had een type-1 configuratieconsistentieprobleem.

Toon running-config vpc geeft de actieve configuratie weer voor alle virtuele poortkanalen. Toon vpc-briefing geeft beknopte informatie weer over het virtuele poortkanaal, zoals vPC-domein-ID, peer-linkstatus en configuratieconsistentiecontroles. Toon vpc-rol geeft de vPC-rol van de peer-apparaten weer. Toon vpc consistentie-parameters geeft de parameters weer die compatibel moeten zijn met de virtuele poortkanaalinterfaces. Het sleutelwoord globaal kan worden gebruikt om alle type-1 globale parameters aan beide zijden van de peer-link weer te geven. Alle type-1-configuraties moeten aan beide zijden van de vPC-peer-link identiek zijn, anders komt deze niet omhoog. Samenvatting poortkanaal weergeven geeft informatie weer over de poortkanalen.

Problemen met vPC oplossen met automatisering
Vanwege de complexiteit en de omvang van het netwerk zag ik hoe dit bedrijf duidelijk zou kunnen profiteren van het toepassen van automatisering bij zowel probleemoplossing als nieuwe infrastructuurimplementaties. Dit ene vernieuwingsproject vereiste veel handmatige probleemoplossing en inspanning om de veelheid aan problemen te identificeren. NetBrain had kunnen worden gebruikt om naar een laboratoriumomgeving te verwijzen om de impact van de voorgestelde wijzigingen beter te testen en had onvoorziene problemen kunnen identificeren.

NetBrain's automatiseringsplatform biedt ingenieurs end-to-end inzicht in hun omgevingen door het netwerk op intelligente wijze te ontdekken en door het gebruik van Dynamic Maps. Hun runbook technologie versnelt het oplossen van problemen door acties genaamd Qapps uit te voeren om configuratieproblemen op te sporen, en de runbook werkt van a Dynamic Map. De hoeveelheid handmatige inspanning die de ingenieurs nodig hadden om de reeks opdrachten voor alle schakelaars uit te voeren, kon uren duren. NetBrain is in staat om de volledige workflow voor het oplossen van problemen te optimaliseren en de taken binnen enkele seconden te voltooien.

In de onderstaande schermafbeelding ziet u de Dynamic Map van het ontdekte netwerk en de runbook gebruikt om vPC-configuratie-informatie te verzamelen.

Markeer vPC-configuratieA Dynamic Map haalt automatisch de volledige vPC-configuratie binnen enkele seconden op en visualiseert deze.

Hieronder ziet u de resultaten van een van de uitgevoerde CLI-opdrachten en hoe eenvoudig het is om aanvullende CLI-opdrachten toe te voegen die u op alle switches wilt uitvoeren.

CLI ophalenIn plaats van CLI-gegevens één voor één te verzamelen, switch voor switch, kunt u direct automatisch vPC-configuratiegegevens verzamelen.

Hier worden vPC-statusresultaten weergegeven en kunnen andere relevante grafieken worden geopend om aanvullende informatie te bekijken.

kaart met vPC-statusresultatenEn visualiseer de resultaten van geautomatiseerde CLI-commando's in context direct op de kaart - met koppelingen met één klik naar andere relevante gegevens.

Conclusie
SLA's worden met de dag steeds strakker. Als er een netwerkprobleem is dat deze strenge SLA's bedreigt, telt letterlijk elke minuut. Toch wordt het grootste deel van onze tijd voor het oplossen van problemen nog steeds besteed aan het "met de hand" identificeren en isoleren van het probleem. Er bestaat tegenwoordig een automatiseringsoplossing die u een vliegende start geeft bij het oplossen van het probleem, een oplossing die de diepgaande CLI-intelligentie levert die u nodig hebt - alleen in seconden in plaats van uren.

 

Wil je ontdekken hoe NetBrain kan worden gebruikt of toegepast binnen uw infrastructuur? Waarom profiteert u niet van een gratis demonstratie zelf zien? Dus waarom zou u niet beginnen met het besparen van tijd, het elimineren van menselijke fouten en, het allerbelangrijkste, het verminderen van de bedrijfsresultaten?

Bekijk ook deze gerelateerde blogs:

Relevant