Teruggaan

Network Operations Center: Mission Control voor een gezond netwerk

by Philip Gervasi 9 november 2017

Met enorme flatscreen-tv's aan de muren waarop verschillende kaarten en knipperende lampjes worden weergegeven, kan een netwerkoperatiecentrum eruitzien als mission control bij NASA. Maar het belangrijkste doel van een netwerkverwerkingscentrum, of NOC, is niet het uitvoeren van een missie naar de maan, maar het onderhouden en optimaliseren van de werking van een netwerkinfrastructuur.

Als u denkt dat dit een brede verklaring is die moet worden uitgewerkt, dan heeft u gelijk. Het idee van gecentraliseerde netwerkbewerkingen kan dubbelzinnig zijn en het doel veelzijdig, dus laten we het opsplitsen in drie gebieden: monitoren, loggen en actie ondernemen.

Monitoren

Monitoring is voor veel NOC's een worsteling. Sommigen voegen een lappendeken van log-aggregators en waarschuwingssystemen samen tot een schijn van een uniforme monitoringoplossing. Dit soort projecten beginnen met veel enthousiasme maar ontrafelen al snel in een zelden gebruikte verzameling platformen die niet met elkaar praten en waar niemand meer op inlogt.

Maar of een netwerkbeheerteam nu een out-of-band tapnetwerk gebruikt of de ingebouwde functionaliteit van hun switches en routers, alarmen en waarschuwingen zijn de levensader van NOC-technici.

Stel je dit scenario eens voor: er is één tool nodig om informatie uit de legacy-switches te halen, maar die tool werkt niet met de nieuwe datacenter-switches. Daarvoor is een ander hulpmiddel nodig. En er is er nog een nodig voor de firewalls omdat ze geen CDP of LLDP ondersteunen.toezicht op meerdere schermen

Het is niet eenvoudig om verschillende uiteenlopende platforms tegelijk te monitoren. Doorgaans zijn ingenieurs verplicht tot voorverpakte software die alle modules bevat waarvan de ontwikkelaars dachten dat hun klanten die nodig hadden. Dit beperkt wat het NOC kan doen en hoe effectief het kan zijn bij het monitoren van een infrastructuur.

Desalniettemin is monitoring wat technici bieden netwerk bewustzijn, of met andere woorden, een duidelijk beeld van wat het netwerk op een bepaald moment aan het doen is.

Logging

Logboeken onthouden alles wat er in het netwerk gebeurt en bieden aanwijzingen voor probleemoplossing en bewijs voor beveiligingsincidenten. Helaas kunnen ze buitengewoon lastig zijn om effectief te gebruiken, waardoor houtkap zowel een vloek als een zegen is voor een typische NOC.

Onderdeel van het gebruik van loggegevens is het creëren benchmarks van de netwerkstatus op zinvolle intervallen. Dit is essentieel voor het bepalen van trends en het in kaart brengen van applicatiestromen. Dit idee duikt op in blogs, whitepapers en best-practice-documenten, maar benchmarks worden zelden gedaan door zelfs de grootste NOC's vanwege de moeilijkheid ervan.

Een e-commercebedrijf kan een ongelooflijke hoeveelheid loggegevens maken en opslaan, maar het kan ook momentopnamen van het netwerk maken tijdens piekmomenten zoals Black Friday, weekends en tijdens promotie-evenementen. Deze informatie geeft netwerktechnici inzicht in applicatiestromen wanneer het netwerk onder druk staat om de taakverdeling te volgen en knelpunten bloot te leggen.

Het probleem is dat het maken van benchmarks niet eenvoudig is en daardoor wordt verwaarloosd. Het vereist het vastleggen van netwerkgegevens van verschillende platforms tegelijk en in relatie tot elkaar. Door deze gegevens in de loop van de tijd vast te leggen, hebben NOC-technici echter een model waarmee ze kunnen werken en waarmee ze hun netwerkbewustzijn kunnen opbouwen. En als deze informatie direct beschikbaar is voor het hele team, wordt een cultuur van samenwerking bevorderd.

Actie ondernemen

NOC's houden netwerken in de gaten om afwijkende activiteiten op te sporen en actie te ondernemen. Ze monitoren de gezondheid en beveiliging van de infrastructuur en ondernemen acties om optimale netwerkprestaties te garanderen, incidenten op te lossen en een transparant netwerk te behouden change management proces.

Als er een melding binnenkomt, reageert het NOC. Er wordt een ticket gemaakt om het incident te volgen, een technicus neemt het eigendom over en het proces van probleemoplossing begint.

Wanneer de bedrijfscontinuïteit wordt aangetast, vereist een NOC een gevoel van urgentie, duidelijke workflows en geoptimaliseerde operaties. Er is geen tijd om in te loggen op willekeurige apparaten en het probleem op te sporen door foto's te maken in het donker.

Automatisering en het delen van informatie is essentieel om het incident zo snel mogelijk te verhelpen.

Gemiddelde tijd om te repareren, of MTTR, is de gemiddelde tijd die nodig is om een ​​incident op te lossen. Een geoptimaliseerd NOC zal automatisering gebruiken om te verminderen MTTR om de bedrijfscontinuïteit zo snel mogelijk te herstellen.

Dit kan het uitvoeren van een script omvatten om configuratieverschillen te vinden tussen lopende configuraties en benchmarks. Het kan ook de mogelijkheid bevatten om wijzigingen programmatisch ongedaan te maken om services snel te herstellen. En als apparaten moeten worden geconfigureerd om het probleem op te lossen, moet het NOC erop kunnen vertrouwen dat ze de zaken niet erger maken. Dit betekent dat een geoptimaliseerd NOC een validatiemechanisme nodig heeft om wijzigingen te testen voordat ze worden geïmplementeerd.

Hoe NetBrain Lost deze problemen op

Sterk leunend op automatisering, NetBrain kan gemakkelijk worden geïntegreerd in de workflow van een NOC om de middelen te bieden om uit te voeren in elk van de drie hoofdgebieden.

5. Problemen met geavanceerde technologieën oplossen 1Eerste, NetBrain vergrendelt ingenieurs niet in een paar specifieke modules. Uitvoerbaar Runbooks stellen technici bijvoorbeeld in staat om aangepaste logica te creëren die kan worden ingezet voor hele groepen apparaten. Op deze manier kunnen technici aangepaste rapportage en waarschuwingen maken om aan hun unieke behoeften en voor hun specifieke platforms te voldoen. Eenvoudig maatwerk is nodig voor end-to-end zichtbaarheid.

Ten tweede, hoewel de meeste zakelijke NOC's de waarde van goede logging waarderen, NetBrain gaat een stap verder door engineers de mogelijkheid te geven om benchmarks van hun netwerk te creëren, hetzij op geplande intervallen of zelfs op aanvraag.

Ingenieurs op zoek naar NOC-operaties optimaliseren kan voor en na een wijziging een Benchmark maken, met regelmatige tussenpozen zoals wekelijks, tijdens piekmomenten, of eventueel aan het begin en einde van een dienst. Dit is een ongelooflijke manier voor een NOC om netwerkveranderingen bij te houden.

NetBrain geeft iedereen in het team die aan een incident werkt eenvoudig toegang tot dezelfde informatie in realtime. Dynamic Maps en uitvoerbaar Runbooks bieden het team de mogelijkheid om zowel informatie te herdenken als direct gegevens te delen in een gemakkelijk te consumeren formaat Verbeter werkstromen voor het oplossen van problemenhelpen om samenwerking tussen ingenieurs op te bouwen.

Ten derde, NetBrain is een aanwinst in verkorting van de gemiddelde reparatietijd. Technici zitten niet langer midden in een storing om in te loggen op apparaten die zoeken naar diffs en commando's opzoeken; in plaats daarvan het cumulatieve effect van uitvoerbaar Runbooks, Dynamic Maps en on-demand Benchmarks betekent dat technische teams problemen snel kunnen vinden en oplossen, en nieuwe configuraties efficiënt kunnen testen. Bijvoorbeeld, NetBrain automatiseert CLI-opdrachten en selecteert zinvolle informatie uit de uitvoer om weer te geven op een Dynamic Map — bespaart uiteindelijk uren aan probleemoplossing en verkort de totale tijd die een NOC nodig heeft om een ​​oplossing te vinden.

Daarnaast schiet je vanuit de heup mee opdrachtregelprogramma's zoals traceroute zijn beperkend en omslachtig in gebruik. Met name Traceroute kan geen informatie geven over laag 2-hops — wat de zichtbaarheid ernstig beperkt — en het op deze manier proberen een netwerk in kaart te brengen kan uren in plaats van seconden duren met NetBrain.

De hedendaagse IT-afdelingen van ondernemingen voeren geen missies naar de sterren uit, maar zijn van cruciaal belang voor het onderhouden van een gezond netwerk. Dit betekent geautomatiseerde monitoring, logging en de mogelijkheid om snel actie te ondernemen in geval van storing. Misschien zullen netwerken op een dag echt zelfherstellend zijn, maar tot die tijd zijn onze netwerkoperatiecentra de helden die het licht aanhouden.

Verwant